Dec 15 什么是聚焦网络爬虫 聚焦网络爬虫(Focused Crawler),又称主题网络爬虫(Topical Crawler),是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。 和通用网络爬虫相比,聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资... 查看详情>>
Dec 15 Python判断奇数偶数 以下实例用于判断一个数字是否为奇数或偶数:# Filename : test.py# author by : www.runoob.com# Python 判断奇数偶数# 如果是偶数除于 2 余数为 0# 如果余数为 1 则为奇数 num ... 查看详情>>
Dec 15 Python的应用领域 Python是一种解释型脚本语言,可以应用于以下领域:Web 和 Internet开发科学计算和统计人工智能桌面界面开发软件开发后端开发网络接口:能方便进行系统维护和管理,Linux下标志性语言之一,是很多系统管理员理想的编程工具。图形处理... 查看详情>>
Dec 15 什么是增量式网络爬虫 增量式网络爬虫(Incremental Web Crawler)是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。 和周期性爬行和刷新页面的网络爬虫相比,增量式爬虫... 查看详情>>
Dec 15 Python随机数生成方法 以下实例演示了如何生成一个随机数:实例# -*- coding: UTF-8 -*- # Filename : test.py# author by : www.runoob.com# 生成 0 ~ 9 之间的随机数# 导入 random(... 查看详情>>
Dec 15 Python的特点 优点简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。易学:Python极其容易上手,因为Python有极其简单的说明文档。速度快:Pyth... 查看详情>>
Dec 15 什么是Deep Web 爬虫 Web 页面按存在方式可以分为表层网页(Surface Web)和深层网页(Deep Web,也称 Invisible Web Pages 或 Hidden Web)。 表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主... 查看详情>>
Dec 15 Python数字求和 Python数字求和# -*- coding: UTF-8 -*-# Filename : test.py# author by : www.runoob.com # 用户输入数字num1 = input('输入第一个数字:'... 查看详情>>
Dec 15 R语言的发展历程 R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是... 查看详情>>
Dec 15 什么是网页粒度的分析算法 PageRank和HITS算法是最常见的链接分析算法,两者都是通过对网页间链接度的递归和规范化计算,得到每个网页的重要度评价。PageRank算法虽然考虑了用户访问行为的随机性和Sink网页的存在,但忽略了绝大多数用户访问时带有目的性,即网... 查看详情>>
Dec 15 脚本式编程 将如下代码拷贝至 hello.py文件中:print ("Hello, Python!");通过以下命令执行该脚本:python3 hello.py输出结果为:Hello, Python!在Linux/Unix系统中,你... 查看详情>>
Dec 15 Python语言的发展历程 自从20世纪90年代初Python语言诞生至今,它已被逐渐广泛应用于系统管理任务的处理和Web编程。Python的创始人为荷兰人吉多·范罗苏姆。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序... 查看详情>>
Dec 15 什么是网站粒度的分析算法 网站粒度的资源发现和管理策略也比网页粒度的更简单有效。网站粒度的爬虫抓取的关键之处在于站点的划分和站点等级(SiteRank)的计算。SiteRank的计算方法与PageRank类似,但是需要对网站之间的链接作一定程度抽象,并在一定的模型下... 查看详情>>
Dec 15 交互式编程 我们可以在命令提示符中输入"Python"命令来启动Python解释器:$ python3执行以上命令后,出现如下窗口信息:$ python3Python 3.4.0 (default, Apr 11 2014, 13:... 查看详情>>
Dec 15 数据科学的发展历程 如今,数据科学可以说是一个十分火爆的领域,我们可以看到数据科学在各行各业都得到了广泛的应用。虽然数据科学在近几年发展得如此迅猛,但是数据科学的核心技术其实早在很久以前就已经提出来了。比如数据挖掘、Hadoop、深度学习、神经网络、数据可视化... 查看详情>>
Dec 15 什么是网页块粒度的分析算法 在一个页面中,往往含有多个指向其他页面的链接,这些链接中只有一部分是指向主题相关网页的,或根据网页的链接锚文本表明其具有较高重要性。但是,在PageRank和HITS算法中,没有对这些链接作区分,因此常常给网页分析带来广告等噪声链接的干扰。... 查看详情>>
Dec 15 大数据时代的高校意识形态工作生活化 大数据与高校意识形态工作生活化载体的多样性相契合。进入大数据时代,各种信息相互融合,意识形态传播渠道极大丰富,意识形态工作生活化的载体不断创新。大数据成为传统媒体与新兴媒体融合的助推器,媒体融合发展趋势为创新高校意识形态工作生活化载体提供了... 查看详情>>
Dec 15 什么是云计算 “云”实质上就是一个网络,狭义上讲,云计算就是一种提供资源的网络,使用者可以随时获取“云”上的资源,按需求量使用,并且可以看成是无限扩展的,只要按使用量付费就可以,“云”就像自来水厂一样,我们可以随时接水,并且不限量,按照自己家的用水量,付... 查看详情>>
Dec 15 什么是关系数据库 数据库系统,也称 数据库管理系统(DBMS),由一组内部相关的数据,称作数据库,和一组管理和存取数据的软件程序组成。软件程序涉及如下机制:数据库结构定义,数据存储,并行、共享或分布的数据访问,面对系统瘫痪或未授权的访问,确保数据的一致性和安... 查看详情>>
Dec 15 元宇宙 学术界对元宇宙也有不同界定。北京大学新闻与传播学院陈刚和董浩宇认为,“元宇宙是利用科技手段进行链接与创造的,与现实世界映射与交互的虚拟世界,具备新型社会体系的数字生活空间”。清华大学新闻学院沈阳指出,元宇宙是一个理念和概念;元宇宙仍是一个不... 查看详情>>