Dec 15 R语言的功能 R是一套完整的数据处理、计算和制图软件系统。其功能包括:数据存储和处理系统;数组运算工具(其向量、矩阵运算方面功能尤其强大);完整连贯的统计分析工具;优秀的统计制图功能;简便而强大的编程语言:可操纵数据的输入和输出,可实现分支、循环,用户可... 查看详情>>
Dec 15 什么是通用网络爬虫 通用网络爬虫又称全网爬虫(Scalable Web Crawler),爬行对象从一些种子 URL 扩充到整个 Web,主要为门户站点搜索引擎和大型 Web 服务提供商采集数据。 由于商业原因,它们的技术细节很少公布出来。 这类网络爬虫的爬行... 查看详情>>
Dec 15 斐波那契数列 斐波那契数列指的是这样一个数列 0, 1, 1, 2, 3, 5, 8, 13,特别指出:第0项是0,第1项是第一个1。从第三项开始,每一项都等于前两项之和。Python 实现斐波那契数列代码如下:# -*- coding: UTF-8 -... 查看详情>>
Dec 15 R语言的特点 R作为一种统计分析软件,是集统计分析与图形显示于一体的。它可以运行于UNIX,Windows和Macintosh的操作系统上,而且嵌入了一个非常方便实用的帮助系统,相比于其他统计分析软件,R还有以下特点:1.R是自由软件。这意味着它是完全免... 查看详情>>
Dec 15 什么是聚焦网络爬虫 聚焦网络爬虫(Focused Crawler),又称主题网络爬虫(Topical Crawler),是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。 和通用网络爬虫相比,聚焦爬虫只需要爬行与主题相关的页面,极大地节省了硬件和网络资... 查看详情>>
Dec 15 Python判断奇数偶数 以下实例用于判断一个数字是否为奇数或偶数:# Filename : test.py# author by : www.runoob.com# Python 判断奇数偶数# 如果是偶数除于 2 余数为 0# 如果余数为 1 则为奇数 num ... 查看详情>>
Dec 15 Python的应用领域 Python是一种解释型脚本语言,可以应用于以下领域:Web 和 Internet开发科学计算和统计人工智能桌面界面开发软件开发后端开发网络接口:能方便进行系统维护和管理,Linux下标志性语言之一,是很多系统管理员理想的编程工具。图形处理... 查看详情>>
Dec 15 什么是增量式网络爬虫 增量式网络爬虫(Incremental Web Crawler)是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。 和周期性爬行和刷新页面的网络爬虫相比,增量式爬虫... 查看详情>>
Dec 15 Python随机数生成方法 以下实例演示了如何生成一个随机数:实例# -*- coding: UTF-8 -*- # Filename : test.py# author by : www.runoob.com# 生成 0 ~ 9 之间的随机数# 导入 random(... 查看详情>>
Dec 15 Python的特点 优点简单:Python是一种代表简单主义思想的语言。阅读一个良好的Python程序就感觉像是在读英语一样。它使你能够专注于解决问题而不是去搞明白语言本身。易学:Python极其容易上手,因为Python有极其简单的说明文档。速度快:Pyth... 查看详情>>
Dec 15 什么是Deep Web 爬虫 Web 页面按存在方式可以分为表层网页(Surface Web)和深层网页(Deep Web,也称 Invisible Web Pages 或 Hidden Web)。 表层网页是指传统搜索引擎可以索引的页面,以超链接可以到达的静态网页为主... 查看详情>>
Dec 15 Python数字求和 Python数字求和# -*- coding: UTF-8 -*-# Filename : test.py# author by : www.runoob.com # 用户输入数字num1 = input('输入第一个数字:'... 查看详情>>
Dec 15 R语言的发展历程 R是统计领域广泛使用的诞生于1980年左右的S语言的一个分支。可以认为R是S语言的一种实现。而S语言是由AT&T贝尔实验室开发的一种用来进行数据探索、统计分析和作图的解释型语言。最初S语言的实现版本主要是S-PLUS。S-PLUS是... 查看详情>>
Dec 15 什么是网页粒度的分析算法 PageRank和HITS算法是最常见的链接分析算法,两者都是通过对网页间链接度的递归和规范化计算,得到每个网页的重要度评价。PageRank算法虽然考虑了用户访问行为的随机性和Sink网页的存在,但忽略了绝大多数用户访问时带有目的性,即网... 查看详情>>
Dec 15 脚本式编程 将如下代码拷贝至 hello.py文件中:print ("Hello, Python!");通过以下命令执行该脚本:python3 hello.py输出结果为:Hello, Python!在Linux/Unix系统中,你... 查看详情>>
Dec 15 Python语言的发展历程 自从20世纪90年代初Python语言诞生至今,它已被逐渐广泛应用于系统管理任务的处理和Web编程。Python的创始人为荷兰人吉多·范罗苏姆。1989年圣诞节期间,在阿姆斯特丹,Guido为了打发圣诞节的无趣,决心开发一个新的脚本解释程序... 查看详情>>
Dec 15 什么是网站粒度的分析算法 网站粒度的资源发现和管理策略也比网页粒度的更简单有效。网站粒度的爬虫抓取的关键之处在于站点的划分和站点等级(SiteRank)的计算。SiteRank的计算方法与PageRank类似,但是需要对网站之间的链接作一定程度抽象,并在一定的模型下... 查看详情>>
Dec 15 交互式编程 我们可以在命令提示符中输入"Python"命令来启动Python解释器:$ python3执行以上命令后,出现如下窗口信息:$ python3Python 3.4.0 (default, Apr 11 2014, 13:... 查看详情>>
Dec 15 数据科学的发展历程 如今,数据科学可以说是一个十分火爆的领域,我们可以看到数据科学在各行各业都得到了广泛的应用。虽然数据科学在近几年发展得如此迅猛,但是数据科学的核心技术其实早在很久以前就已经提出来了。比如数据挖掘、Hadoop、深度学习、神经网络、数据可视化... 查看详情>>
Dec 15 什么是网页块粒度的分析算法 在一个页面中,往往含有多个指向其他页面的链接,这些链接中只有一部分是指向主题相关网页的,或根据网页的链接锚文本表明其具有较高重要性。但是,在PageRank和HITS算法中,没有对这些链接作区分,因此常常给网页分析带来广告等噪声链接的干扰。... 查看详情>>