Dec 15 朴素贝叶斯算法的应用 文本分类分类是数据分析和机器学习领域的一个基本问题。文本分类已广泛应用于网络信息过滤、信息检索和信息推荐等多个方面。数据驱动分类器学习一直是近年来的热点,方法很多,比如神经网络、决策树、支持向量机、朴素贝叶斯等。相对于其他精心设计的更复杂的... 查看详情>>
Dec 15 Adaboost是什么 Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。Boosting,也称为增强学习或提升法,是一种重要的集成学习技术,能够将预测精度仅... 查看详情>>
Dec 15 艺恩数据 艺恩数据,围绕语义分析、存储计算、数据挖掘、机器学习等核心技术,构建行业算法模型与标签库。以数据分析产品、平台产品、研究洞察形成解决方案,向影视、视频、广告主等娱乐产业链合作伙伴提供产品服务及精准营销等平台服务。 查看详情>>
Dec 15 Adaboost算法流程 Adaboost算法其实是一个简单的弱分类算法提升过程,这个过程通过不断的训练,可以提高对数据的分类能力。整个过程如下所示:(1)先通过对N个训练样本的学习得到第一个弱分类器;(2)将分错的样本和其他的新数据一起构成一个新的N个的训练样本,... 查看详情>>
Dec 15 World Bank Open Data 世界银行公开数据(World Bank Open Data)收录了世界银行数据库的七千多个指标,用户可以按国家、指标、专题和数据目录进行数据浏览,其中数百个数据可上溯50年。 该数据库可以按以下方式浏览数据: 按国家浏览数据:数据包括人口数... 查看详情>>
Dec 15 Aadboost算法的特点 Aadboost算法系统具有较高的检测速率,且不易出现过适应现象。但是该算法在实现过程中为取得更高的检测精度则需要较大的训练样本集,在每次迭代过程中,训练一个弱分类器则对应该样本集中的每一个样本,每个样本具有很多特征,因此从庞大的特征中训练... 查看详情>>
Dec 15 Kaggle datasets Kaggle是由联合创始人、首席执行官安东尼·高德布卢姆(Anthony Goldbloom)2010年在墨尔本创立的,主要为开发商和数据科学家提供举办机器学习竞赛、托管数据库、编写和分享代码的平台。Kaggle上面有着各种高质量的数据集,... 查看详情>>
Dec 15 什么是线性回归 线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛。其表达形式为y = w'x+e,e为误差服从均值为0的正态分布。回归分析中,只包括一个自变量和一个因变量,且二者的关系可... 查看详情>>
Dec 15 通联量化实验室 通联量化实验室是大数据时代的金融量化平台。提供高质量的金融大数据与高效的云计算系统研究,复杂交易策略亦可轻松程序化构建、回测并模拟。更有获得上亿投资管理资金的成长机会。 查看详情>>
Dec 15 什么是logistic回归 logistic回归又称logistic回归分析,是一种广义的线性回归分析模型,常用于数据挖掘,疾病自动诊断,经济预测等领域。例如,探讨引发疾病的危险因素,并根据危险因素预测疾病发生的概率等。以胃癌病情分析为例,选择两组人群,一组是胃癌组,... 查看详情>>
Dec 15 Tushare大数据开放社区 Tushare Pro通过社区的采集和整理存入数据库经过质量控制后再提供给用户。但Pro依然是个开放的,免费的平台,不带任何商业性质和目的。Tushare运行三年多以来,数据从广度和深度都得到了提升,Pro版正是在此基础上做了更大的改进。数... 查看详情>>
Dec 15 什么是深度学习 深度学习(DL, Deep Learning)是机器学习(ML, Machine Learning)领域中一个新的研究方向,它被引入机器学习使其更接近于最初的目标——人工智能(AI, Artificial Intelligence)。深度学... 查看详情>>
Dec 15 中国经济信息网 中国经济信息网(简称“中经网”)是经原国家计委批准,由国家信息中心联合部委信息中心和省区市信息中心共同建设的全国性经济信息网络,1996年12月3日开通,是互联网上最大的描述和研究中国经济的专业信息资源库和媒体平台。来源网址:https:/... 查看详情>>
Dec 15 深度学习的应用 计算机视觉香港中文大学的多媒体实验室是最早应用深度学习进行计算机视觉研究的华人团队。在世界级人工智能竞赛LFW(大规模人脸识别竞赛)上,该实验室曾力压FaceBook夺得冠军,使得人工智能在该领域的识别能力首次超越真人。语音识别微软研究人员... 查看详情>>
Dec 15 万得信息网 在金融财经数据领域,Wind资讯已建成国内最完整、最准确的以金融证券数据为核心一流的大型金融工程和财经数据仓库,数据内容涵盖股票、基金、债券、外汇、保险、期货、金融衍生品、现货交易、宏观经济、财经新闻等领域,新的信息内容在第一时间进行更新以... 查看详情>>
Dec 15 什么是自编码器 自编码器(autoencoder, AE)是一类在半监督学习和非监督学习中使用的人工神经网络(Artificial Neural Networks, ANNs),其功能是通过将输入信息作为学习目标,对输入信息进行表征学习(represent... 查看详情>>
Dec 15 Gapminder Gapminder 是瑞士Gapminder 基金会开发的一个统计软件,你可以形象地看见用世界银行提供数据绘制的的世界各国各项发展指数。 它用一种新的方法动态地展示了各个国家的历年的各项发展指数,包括了二氧化碳排放量、儿童死亡率、经济增长率... 查看详情>>
Dec 15 什么是受限玻尔兹曼机 受限玻尔兹曼机(英语:restricted Boltzmann machine, RBM)是一种可通过输入数据集学习概率分布的随机生成神经网络。RBM最初由发明者保罗·斯模棱斯基于1986年命名为簧风琴(Harmonium),但直到杰弗里·... 查看详情>>
Dec 15 世界财富与收入数据库 世界财富与收入数据库(WID.world)是一个致力于提供开放的国家内与国家间收入与财富分布历史变化数据的大型数据库。 在过去的15年间,对收入与财富分配不均长期演变研究的新兴趣导致了大量的文献的涌现。来源网址:https://wid.wo... 查看详情>>