Dec 15 如何创建range序列 创建range序列range(stop)range(start, stop[,step])生成一个不可变序列: In [1]: range(11)Out[1]: range(0, 11)In [2]: range(0,11,1)Out[2]... 查看详情>>
Dec 15 什么是星型模型 星型模式是多维的数据关系,它由事实表(Fact Table)和维表(Dimension Table)组成。每个维表中都会有一个维作为主键,所有这些维的主键结合成事实表的主键。事实表的非主键属性称为事实,它们一般都是数值或其他可以进行计算的数... 查看详情>>
Dec 15 聚合迭代器 创建一个聚合了来自每个可迭代对象中的元素的迭代器: In [1]: x = [3,2,1]In [2]: y = [4,5,6]In [3]: list(zip(y,x))Out[3]: [(4, 3), (5, 2), (6, 1)]In... 查看详情>>
Dec 15 什么是雪花模型 雪花模型是当有一个或多个维表没有直接连接到事实表上,而是通过其他维表连接到事实表上时,其图解就像多个雪花连接在一起,故称雪花模型。雪花模型是对星型模型的扩展。来源网址:https://baike.baidu.com/item/%E9%9B%... 查看详情>>
Dec 15 对象序列化 对象序列化,是指将内存中的对象转化为可存储或传输的过程。很多场景,直接一个类对象,传输不方便。但是,当对象序列化后,就会更加方便,因为约定俗成的,接口间的调用或者发起的 web 请求,一般使用 json 串传输。实际使用中,一般对类对象序列... 查看详情>>
Dec 15 什么是联机分析处理 联机分析处理OLAP是一种软件技术,它使分析人员能够迅速、一致、交互地从各个方面观察信息,以达到深入理解数据的目的。它具有FASMI(Fast Analysis of Shared Multidimensional Information)... 查看详情>>
Dec 15 类方法 classmethod 装饰器对应的函数不需要实例化,不需要 self 参数,但第一个参数需要是表示自身类的 cls 参数,可以来调用类的属性,类的方法,实例化对象等。 []: class (): ...: (self,id... 查看详情>>
Dec 15 什么是位图索引 位图索引指的是位图索引(bitmap index)技术,是一类特殊的数据库索引技术,其索引使用bit数组(或称bitmap、bit set、bit string、bit vector)进行存储与计算操作。来源网址:https://baike... 查看详情>>
Dec 15 伯努利分布(离散型) 伯努利分布并不考虑先验概率 P(X),它是单个二值随机变量的分布。它由单个参数φ∈ [0, 1] 控制,φ 给出了随机变量等于 1 的概率。我们使用二元交叉熵函数实现二元分类,它的形式与对伯努利分布取负对数是一致的。 查看详情>>
Dec 15 什么是内存数据库 内存数据库,顾名思义就是将数据放在内存中直接操作的数据库。相对于磁盘,内存的数据读写速度要高出几个数量级,将数据保存在内存中相比从磁盘上访问能够极大地提高应用的性能。来源网址:https://baike.baidu.com/item/%E5... 查看详情>>
Dec 15 什么是数据分片 数据分片是指分布式数据库中的数据可以被复制在网络场地的各个物理数据库中。数据分片是通过关系代数的基本运算实现的。来源网址:https://baike.baidu.com/item/%E6%95%B0%E6%8D%AE%E5%88%86%E7... 查看详情>>
Dec 15 Multi-Bernoulli 分布 Multi-Bernoulli 分布又称为范畴分布(Categorical distribution),它的类别超过 2,交叉熵的形式与该分布的负对数形式是一致的。 查看详情>>
Dec 15 Teradata是什么 Teradata天睿公司(纽交所代码:TDC),是美国前十大上市软件公司之一。经过逾40 年的发展,Teradata天睿公司已经成为全球最大的专注于大数据分析、数据仓库和整合营销管理解决方案的供应商之一。数量庞大、增长迅猛、种类多样的数据已... 查看详情>>
Dec 15 SAP HANA是什么 SAP HANA是一款支持企业预置型部署和云部署模式的内存计算平台,提供高性能的数据查询功能,用户可以直接对大量实时业务数据进行查询和分析,而不需要对业务数据进行建模、聚合等。SAP内存数据库的数据并不是只在内存里,也会不停写到硬盘里,这就... 查看详情>>
Dec 15 Beta 分布(连续型) 贝塔分布(Beta Distribution) 是一个作为伯努利分布和二项式分布的共轭先验分布的密度函数,它指一组定义在 (0,1) 区间的连续概率分布。均匀分布是 Beta 分布的一个特例,即在 alpha=1、 beta=1 的分布。 查看详情>>
Dec 15 MonetDB是什么 MonetDB是一个开源的面向列的数据库管理系统。MonetDB被设计用来为较大规模数据(如几百万行和数百列的数据库表)提供高性能查询的支持。目前,该数据库系统已经被成功使用于对数据读取有高性能要求的应用,如数据挖掘、联机分析处理、文本检索... 查看详情>>
Dec 15 狄利克雷分布(连续型) 狄利克雷分布(Dirichlet distribution)是一类在实数域以正单纯形(standard simplex)为支撑集(support)的高维连续概率分布,是 Beta 分布在高维情形的推广。在贝叶斯推断中,狄利克雷分布作为多项式... 查看详情>>
Dec 15 Impala是什么 Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然... 查看详情>>