• 首页
  • 精品课程
  • 精品案例
  • 精品题库
  • 通识教育
  • 知识锦囊
  • 资讯集锦
    • 新闻资讯
    • 竞赛实践
    • 职业规划
智享数据科学资源平台
    • 登录
    • 注册
  • 登录
  • /
  • 注册
  • 首页
  • 精品课程
  • 精品案例
  • 精品题库
  • 通识教育
  • 知识锦囊
  • 资讯集锦
    • 新闻资讯
    • 竞赛实践
    • 职业规划
Dec
15

什么是雪花模式

雪花模式是星型模式的变种,其中某些维表是规范化的,因而把数据进一步分解到附加的表中。结果,模式图形成类似于雪花的形状。雪花模式和星形模式的主要不同在于,雪花模式的维表可能是规范化形式,以便减少冗余。这种表易于维护,并节省存储空间,因为当维结...
查看详情>>
Dec
15

相关思维

相关思维是比较复杂的统计学数据思维,相关思维包含正相关、负相关、非线性相关、不相关等多种类型,大部分应用在生物学、科学领域。复杂的相关分析需要应用函数,建模才能完成,而现实工作中,大部分应用不到这么深层复杂的程度。大部分应用主要研究A与B之...
查看详情>>
Dec
15

什么是结构化数据

结构化数据,简单来说就是数据库。结合到典型场景中更容易理解,比如企业ERP、财务系统;医疗HIS数据库;教育一卡通;政府行政审批;其他核心数据库等。基本包括高速存储应用需求、数据备份需求、数据共享需求以及数据容灾需求。结构化数据也称作行数据...
查看详情>>
Dec
15

什么是数据集市

数据集市包含企业范围数据的一个子集,对于特定的用户是有用的。其范围限于选定的主题。例如,一个商场的数据集市可能限定其主题为顾客、商品和销售。包括在数据集市中的数据通常是汇总的。通常,数据集市可以在低价格的部门服务器上实现,基于 UNIX 或...
查看详情>>
Dec
15

漏斗思维

这种思维方式已经普及:注册转化、购买流程、销售管道、浏览路径等,太多的分析场景中,能找到这种思维的影子。但是,看上去越是普世越是容易理解的模型,它的应用越得谨慎和小心。在漏斗思维当中,尤其要注意漏斗的长度。漏斗从哪里开始到哪里结束?漏斗的环...
查看详情>>
Dec
15

数据库的类型

目前数据库主要分为两种类型:一、关系数据库关系型数据库,存储的格式可以直观地反映实体间的关系。关系型数据库和常见的表格比较相似,关系型数据库中表与表之间是有很多复杂的关联关系的。 常见的关系型数据库有Mysql,SqlServer等。在轻量...
查看详情>>
Dec
15

什么是虚拟仓库

虚拟仓库是操作数据库上视图的集合。为了有效地处理查询,只有一些可能的汇总视图被物化。虚拟仓库易于建立,但需要操作数据库服务器具有剩余能力。自顶向下开发企业仓库是一种系统的解决方法,并能最大限度地减少集成问题。然而,它费用高,需要长时间开发,...
查看详情>>
Dec
15

矩阵思维

矩阵思维是分类思维的发展,它不再局限于用量化指标来进行分类。许多时候,我们没有数据做为支持,只能通过经验做主管的推断时,是可以把某些重要因素组合成矩阵,大致定义出好坏的方向,然后进行分析。大家可以百度经典的管理分析方法“波士顿矩阵”模型。来...
查看详情>>
Dec
15

什么是数据库

数据库是存放数据的仓库。它的存储空间很大,可以存放百万条、千万条、上亿条数据。但是数据库并不是随意地将数据进行存放,是有一定的规则的,否则查询的效率会很低。当今世界是一个充满着数据的互联网世界,充斥着大量的数据。即这个互联网世界就是数据世界...
查看详情>>
Dec
15

什么是元数据存储

元数据是关于数据的数据。在数据仓库中,元数据是定义仓库对象的数据。对于给定数据仓库的数据名和定义,创建元数据。其它元数据包括对提取数据添加的时间标签、提取数据的源、被数据清理或集成处理添加的字段等。元数据的存储应当包括:1.数据仓库结构的描...
查看详情>>
Dec
15

分类思维

客户分群、产品归类、市场分级、绩效评价...许多事情都需要有分类的思维。主管拍脑袋也可以分类,通过机器学习算法也可以分类,那么许多人就模糊了,到底分类思维怎么应用呢?关键点在于,分类后的事物,需要在核心指标上能拉开距离!也就是说分类后的结果...
查看详情>>
Dec
15

善于提问

提出一个好问题是成功的一半。如果我们想寻求他人的帮助,那么提问前很有必要先做到以下这些事情:1. 弄明白自己遇到的真正问题,梳理清楚2. 尝试上网搜索,尝试查询手册或者去专门的社区查看帖子3. 自己动手尝试过解决问题以下是几个错误的问题示范...
查看详情>>
Dec
15

数据清理之遗漏值

填补遗漏值的方法:1.忽略元组:当类标号缺少时通常这样做(假定挖掘任务涉及分类或描述)。除非元组有多个属性缺少值,否则该方法不是很有效。当每个属性缺少值的百分比很高时,它的性能非常差。2. 人工填写遗漏值:一般地说,该方法很费时,并且当数据...
查看详情>>
Dec
15

Python生成器

在 Python 中,使用了 yield 的函数被称为生成器(generator)。跟普通函数不同的是,生成器是一个返回迭代器的函数,只能用于迭代操作,更简单点理解生成器就是一个迭代器。在调用生成器运行的过程中,每次遇到 yield 时函数...
查看详情>>
Dec
15

善于排查问题

我们每个人都必不可免与「问题/故障」打交道,善于排查问题是个非常有用的技能。来看个例子:小明放学回家,无法进入自家大门于是他打电话给父亲。小明:爸,我进不去家门,门打不开。父亲:怎么打不开?小明:不知道,就是推不开。父亲:锁坏了?还是家里反...
查看详情>>
Dec
15

数据处理之噪音数据

噪音是测量变量的随机错误或偏差,去掉噪音才能让数据整体更平滑,方法如下:1.分箱:分箱方法通过考察“邻居”(即,周围的值)来平滑存储数据的值。存储的值被分布到一些“桶”或箱中。由于分箱方法导致值相邻,因此它进行局部平滑。2.聚类:局外者可以...
查看详情>>
Dec
15

Python迭代器

迭代是Python最强大的功能之一,是访问集合元素的一种方式。迭代器是一个可以记住遍历的位置的对象。迭代器对象从集合的第一个元素开始访问,直到所有的元素被访问完结束。迭代器只能往前不会后退。迭代器有两个基本的方法:iter() 和 next...
查看详情>>
Dec
15

善用检索

浏览器能解决我们百分之八十的常见问题。互联网是规模庞大的信息库,各种类别的信息都可以在上面检索到,学习过程中遇到任何问题,都可以试着自己在网上检索看看。除了直接搜索外,也可以专门去技术博客、技术社区去寻求帮助。检索前你需要做好一件事——把自...
查看详情>>
Dec
15

什么是数据变换

数据变换将数据转换成适合于挖掘的形式。数据变换可能涉及如下内容:平滑:去掉数据中的噪音。这种技术包括分箱、聚类和回归。聚集:对数据进行汇总和聚集。例如,可以聚集日销售数据,计算月和年销售额。通常,这一步用来为多粒度数据分析构造数据方。数据泛...
查看详情>>
Dec
15

import 与 from...import

在 python 用 import 或者 from...import 来导入相应的模块。将整个模块(somemodule)导入,格式为: import somemodule从某个模块中导入某个函数,格式为: from somemodule ...
查看详情>>
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15

热门焦点

1
第五届“智享杯”全国高校经管类实验教学案...
2
公安大数据模型分析,助力警情情报分析,案...
3
重磅会议|高校“人工智能与大数据+会计”...
4
对外经贸蔡欣妮与人大姜付秀等研究中国董事...
5
传统企业数字化转型的价值链重构路径与机理...
6
第五届“智享杯”全国高校经管类实验教学案...

热门标签

华理研究案例 华理教学案例 往届优秀作业 虚拟教研室 数据来源 思维方法 基础入门 面试经验 相关岗位 业界 思政 高校

热门评论

张卉 评论于 和鲸社区
帮我到一个能用数据挖局做回归分析的数据集

编辑推荐

1
“Python财务数据分析与重要应用” ...
2
暑期 · 宁夏|“新文科专业核心课程师资...
3
美国经济学杂志2023最佳论文
4
财经高校第二批国家级一流本科课程认定结果...
5
中国高等教育学会高等财经教育分会重庆地区...
6
第五届中国财经教育论坛召开,强化财经教育...
联系我们
关于我们
联系我们
战略合作
友情链接
中国数据研究所
数据科学空间
智享数据科学实验平台
产品服务
财经一流学科联盟·学科评估
中国高校财经慕课联盟
中国经管实验教学案例平台
北京百智享科技有限公司
课程存档