数据科学究竟是什么?

【方向】 2018-09-10

大数据 机器学习 数据分析 数据挖掘 aliyun ScreenShot 统计学 数据科学 智能决策 数据工程 统计推断

screenshot

数据科学是一门将数据变得有用的学科。它包含三个重要概念:

  1. 统计
  2. 机器学习
  3. 数据挖掘/分析

数据科学的定义

如果你回顾一下数据科学这个术语的[早期历史](),会发现有两个主题密切相连:

  1. 大数据意味着计算机的使用频率增加。
  2. 统计学家很难将纸张上所写算法用计算机实现。

由此,数据科学得以出现。早先,人们将数据科学家视作会编码的统计学家。如今看来,这种说法并不准确,首先让我们回到数据科学本身。

screenshot
推特给出的定义circa 2014

2003年,《数据科学杂志》曾提出:“所谓的‘数据科学’,指的是那些任何与数据相关的内容”。对此,我表示赞同,现在一切都无法与数据分割。

之后,对数据科学的定义便层出不穷,例如Conway的维恩图,以及Mason和Wiggins的经典观点。

screenshot
Drew Conway对数据科学的定义

维基百科上对数据科学的定义更接近于我给学生讲授的内容:

数据

登录 后评论
下一篇
我是小助手
32715人浏览
2019-07-31
相关推荐
量子究竟是什么?
1236人浏览
2018-05-03 14:54:00
营销,我拿什么来AI你?
767人浏览
2017-10-02 14:03:00
工业互联网究竟是张什么网?
758人浏览
2017-07-06 10:21:00
云存储究竟是什么?
679人浏览
2017-07-06 15:44:00
阴魂不散的童年
480人浏览
2017-12-31 16:04:00
3
4
0
1213