送你10本机器学习和数据科学必读书

简介: 让一系列免费的机器学习与数据科学书籍开启你的夏日学习之旅吧!

1.Python Data Science Handbook

链接:
https://github.com/jakevdp/PythonDataScienceHandbook
作者:Jake VanderPlas

这本书介绍了在Python中处理数据所需要的基本而重要的库,包括IPython、NumPy、Pandas、Matplotlib、Scikit-Learn和其他相关的包。该书假定读者对Python语言有一定的了解。如果你需要快速入门Python这门语言,可以查看免费的配套项目:

A Whirlwind Tour of Python:
https://github.com/jakevdp/WhirlwindTourOfPython

它会帮助研究员和科学家快速入门Python。

2.Neural Networks and Deep Learning

链接:
http://neuralnetworksanddeeplearning.com/
作者:Michael Nielsen

Neural Networksand Deep Learning是一本在线书籍。这本书会告诉你:

神经网络是一种优美的仿生编程范例,它使得计算机能够通过观测数据进行学习。
度学习是一系列强大的技术, 以帮助实现在神经网络中学习。

神经网络和深度学习目前是图像识别、语言识别和自然语言处理等领域的最佳方案。该书同时也会教你神经网络与深度学习的各种核心概念。

3.Think Bayes

链接:
http://greenteapress.com/wp/think-bayes/
作者:Allen B. Downey

Think Bayes是介绍如何通过编程方法进行贝叶斯统计的书籍。

这本书和其他Think X系列书籍的想法一样,他们认为只要你知道如何编程,那么你就可以通过这项技能来学习其他的课题。

大多数的贝叶斯统计书籍会使用数学符号并且通过微积分一类的数学概念来展现其统计思想。这本书则使用Python代码、离散逼近而非数学、连续数学来解释贝叶斯统计。通过这样的方式,在数学书里的积分,将会转变为求和。许多在概率分布上的操作将会通过简单的循环而实现。

4.Machine Learning & Big Data

链接:
http://www.kareemalkaseer.com/books/ml
作者:Kareem Alkaseer

这本书还没写完,我把它添加到表单,你可以稍后才看[H1] 。这个项目的目的在于平衡软件工程师的理论与实践,使他们能轻松地运行机器学习模型而并不需要过分依赖各种各样的库。大多数时候,模型或技术背后的概念是简单而直观的,但却在大量的细节或者术语中被掩盖了。同时,大多数情况下,现有的库能够解决手头的问题,但是他们却被视作一个黑盒子,通常因他们自身的抽象与架构隐藏了背后的基本概念。这本书将阐释这些基本概念。

5.Statistical Learning with Sparsity:
The Lasso andGeneralizations

链接:
https://web.stanford.edu/~hastie/StatLearnSparsity/
作者:Trevor Hastie,Robert Tibshirani,Martin Wainwright

过去的十年里,计算和信息技术出现了爆炸性增长,同时出现了大量的源自不同领域的数据,例如医疗、生物、金融和市场营销。这本书将在一个通用的概念性框架下来讲解这些领域的重要思想。

6.Statistical inference for data science

链接:
https://leanpub.com/LittleInferenceBook
作者:Brian Caffo

这本书是Coursera数据科学项目(Data Science Specialization)中的统计推断(Statistical Inference)课程配套书籍。但是你并不需要上这门课,因为这本书的大部分内容可以独立使用。这本书其中一个重要的部分是一系列组成Coursera 课程的Youtube视频。这本书的出版诣在提供一个成本低廉的统计推断入门。目标读者是有数学或计算机背景的并且希望在统计和数据科学领域中得以运用的学生。这本书在Github上以markdown文档的形式免费提供。同时也以更便捷的形式(epub,mobi)在LeanPub和零售店提供。

7.Convex Optimization

链接:
http://stanford.edu/~boyd/cvxbook/
作者:Stephen Boyd,Lieven Vandenberghe

这本书是关于凸优化的,即一类数学优化问题,包括最小二乘方和线性规划。众所周知,最小二乘方和线性规划是非常完整的理论,它们有着各式各样的应用,并且可以用数学的方法高效地得出解。这本书的中心即阐述更多的凸优化问题。

8.Natural Language Processing
with Python

链接:
https://www.nltk.org/book/
作者:Steven Bird,Ewan Klein,Edward Loper

这是一本关于自然语言处理的书。“自然语言”指的是人类日常交流使用的语言,例如英语、印度语和葡萄牙语。相较于数学符号、编程语言等人造语言,自然语言在时代变迁中不断进化,很难通过明确的规则来界定。我们这里定义的是广义上的自然语言处理,本书将会介绍计算机对自然语言各种形式的操作。

这本书基于Python语言,并同时提供名叫Natural Language Toolkit的开放资源库。

9.Automate the Boring Stuff
with Python

链接:
https://automatetheboringstuff.com/
作者:Al Sweigart

如果你曾花过数小时时间在文件重命名和更新数百个电子表格数据上,那么你知道这些工作有多么枯燥乏味。但如果你能够让电脑可以帮你做这些呢?

这本书里,你会学习如何使用Python来编辑程序,来代替你做需要花几个小时的事情,并且你不需要有编程基础。当你很纯熟地掌握这些编程基础,你将能够使用Python编程毫不费力地实现许多有用并惊艳的自动化特技。

10.Social Media Mining: An Introduction

链接:
http://dmml.asu.edu/smm/
作者:Reza Zafarani, Mohammad Ali Abbasi and Huan Liu

过去十年中,社交媒体颠覆了个体的交流和行业间的经营方式。个体以史无前例的速度通过在社交媒体上交流、分享和消费内容产生大量数据。理解和分析这类新数据来收集可行的模型成为了交叉领域研究、新型算法和工具开发所面临的新机遇与新挑战。这本书结合了社交媒体,社交网络分析和数据挖掘,帮助学生、从业者、研究员和项目经理快速、清晰地理解社交媒体挖掘的基础和未来的可能性。

原文发布时间为:2018-07-13
本文作者:Matthew Mayo
本文来自云栖社区合作伙伴“数据派THU”,了解相关信息可以关注“数据派THU

相关文章
|
6天前
|
机器学习/深度学习 数据可视化 数据挖掘
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
《Python 简易速速上手小册》第9章:数据科学和机器学习入门(2024 最新版)
18 1
|
2月前
|
机器学习/深度学习 算法 Java
现代数据科学中的机器学习技术发展与应用
本文探讨了现代数据科学领域中机器学习技术的发展和应用。我们介绍了机器学习的基本概念和原理,并探讨了它在前端、后端、Java、Python、C以及数据库等多种技术领域的具体应用。通过深入剖析不同领域的案例研究,我们展示了机器学习在解决实际问题和推动技术创新方面的巨大潜力。最后,我们对未来机器学习技术的发展趋势进行了展望。
|
4月前
|
机器学习/深度学习 算法 数据可视化
Python是数据科学和机器学习
Python是数据科学和机器学习
23 1
|
8月前
|
机器学习/深度学习 PyTorch TensorFlow
7个用于机器学习和数据科学的基本 Python 库
Python是AI社区事实上的编程语言。它很容易学习,一旦你精通,编写程序是轻而易举的。 在很大程度上,由于其开源库,Python用户可以操作数据,原型模型,分析输出以及执行许多其他机器学习和数据科学任务。
138 0
|
8月前
|
机器学习/深度学习 人工智能 数据挖掘
机器学习会取代数据科学吗?
随着技术的不断发展和人工智能在我们日常生活中的使用,许多人担心失业。有些人甚至谈论数据科学正在消亡。许多人说机器学习正在取代数据科学,并指出数据科学是一个过度饱和的领域。随着 ChatGPT 等工具的大量使用及其在编码任务中的使用等等,我们正在质疑数据科学是否正在消亡。
56 0
|
11月前
|
机器学习/深度学习 SQL 人工智能
机器学习,数据科学,人工智能,深度学习和统计有何异同
机器学习,数据科学,人工智能,深度学习和统计有何异同
|
机器学习/深度学习
机器学习数学基础五:数据科学的一些基本分布
每一次尝试都是独立的,因为前一次投掷的结果不能决定或影响当前投掷的结果。只有两个可能的结果并且重复n次的实验叫做项式。二项分布的参数是n和p,其中n是试验的总数,p是每次试验成功的概率。
46 0
机器学习数学基础五:数据科学的一些基本分布
|
机器学习/深度学习 人工智能 分布式计算
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
308 1
数据科学、人工智能与机器学习傻傻分不清楚,看这篇就够了
|
机器学习/深度学习 人工智能 数据可视化
边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵
机器学习算法理论比较枯燥乏味,但有许多有趣且有用的网站,您可以像游戏一样交互式操作,并同时学习机器学习概念、模型和应用知识。以下是 ShowMeAI 为大家整理的18个交互式机器学习网站,学起来!
966 2
边玩边学!交互式可视化图解!快收藏这18个机器学习和数据科学网站!⛵
|
机器学习/深度学习 自然语言处理 算法
图数据科学和机器学习自然语言处理NLP概览
图数据科学和机器学习自然语言处理NLP概览
191 0
图数据科学和机器学习自然语言处理NLP概览

热门文章

最新文章