【干货】Pycon 2017: Python可视化库大全

简介:

看完这张图是不是有点懵?

别着急,我们一起来看看后面的阐述。

python可视化库可以大致分为几类:

  • 基于matplotlib的可视化库
  • 基于JS的可视化库
  • 基于上述两者或其他组合功能的库

基于matplotlib的可视化库

matplotlib是python可视化库的基础。matplotlib库的设计参考了matlab,甚至连名称也是以“mat”开头。

matplotlib库的一些优势:(翻译比较别扭,英文原文也附后)

  • 设计很像Matlab,容易进行转换(Designed like Matlab: switching was easy)
  • 有很多渲染后端(Many rendering backends)
  • 差不多可以绘制任何图(当然需要花费些努力)(Can reproduce just about any plot with a bit of effort)
  • 有长时间良好运行的历史 (Well-tested, standard tool for over a decade)

matplotlib库的一些缺点:

  • 必须要掌握API,且描述较为冗长(API is imperative & often overly berbose)
  • 有时候默认的样式设计比较弱(Sometimes poor stylistic defaults)
  • 对网页以及交互式绘图的支持较弱(Poor support for web/interactive graphs)
  • 数据量大时经常运行较慢(Often slow for large & complicated data)

Matplotlib自2003年发布以来,使用情况还是呈现了良好的趋势:

Matplotlib部分绘图实例如下:

也因此,后续开发者都吸取了matplotlib库的优点,经过对matplotlib库的缺点进行改进,从而衍生出一系列的可视化库。

基于matplotlib的库概览如下:

下面介绍两个重要的基于matplotlib的第三方库:pandas以及seaborn

Pandas

可能我们平时使用pandas时更多的是用来进行数据分析和处理,其实pandas也提供了较为简单的API来进行图形绘制。

我个人一般是用pandas来处理数据,然后结合其他可视化库(如matplotlib,seaborn,bokeh等)来绘图图形。

Pandas部分绘图实例如下:

seaborn

Seaborn是基于matplotlib的Python可视化库。它提供了一个高级别接口用于图形绘制。

Seaborn在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图。

Seaborn部分绘图实例如下:

   

详细信息可在其官方网站查阅:

http://seaborn.pydata.org/

基于JavaScript的可视化库

两个受欢迎度较高的可视化库 bokeh 和 plotly

bokeh

Bokeh (Bokeh.js) 是一个 Python 交互式可视化库,支持现代化Web浏览器,提供非常完美的展示功能。Bokeh 的目标是使用 D3.js样式提供优雅,简洁新颖的图形化风格,同时提供大型数据集的高性能交互功能。Boken 可以快速的创建交互式的绘图,仪表盘和数据应用。

bokeh部分绘图实例如下:

 

详细信息可在其官方网站查阅:

http://bokeh.pydata.org

plotly

Plotly是另一个免费进行数据分析和绘制图表的APP,建立在d3.js上。 Plotly图可下载为SVG,EPS或PNG格式,并简单地导入到Illustrator或者Photoshop中。

跟bokeh类似,也可以制作一些交互式的web图。

plotly部分绘图实例如下:

详细内容可以去官网参考:

https://plot.ly/python/

其他综合类型库

Holoviews

Holoviews能够让用户构建有助于可视化的数据结构,而且它包含丰富的可组合元素库,可以覆盖、嵌套和轻松定位。同时,它还支持快速数据探索。

Holoviews可以和Seaborn、pandas或者bokeh组合使用。

由于笔者还没具体了解过Holoviews的使用功能,这里将英文的描述直接放在下面,以免个人理解不准确而产生误导。

关于Holoviews的效果图,可参考下面动态图,建议观看原视频,效果会好点。

Altair

Altairs起源于D3,但代码编写量要比D3简单。这里有两幅对比的图如下:

用D3绘制的柱状图

用Altairs绘制的柱状图

Altair 是 Python 高级声明式可视化库。Altair 提供一个 Python API 在声明式 manner 中构建静态统计可视化库。

什么是声明式可视化库呢,不管是翻译成中文的名称还是看英文的名称,我都一脸懵圈。幸好,有英文的进一步描述,如下:

总的来说,Altairs让开发者们更专注于数据及他们之间的关系,而不是一些不重要的细节。

最后,再放上这张Python可视化的全景图,对于个人而言,不一定能全部熟悉使用,但是能熟练用好其中的一部分,实际应用于工作及项目中,也就OK了。

 

本文作者:LEMON

来源:51CTO

相关文章
|
1天前
|
JSON Shell 数据格式
第十章 Python常用标准库使用(必会)
第十章 Python常用标准库使用(必会)
|
1天前
|
开发框架 前端开发 数据库
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
|
1天前
|
数据采集 数据可视化 数据处理
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
|
2天前
|
JSON 测试技术 API
Python的Api自动化测试使用HTTP客户端库发送请求
【4月更文挑战第18天】在Python中进行HTTP请求和API自动化测试有多个库可选:1) `requests`是最流行的选择,支持多种请求方法和内置JSON解析;2) `http.client`是标准库的一部分,适合需要低级别控制的用户;3) `urllib`提供URL操作,适用于复杂请求;4) `httpx`拥有类似`requests`的API,提供现代特性和异步支持。根据具体需求选择,如多数情况`requests`已足够。
8 3
Python
19 0
|
2天前
|
JSON 数据格式 索引
python 又一个点运算符操作的字典库:Munch
python 又一个点运算符操作的字典库:Munch
19 0
|
3天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
10 0
|
4天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
14 2
|
4天前
|
算法 Python
请解释Python中的关联规则挖掘以及如何使用Sklearn库实现它。
使用Python的mlxtend库,可以通过Apriori算法进行关联规则挖掘。首先导入TransactionEncoder和apriori等模块,然后准备数据集(如购买行为列表)。对数据集编码并转换后,应用Apriori算法找到频繁项集(设置最小支持度)。最后,生成关联规则并计算置信度(设定最小置信度阈值)。通过调整这些参数可以优化结果。
25 9
|
安全 数据可视化 Python
使用Python可视化并分析数据 大型流行病如何影响金融市场(三)
使用Python可视化并分析数据 大型流行病如何影响金融市场(三)
95 0
使用Python可视化并分析数据 大型流行病如何影响金融市场(三)