清华大学发布珠算:一个用于生成模型的Python库

简介:

5 月 27-28 日,机器之心主办的第一届全球机器智能峰会(GMIS 2017)将在北京 898 创新空间举行。在峰会第一天下午的「机器学习」主题 Session 上,清华大学副教授朱军将分享解读《珠算:贝叶斯深度学习的 GPU 库(ZhuSuan: a GPU Library for Bayesian Deep Learning)》。近日,清华大学机器学习组已经在 GitHub 上发布了「珠算(ZhuSuan)」这一软件库。机器之心在本文中编译介绍了该项目的介绍文档,如果你想现场聆听对该项目的更详细深入的介绍,可访问 GMIS 官网 gmis.jiqizhixin.com 了解参会方式或点击这里直达购票地址

珠算(ZhuSuan)是一个构建于 TensorFlow 之上的用于生成模型(Generative Model)的 Python 库。和现有的主要为有监督学习任务设计的深度学习库不同,珠算的主要特点是其在很大程度上植根于贝叶斯推理(Bayesian Inference),因此,珠算能支持各种生成模型:既包括传统的分层贝叶斯模型(如话题模型、贝叶斯逻辑回归等),也有最近的深度生成模型(如VAE、GAN等等)。

使用珠算,用户可以享有深度学习的强大拟合能力和多 GPU支持的高效训练,同时,还能通过生成模型对复杂环境进行建模,充分利用无标注数据,并通过严谨的贝叶斯推理处理不确定性。

目前支持的主要推理算法

变分推理和随机变分推理(VI & SVI)

支持多种变分后验:

  • 平均场后验(Mean-field posterior):各因子完全独立的后验

  • 结构化的后验(Structured posterior):隐变量间具有用户指定的依赖关系

支持的变分方法:

  • SGVB:随机梯度变分贝叶斯(Stochastic gradient variational Bayes)

  • IWAE:重要程度加权的目标(Importance weighted objectives)

  • NVIL:具有方差减缩的得分函数估计器(Score function estimator with variance reduction)

  • VIMCO:具有方差减缩的多样本得分函数估计器(Multi-sample score function estimator with variance reduction)

自适应重要程度采样

  • 重新加权的唤醒-睡眠(RWS:Reweighted Wake-sleep):带有用户指定的自适应提议分布

马尔可夫链蒙特卡洛(MCMC)

  • 哈密尔顿蒙特卡洛(HMC):自适应调整步长和质量(mass)

安装

珠算仍处在开发阶段。在第一个稳定版(1.0)发布之前,请从github克隆(clone)这个库并在主目录中运行以下代码:

1
pip install .

这会自动安装珠算及其依赖包。

文档

在线文档地址:http://zhusuan.readthedocs.io/

其中包含三个使用教程(Tutorials)和代码的API文档:

  • 变分自编码器的分步实现

  • ZhuSuan中的基本概念

  • 用于多元回归问题的贝叶斯神经网络

示例

如果你想运行我们提供的示例,你需要安装额外的依赖包。可以通过执行以下代码完成:

1
pip install  ".[examples]"
  • 高斯(Gaussian):HMC

  • Toy 2D Intractable Posterior: SGVB

  • 贝叶斯神经网络:SGVB

  • 变分自编码器(VAE):SGVB、IWAE

  • 卷积 VAE:SGVB

  • 半监督 VAE (Kingma, 2014):SGVB、RWS

  • 深度 Sigmoid 信念网络:RWS、VIMCO

  • Logistic Normal 主题模型:HMC

开发

如果要以「可编辑」或「开发」模式安装珠算,在主目录下运行:

1
pip install  - e .

如果要移除安装,运行:

1
pip uninstall zhusuan

附加的开发用依赖包可通过以下代码安装:

1
pip install  ".[dev]"

1.测试

以下命令可在主目录中运行自动测试:

1
python  - m unittest discover  - v

测试范围:在运行测试之后,为了确保测试范围涵盖开发,请运行

1
coverage report  - - include = "zhusuan/*"

PEP8 代码风格检查:我们遵循 PEP8 Python 代码风格。要进行检查,在主目录中运行

1
pep8 .

2.文档

文档在 docs/ 目录下,是 RestructuredText(.rst)文件。主页为 index.rst。关于 RestructuredText 的教程可参阅:https://pythonhosted.org/an_example_pypi_project/sphinx.html 

API References 是通过 Sphinx 自动生成的。它们在 doc/api/ 目录下,在每次修改代码之后都应该重新生成:

1
make api

在 docs/ 目录下运行以下代码可将文档编译成网页:

1
make html

生成的网页存储在 docs/_build 目录,可以通过浏览器查看。



本文转自 stock0991 51CTO博客,原文链接:http://blog.51cto.com/qing0991/1931713

相关实践学习
基于阿里云DeepGPU实例,用AI画唯美国风少女
本实验基于阿里云DeepGPU实例,使用aiacctorch加速stable-diffusion-webui,用AI画唯美国风少女,可提升性能至高至原性能的2.6倍。
相关文章
|
1天前
|
JSON Shell 数据格式
第十章 Python常用标准库使用(必会)
第十章 Python常用标准库使用(必会)
|
1天前
|
开发框架 前端开发 数据库
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
Python从入门到精通:3.3.2 深入学习Python库和框架:Web开发框架的探索与实践
|
1天前
|
数据采集 数据可视化 数据处理
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
Python从入门到精通的文章3.3.1 深入学习Python库和框架:数据处理与可视化的利器
|
1天前
|
JSON 测试技术 API
Python的Api自动化测试使用HTTP客户端库发送请求
【4月更文挑战第18天】在Python中进行HTTP请求和API自动化测试有多个库可选:1) `requests`是最流行的选择,支持多种请求方法和内置JSON解析;2) `http.client`是标准库的一部分,适合需要低级别控制的用户;3) `urllib`提供URL操作,适用于复杂请求;4) `httpx`拥有类似`requests`的API,提供现代特性和异步支持。根据具体需求选择,如多数情况`requests`已足够。
7 3
Python
17 0
|
2天前
|
JSON 数据格式 索引
python 又一个点运算符操作的字典库:Munch
python 又一个点运算符操作的字典库:Munch
14 0
|
2天前
|
数据挖掘 数据处理 索引
如何使用Python的Pandas库进行数据筛选和过滤?
Pandas是Python数据分析的核心库,提供DataFrame数据结构。基本步骤包括导入库、创建DataFrame及进行数据筛选。示例代码展示了如何通过布尔索引、`query()`和`loc[]`方法筛选`Age`大于19的记录。
10 0
|
3天前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
13 2
|
4天前
|
算法 Python
请解释Python中的关联规则挖掘以及如何使用Sklearn库实现它。
使用Python的mlxtend库,可以通过Apriori算法进行关联规则挖掘。首先导入TransactionEncoder和apriori等模块,然后准备数据集(如购买行为列表)。对数据集编码并转换后,应用Apriori算法找到频繁项集(设置最小支持度)。最后,生成关联规则并计算置信度(设定最小置信度阈值)。通过调整这些参数可以优化结果。
25 9
|
4天前
|
Python
如何使用Python的Pandas库进行数据缺失值处理?
Pandas在Python中提供多种处理缺失值的方法:1) 使用`isnull()`检查;2) `dropna()`删除含缺失值的行或列;3) `fillna()`用常数、前后值填充;4) `interpolate()`进行插值填充。根据需求选择合适的方法处理数据缺失。
38 9

热门文章

最新文章