情人节来了!程序员应该如何优雅的度过?

山哥在这里 2019-02-13

云栖社区 深度学习 分布式 大数据 程序员 性能

情人节,对于程序员来说只是一个正常加班的周四而已,但如果你正在思索“如何过情人节”的问题,恭喜你!你已经超脱了编程语言,IDE的境界,站在程序员鄙视链的顶端!

那么,程序员如何优雅的过情人节?

0.代码情诗告白来一波

_01

_02

_03
_04
_05
_06
_07
_08

如果你还单身,别人去约会的时候,我们可以这么优雅的过:

1.看看书

2019年开发者必读!20位阿里技术大牛们帮你列了一份经典书单!
10本免费的机器学习和数据科学书籍
机器学习和数据科学领域必读的10本免费书籍
七本书籍带你打下机器学习和数据科学的数学基础
2018年最佳深度学习书单

2.优酷上看看烧脑电影

0000

3.虾米上听听歌,敲代码效率飞起来

以下歌曲为云栖微博开发者粉丝推荐:

1).The Scientist
2).牛仔很忙
3).道家清心诀
4).我的一个道姑朋友
5).万神纪
6).嘀嗒
7).大悲咒
8).小半
9).夜的钢琴曲
10).梦中的婚礼

4.学习编程

编程语言系列讲座免费学:
1).《Python编程基础实战》
2).《Java基础、高级特性入门》
3).《深度学习JavaScript和React技术》
4).《快速上手C++》

5.关注最新的开源项目

2018年末2019年伊始,阿里巴巴发布数个开源项目:

1).深度学习框架 X-Deep Learning

开源时间:2018年12月
项目介绍:
以深度学习为核心的人工智能技术,过去的几年在语音识别、计算机视觉、自然语言处理等领域获得了巨大的成功,其中以GPU为代表的硬件计算力,以及优秀的开源深度学习框架起到了巨大的推动作用。

尽管以TensorFlow、PyTorch、MxNet等为代表的开源框架已经取得了巨大的成功,但是当我们把深度学习技术应用在广告、推荐、搜索等大规模工业级场景时,发现这些框架并不能很好的满足我们的需求。矛盾点在于开源框架大都面向图像、语音等低维连续数据设计,而互联网的众多核心应用场景(如广告/推荐/搜索)往往面对的是高维稀疏离散的异构数据,参数的规模动辄百亿甚至千亿。进一步的,不少产品应用需要大规模深度模型的实时训练与更新,现有开源框架在分布式性能、计算效率、水平扩展能力以及实时系统适配性的等方面往往难以满足工业级生产应用的需求。

X-DeepLearning正是面向这样的场景设计与优化的工业级深度学习框架,经过阿里巴巴广告业务的锤炼,XDL在训练规模和性能、水平扩展能力上都表现出色,同时内置了大量的面向广告/推荐/搜索领域的工业级算法解决方案。

github地址:https://github.com/alibaba/x-deeplearning

更多介绍:

阿里开源首个深度学习框架 X-Deep Learning!

2).自研科学计算引擎Mars

开源时间:2019年1月

项目介绍:

科学计算即数值计算,是指应用计算机处理科学研究和工程技术中所遇到的数学计算问题。比如图像处理、机器学习、深度学习等很多领域都会用到科学计算。有很多语言和库都提供了科学计算工具。这其中,Numpy以其简洁易用的语法和强大的性能成为佼佼者,并以此为基础形成了庞大的技术栈。

11

Numpy的核心概念多维数组是各种上层工具的基础。多维数组也被称为张量,相较于二维表/矩阵,张量具有更强大的表达能力。因此,现在流行的深度学习框架也都广泛的基于张量的数据结构。

12

随着机器学习/深度学习的热潮,张量的概念已逐渐为人所熟知,对张量进行通用计算的规模需求也与日俱增。但现实是如Numpy这样优秀的科学计算库仍旧停留在单机时代,无法突破规模瓶颈。当下流行的分布式计算引擎也并非为科学计算而生,上层接口不匹配导致科学计算任务很难用传统的SQL/MapReduce编写,执行引擎本身没有针对科学计算优化更使得计算效率难以令人满意。

基于以上科学计算现状,由阿里巴巴统一大数据计算平台MaxCompute研发团队,历经1年多研发,打破大数据、科学计算领域边界,完成第一个版本并开源。 Mars,一个基于张量的统一分布式计算框架。使用 Mars 进行科学计算,不仅使得完成大规模科学计算任务从MapReduce实现上千行代码降低到Mars数行代码,更在性能上有大幅提升。目前,Mars 实现了 tensor 的部分,即numpy 分布式化, 实现了 70% 常见的 numpy 接口。后续,在 Mars 0.2 的版本中, 正在将 pandas 分布式化,即将提供完全兼容 pandas 的接口,以构建整个生态。

Mars作为新一代超大规模科学计算引擎,不仅普惠科学计算进入分布式时代,更让大数据进行高效的科学计算成为可能。

github地址:https://github.com/mars-project/mars

更多介绍:

阿里重磅开源首款自研科学计算引擎Mars,揭秘超大规模科学计算
Mars——基于矩阵的统一分布式计算框架
Mars 是什么、能做什么、如何做的——记 Mars 在 PyCon China 2018 上的分享
Mars 如何分布式地执行
Mars 算法实践——人脸识别

3).图深度学习框架Euler

开源时间:2019年1月

项目介绍:

这是国内首个在核心业务大规模应用后开源的图深度学习框架。此次开源,Euler内置了大量的算法供用户直接使用,相关代码已经可在GitHub上进行下载。

图学习和深度学习都是人工智能的一个分支,作为阿里巴巴旗下的大数据营销平台,阿里妈妈创新性地将图学习与深度学习进行结合,推出了Euler,可帮助大幅度提升营销效率。Euler已在阿里妈妈核心业务场景进行了锤炼和验证,同时,在金融、电信、医疗等涉及到复杂网络分析的场景中也具有很高的应用价值。例如,用户可以利用Euler对基于用户交易等金融数据构建的复杂异构图进行学习与推理,进而应用于金融反欺诈等场景。

github地址:https://github.com/alibaba/euler

更多介绍:
Euler 问世!国内首个工业级的图深度学习开源框架,阿里妈妈造

4).分布式事务解决方案 Fescar

开源时间:2019年1月

项目介绍:
阿里是国内最早一批进行应用分布式(微服务化)改造的企业,所以很早就遇到微服务架构下的分布式事务问题。

2014 年,阿里中间件团队发布 TXC(Taobao Transaction Constructor),为集团内应用提供分布式事务服务。

2016 年,TXC 经过产品化改造,以 GTS(Global Transaction Service)的身份登陆阿里云,成为当时业界唯一一款云上分布式事务产品,在阿云里的公有云、专有云解决方案中,开始服务于众多外部客户。

2019 年起,基于 TXC 和 GTS 的技术积累,阿里中间件团队发起了开源项目 Fescar(Fast & EaSy Commit And Rollback, FESCAR),和社区一起建设这个分布式事务解决方案。

TXC/GTS/Fescar 一脉相承,为解决微服务架构下的分布式事务问题交出了一份与众不同的答卷。

github地址: https://github.com/alibaba/fescar

更多介绍:
阿里开源分布式事务解决方案 Fescar 全解析

5).实时计算平台Blink

开源时间:2019年1月
项目介绍:
Blink是一项典型的“传火于薪”开源技术,传承自Flink开源框架,后者最早适用于小流量互联网场景的数据处理。

由于看好实时计算,阿里率先对Flink进行改造,并将Flink的计算能力推向巅峰,推出内部版Blink,将计算延迟降低到人类无法感知的毫秒级:浏览网页的时候,你只是眨了一下眼睛,但在淘宝、天猫处理的信息已经刷新了17亿次。

实时计算到底有多重要?2004年,谷歌开启了离线计算时代,可以针对海量数据进行定时计算,但随着电商、金融等行业的发展对大数据计算提出了新的需求,在金融交易场景里,风控系统如果不能实时观察每一个账户的行为动态,就可能因为1秒的延迟遗漏风险,无法阻断危险交易,造成消费者损失。但实时计算突破了这一技术瓶颈。

现在,阿里巴巴集团的全部核心业务已经用上Blink。除了技术大考双11之外,ET城市大脑实时计算着杭州1300个信号灯路口、4500路视频,保障着交通动脉的通畅;淘宝、天猫每天为数亿用户展现实时的“专属”页面。

未来,这项技术还会被应用到社会的各个场景:工厂设备的物联网设备能实时分析数据、提高生产良品率;物流派送平台能第一时间下单,把商品及时送到消费者手中;导航软件时刻紧随出行轨迹,不再错过转弯口……

github地址:https://github.com/apache/flink/tree/blink

更多介绍:
阿里云重磅开源实时计算平台Blink,挑战计算领域的“珠峰”

祝大家初十情人节快乐!

登录 后评论
下一篇
我是你爱豆
18478人浏览
2019-08-22
相关推荐
2017,我来了
1320人浏览
2017-02-15 09:03:57
致心爱的Linux云酱:
636人浏览
2017-03-14 18:37:40
2
1
1
8133