数据智能,触手可及!袋鼠云数栈推出 数据科学平台 DTinsight.Science

本文涉及的产品
实时计算 Flink 版,5000CU*H 3个月
简介: 一句话了解DTinsight.ScienceDTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。

一句话了解DTinsight.Science

DTinsight.Science是「可视化建模与交互式代码编写于一体的机器学习作业探索平台」,实现数据接入、可视化实验建模、Notebook编程、模型训练、模型部署、任务运维等开发场景,帮助企业构建算法服务能力,提供高效、安全、稳定的算法运行环境。

使用数栈-数据科学平台DTinsight.Science进行一站式数据探索

划重点!

数栈-数据科学平台 DTinsight.Science是什么:
机器学习作业探索平台

数栈-数据科学平台 DTinsight.Science的产品目标是:
提供专业、可靠、高效的算法建模平台,一站式完成算法建模、模型训练、模型部署等机器学习作业,让数据智能触手可及。

数栈-数据科学平台 DTinsight.Science的客户价值是:
帮助企业构建算法服务能力,让数据智能快速落地,构建数据智能化与业务智能化双向驱动引擎。

数栈-数据科学平台 DTinsight.Science给谁用:
企业的数据科学家和数据分析师们

再深入了解DTinsight.Science

2.1 研发初衷

随着大数据在企业中横向与纵向的深度应用,已经有离线计算、实时计算等大数据产品解决客户常用的计算与运维场景。目前,数据的智能化应用也是更多企业应用、探索的方向,让数据智能驱动业务智能。在这个过程中,怎么让更多的企业快速拥有数据智能化的能力,是数据科学平台思考的方向。

所以今天,数栈推出数据科学平台来构建数据加工后的算法建模能力,为数据科学家数据分析师提供完善易用的开发平台,希望为企业提供更加科学、准确的判断,实现数据的高价值应用。

2.2 产品优势

#兼容主流机器学习与深度学习框架#
TensorFlow MXNet Python Spark

数栈-数据科学平台DTinsight.Science目前支持TensorFlow、MXNet、Python、Spark计算框架,不同的算法任务可选择合适的计算框架,支持多维化开发场景。后续也将支持Pytorch、XGboost等计算框架。

image

#丰富的算法组件库#
你需要的组件,我都会有

数栈-数据科学平台DTinsight.Science封装了多类算法组件,包含数据源/目标、SQL脚本工具、数据预处理、特征工程、统计分析、机器学习、深度学习、预测、评估、文本分析、网络分析等算法组件,充分覆盖算法建模场景。

image
DTinsight.Science具有丰富的算法组件

#可视化实验建模#
可视化、拖拉拽方式进行算法建模

在大数据深度应用的现在,越来越多的人员对数据与业务的智能结合,算法模型搭建充满兴趣。数栈-数据科学平台DTinsight.Science支持可视化实验建模,可将算法组件拖拉拽至画布区域,组成可视化的实验流,可界面化配置组件参数,并可视化查看数据运行结果以及模型结果,简单易上手。

image
DTinsight.Science支持可视化实验建模

#交互式Notebook数据探索#
使用Python自由进行数据探索

除可视化的实验搭建外,数据科学平台同时具备交互式Notebook开发环境,可进行python代码的编写,执行某段语句查看相应结果与运行日志,为数据分析师提供自由的数据探索环境。

image
交互式Notebook自由进行数据探索

#模型离线训练#
周期调度,训练模型参数

算法模型开发完成后,可提交任务进行离线调度,调度引擎根据调度周期进行模型训练,产生新的模型参数与数据。模型训练完成后,可查看评估结果,选取合适的模型参数进行保存应用,或在线部署。

#模型在线部署#
模型在线部署和调用,实时挖掘数据价值

当模型的预测及评估结果达到目标后,可进行模型在线部署,将模型部署至模型服务器上,并生成模型的调用API。部署后,可进行模型的在线调用。

除以上核心功能外,基础的租户隔离、项目创建管理、用户管理、角色管理、数据接入等也是具备的,可一站式完成机器学习作业,欢迎大家体验。

使用DTinsight.Science可以做哪些有意思和有价值的事情?

数栈-数据科学平台DTinsight.Science可帮助企业构建算法服务能力,服务于企业数据的多样化应用场景,驱动业务创新发展。常用的应用场景如下:

精准营销:

基于相关数据进行个性化的商品推荐、视频推荐、旅游商品推荐、广告精准投放等。

关系网络:

分析用户关系网络,进行人群关联,精细化任务画像,扩大营销范围及场景。

库存优化:

分析销售与库存关系,帮助企业智能化进货、退货,合理使用库存控件,并保证健康的供应链关系。

金融风控:

金融领域是算法模型应用比较成熟的领域,应用的场景也很多,比如根据个人信用评估,进行贷款发放的预测,贷款还款的预测,进行风险控制,以及屏蔽羊毛党等营销场景上的使用。

其他:

在不同的行业领域,会有更多的分析场景,如文本分析、图片分类、视频分析等。

截止到今天,袋鼠云企业级一站式数据中台PaaS-数栈具有数据计算引擎、数据开发平台、数据科学平台、数据资产平台、数据服务引擎等5大产品模块,平台覆盖全链路的数据采集、数据分析、数据挖掘、任务运维、数据质量、数据地图、数据模型、数据API开放等场景,充分满足企业建设数据中台过程中的多样复杂需求。

目前,西湖风景名胜区、西溪湿地、山西商务厅、老板电器、中金易云、河南世纪联华、浙江大学、常州旅游商贸职业技术学校、宁波图书馆、京东方、福建票付通、观远数据、东方龙马、佰羚数据等客户和合作伙伴都已经在使用或者参与数栈产品共创。

数栈——企业级—站式数据中台PaaS

数据计算引擎

提升企业数据共享能力,加速释放数据价值

离线计算引擎

基于Apache Spark,计算速度比MapReduce快百倍

实时计算引擎

基于Apache Flink,高吞吐、低延迟、高性能

数据开发平台

一站式大数据开发平台,快速完全数据中台搭建

离线计算开发套件

节省80%数据开发时间,全链路数据处理,兼容开源、商用计算引擎

实时计算开发套件

金融级流式数据处理自研组件,10倍采集性能,Flink引擎源码增强

数据同步引擎FlinkX

分布式多节点并发读写,吞吐量高,支持丰富的数据源

数据科学平台

机器学习作业探索平台
可视化实验搭建,集成多种主流计算框架与丰富的算法组件
交互式Notebook开发,提供自由的算法探索环境
模型离线训练,支持周期调度与任务管理
模型在线部署,支持在线调用模型与更新模型版本

数据资产平台

构建企业数据资产中心,实现数据管理规范化

数据地图

可视化数据资产中心,数据全生命周期可知可管

数据质量

覆盖90%质量校验场景,双表逐行校验保障海量数据一致

数据模型

构建OneData数据模型,快速上手清晰易懂的数据规范

数据服务引擎

提升企业数据共享能力,加速释放数据价值

数据可视化

让数据价值看得见,打造新一代“四有”大屏

分析引擎

百亿数据实现秒级查询多维度,频度复杂分析

数据API

“0代码”API生成,多权限控制保障数据开放安全

相关实践学习
使用CLup和iSCSI共享盘快速体验PolarDB for PostgtreSQL
在Clup云管控平台中快速体验创建与管理在iSCSI共享盘上的PolarDB for PostgtreSQL。
AnalyticDB PostgreSQL 企业智能数据中台:一站式管理数据服务资产
企业在数据仓库之上可构建丰富的数据服务用以支持数据应用及业务场景;ADB PG推出全新企业智能数据平台,用以帮助用户一站式的管理企业数据服务资产,包括创建, 管理,探索, 监控等; 助力企业在现有平台之上快速构建起数据服务资产体系
目录
相关文章
|
6月前
|
机器学习/深度学习 人工智能 算法
亚马逊云科技 云技能孵化营 初识机器学习
亚马逊云科技 云技能孵化营 初识机器学习
|
11月前
|
人工智能 达摩院 自然语言处理
阿里达摩院五年磨一剑,重磅推出AI模型社区,直击“AI应用难”
11月3日,2022云栖大会杭州现场,阿里达摩院联手CCF开源发展委员会共同推出AI模型社区“魔搭”ModelScope,旨在降低AI的应用门槛。达摩院率先向魔搭社区贡献300多个经过验证的优质AI模型,超过1/3为中文模型,全面开源开放,并且把模型变为直接可用的服务。
343 0
|
11月前
|
存储 人工智能 自然语言处理
|
人工智能 Cloud Native 安全
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
「开源人说」第四期——大数据& AI专场在今年云栖大会举办,阿里巴巴开源委员会大数据AI领域副主席王峰和阿里云AI开源项目EasyRec负责人施兴现场分享热门开源项目背后的故事。开源中国创始人&CTO红薯,白鲸开源联合创始人代立冬,浙大博导赵俊博,InfoQ总编辑王一鹏、Apache软件基金会成员李钰等嘉宾圆桌共话,对开源热点及痛点问题展开激烈讨论。
138793 5
「开源人说」|大咖齐聚首,大数据&AI开源话题对碰
|
SQL 人工智能 NoSQL
独家下载 | Cassandra实战指南 探索云计算与AI浪潮下的下一个职业风口
Apache Cassandra是一套开源分布式NoSQL数据库系统。它最初由Facebook开发,用于储存收件箱等简单格式数据,2008年开源后,由于Cassandra良好的可扩展性,被Digg、Twitter等知名Web 2.0网站所采纳,成为了一种流行的分布式结构化数据存储方案。
21488 0
独家下载 | Cassandra实战指南 探索云计算与AI浪潮下的下一个职业风口
|
人工智能 边缘计算 Cloud Native
阿里云新品发布会周刊第82期 丨 重磅!大数据实时分析与决策&当AI遇上展会
12月23日阿里云新品发布会带您了解阿里云实时数仓如何助力企业实时决策;12月25日更有新栏目“云计算情报局”登场展现-当AI遇上展会。更多精彩内容敬请关注阿里云新品发布会!
760 0
阿里云新品发布会周刊第82期 丨 重磅!大数据实时分析与决策&当AI遇上展会
|
存储 人工智能 运维
数智新基石,贾扬清领衔阿里云大数据&AI年度十二大重磅发布!
产业数字化,数字产业化,今天各行各业的绝大多 数经济活动,都和数据的沉淀、分析、服务密不可分。我们亲身体会过从摸着石头过河到体系化建设的整个过程。在云上,我们逐渐简化纷繁复杂的技术架构,回归需求和场景的初心,让大数据与人工智能具备系统化、平台化、模块化的能力,为企业各个发展阶段的需求提 供多样化的支撑,成为企业数据与智能的新基石。
6530 0
|
机器学习/深度学习 算法 决策智能
蚂蚁金服有哪些金融特色的机器学习技术?
在9月27日于杭州云栖小镇召开的云栖大会“金融智能”专场上,人工智能大咖宋乐教授分享了金融特色机器学习在蚂蚁金服的发展与应用。
1523 0
蚂蚁金服有哪些金融特色的机器学习技术?
|
人工智能 SQL 机器学习/深度学习
|
人工智能 达摩院 架构师
阿里开源新一代 AI 算法模型,由达摩院90后科学家研发 | 开发者必读(015期)
最炫的技术新知、最热门的大咖公开课、最有趣的开发者活动、最实用的工具干货,就在《开发者必读》!
1924 0