基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的大数据一站式<em>开发</em>及数据治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
创建 DataWorks项目 背景信息 本实践采用 DataWorks的 Stream Studio进行数据开发,DataWorks大数据一站式 发平台可以和其他的业务流程统一管理,故推荐使用。在上文中,已经通过 CADT开 通了 DataWorks(需开通专业版),还需要创建相关项目:步骤1 登录 DataWorks管理控制台...
来自: 最佳实践 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
音视频低代码开发
音视频低代码开发AUI Kits是基于阿里云视频云提供的aPaaS产品。AUI Kits将各种音视频SDK进行模块化封装,相比直接使用多个SDK对接PaaS服务,具有简单易用的特点。
提供 UI 组件、后台服务提供源码,开放各类标准 API 接口,支持集成方二次开发,可进行品牌标识、视觉风格、业务逻辑的自定义.稳定可靠 海量并发.基于阿里云技术底座和长期音视频实践,为客户提供稳定可靠的服务。秒级时延,千万级并发,卡顿率低于 1%、Crash 率低于十万分之一.数据服务 洞察机会.提供详实的数据服务,例如...
来自: 云产品
SAE-ACK应用双跑最佳实践
SAE-ACK<em>应用</em>双跑最佳实践
场景描述 实现ACK、SAE中部署的应用在东西向和南北向互通,实现SAE-ACK应用双跑。 应用场景 该最佳实践应用于两类场景: l 因为SAE支持更丰富自动扩缩指标(比如QPS,RT,TCP连接数等),所以将相对稳态的应用部署在ACK中,将相对弹性波动大的应用部署在SAE,借助SAE更强大的自动扩缩应对流量洪峰。 l 将K8s架构迁移到Serverless架构时,需要平滑过渡,所以该最佳实践中的双跑架构可以有效帮用户平滑的完成迁移。
SAE-ACK应用双跑最佳实践 业务架构 场景描述 实现ACK、SAE中部署的应用在东西向和南北 向互通,实现SAE-ACK应用双跑。应用场景 该最佳实践应用于两类场景: 因为SAE支持更丰富自动扩缩指标(比如 QPS,RT,TCP连接数等),所以将相对稳 态的应用部署在ACK中,将相对弹性波动 大的应用部署在SAE,借助SAE更强大的 产品列表...
来自: 最佳实践 | 相关产品:容器服务 ACK,Serverless 应用引擎,微服务引擎
NLP自学习平台
阿里云NLP自学习平台是面向算法小白用户的自适应标注、训练和服务平台,支持34种算法能力。仅需标注或上传适量数据,即可通过平台创建算法模型并使用。
开放搜索是基于阿里巴巴自主研发的大规模分布式搜索引擎搭建的一站式智能搜索业务开发平台,目前为包括淘宝、天猫在内的阿里集团核心业务提供搜索服务支持。通过内置各行业的查询语义理解、机器学习排序算法等能力,提供充分开放的引擎能力,助力开发者快速搭建更高性能、更高搜索基线效果的智能搜索服务.【标题】文档与...
来自: 云产品
语音自学习平台
阿里云语音自学习平台提供“开箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,让合作伙伴自主、自助定制出垂直领域语音识别模型
智能语音交互 语音自学习平台 语音自学习平台提供“箱即用”语音识别效果优化能力,支持热词、语言模型等全流程的识别效果优化功能,同时支持CPU与GPU服务计算,让合作伙伴自主、自助定制出垂直领域语音识别模型。通义听悟免费体验火热进行中,体验用大模型做学习笔记、会议记录!免费使用在线咨询产品文档产品功能产品...
来自: 云产品
分布式云容器平台ACK One
阿里云分布式云容器平台ACK One面向混合云、多集群、分布式计算等场景,支持连接您任何地域、基础设施上的K8s集群,提供一致的社区兼容的API,助力管理分布式云资源
适用于使用/尝试使用容器和Kubernetes技术的应用程序开发者,助您从头开始打造属于自己的云原生技能树.阿里云云原生容器工程师(ACP)认证.包含了云原生容器人才所需技能及知识的工程师认证,定义云原生容器领域人才的考量标准,也是阿里巴巴云原生容器产品相关体系认证计划的核心部分.【标题】文档与工具.唐家哲,靖鑫,也树....
来自: 云产品
混合云存储构建VMware虚拟化平台
混合云存储构建VMware虚拟化<em>平台</em>
场景描述 本文以混合云存储阵列SA2600系统为例,介绍如 何在混合云存储环境下部署VMware虚拟化平台, 以及混合云环境下虚拟机的部署、扩容、云备份等功 能演示。 解决问题 1.如何使用混合云存储部署VMware虚拟化平台。 2.存储阵列在混合云环境下的使用,比如虚拟机部 署、扩容、云备份等。 产品列表 1.混合云存储阵列 2.对象存储OSS
兼容POSIX文件接口,可支持数千计算节点共享访问,可 以挂载到弹性计算ECS、神龙裸金属、容器服务ACK、弹性容器ECI、批量计 算BCS、高性能计算EHPC,AI训练PAI等计算业务上提供高性能的共享存储,用户无需修改应用程序,即可无缝迁移业务系统上云。更多信息,请参见 https://www.aliyun.com/product/nas。文档版本:...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,访问控制,混合云存储阵列 Hybrid Cloud
飞天企业版
阿里云飞天企业版是基于阿里云飞天云计算操作系统,为政企客户专属构建的资源和云管完全独立的企业级云平台,阿里云专有云与公共云同根同源,支持私有化部署。
应用平迁上云“CIPU+CDS”支持高性能负载云化,可提供ECS VM/裸金属容器服务,承载客户应用负载。云上数据库替换PolarDB-M实现开源MySQL替代;PolarDB-PG实现去“O”和开源PostgreSQL替换;Oracle RAC on神龙CDS平滑迁移。核心系统云原生改造CIPU+容器实现应用容器化改造,EDAS实现应用托管服务,ARMS实现应用全链路监控。...
来自: 云产品
大模型RAG对话系统部署
大模型RAG对话系统部署
大模型RAG对话系统最佳实践,旨在指引AI开发人员如何有效地结合LLM大语言模型的推理能力和外部知识库检索增强技术,从而显著提升对话系统的性能,使其能更加灵活地返回用户查询的内容。适用于问答、摘要生成和其他依赖外部知识的自然语言处理任务。通过该实践,您可以掌握构建一个大模型RAG对话系统的完整开发链路。
不仅提供云上箱即用 的 Elasticsearch、Logstash、Kibana、Beats在内的 Elastic Stack生态组件,还 与 Elastic官方合作提供免费 X-Pack(白金版高级特性)商业插件,集成了安全、SQL、机器学习、告警、监控等高级特性,被广泛应用于实时日志分析处理、信息 检索、以及数据的多维查询和统计分析等场景。云原生数据仓库 ...
来自: 最佳实践 | 相关产品:Elasticsearch,机器学习PAI-EAS,机器学习平台,云速搭
智能商业分析 Quick BI
瓴羊智能商业分析 Quick BI 是阿里云用户臻选的数据可视化工具,大幅提升数据分析和报表开发效率,一站式满足企业各种场景的数据分析和决策的诉求。
相关产品智能商业分析 Quick BI在线咨询资源集中化管控方案本方案通过开放 API 和开放 webhooks 事件监听的能力实现企业资源的集中化管控,企业平台通过开放 API 接口对报表资源进行查询、删除、发布、下线、移动等操作,同时企业的报表开发者/管理员在 Quick BI 的工作中对作品进行的变更会通过客户的自定义渠道 ...
来自: 云产品
互联网、电商Elasticsearch搜索
互联网、电商Elasticsearch搜索
场景描述 每一个生活在互联网中的用户,每天都在经 历各种各样的“搜索”,查找电商网站商品、 信用卡账单、查电子发票、查附近的餐厅酒 店、查偶像、查交通等等。相对于传统的关 系型数据库,Elasticsearch只需要几毫秒的 时间,即可查询PB级数据并从中找到匹配 信息。利用Elasticsearch高可用性和易用 性,能够快速处理网站、APP丢给它的文本、 数字、日期、IP以及地理数据。 解决问题 1.电商网站商品、订单、物流等搜索 2.保险行业保单查询 3.互联网教育行业课程搜索 4.O2O行业地理位置搜索等 产品列表 云服务器ECS 专有网络VPC 负载均衡SLB 云数据库RDSMySQL版 Dataworks Elasticsearch 数据传输服务DTS
大数据开发治理平台 DataWorks:是一个提供了大数据 OS能力、并以 all in one box的方式提供专业高效、安全可靠的一站式大数据智能云研发平台。同时能满 文档版本:20220121 II 互联网、电商 Elasticsearch搜索最佳实践 前言 足用户对数据治理、质量管理需求,赋予用户对外提供数据服务的能力。更多信 息,请参见 Dataworks...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,数据传输,DataWorks,Elasticsearch
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
 数据糊DLF 3.MaxCompute云原生的弹性资源和EMR集群资源  云原生大数据计算服务MaxCompute 形成互补,两套体系之间进行资源的削峰填谷,不  大数据开发治理平台DataWorks 仅减少作业排队,且降低整体成本。 机器学习PAI  E-MapReduceEMR 最佳实践频道  对象存储OSS http://bp.aliyun.com  日志服务SLS 阿里云...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
MaxCompute湖仓一体方案
MaxCompute湖仓一体方案
场景描述 自建数据湖与云数仓的融合解决方案,将 MaxCompute与自建的Hive集群做数据打 通,通过存储共享,元数据镜像等方式,解 决传统模式下的存储冗余,计算资源弹性能 力弱的痛点。可大幅度增强系统的资源弹 性,解决业务高峰期计算资源不足的问题。 方案优势 1.业务无侵入性:现有业务无需改造。 2.性能优化:MaxCompute在SQL上做 了大量优化与能力沉淀,可提高SQL 运行性能,降低计算成本。 3.灵活管理:元数据实时同步,无需额外 管理数据同步任务。 4.资源弹性:利用MaxCompute计算池 弹性进行海量数据计算。 解决问题 1.增强业务高峰期的资源弹性。 2.优化自建数据湖的数据治理能力。 3.减少跨平台数据处理的存储冗余。 产品列表 专有网络VPC 云服务器ECS 访问控制RAM 运维编排OOS MaxCompute(原ODPS) 云企业网CEN
执行过程如下:文档版本:20220402 22 MaxCompute湖仓一体方案 DataWorks执行 4.DataWorks执行 湖仓一体环境搭建完成之后,Hadoop集群中的元数据 DB直接映射为 MaxCompute 的 Project,可以基于 DataWorks强大的数据开发/管理/治理能力,提供统一的湖仓 体验,降低两套系统的管理成本。步骤1 选择创建的工作空间,点击 ...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云企业网,E-MapReduce,大数据计算服务 MaxCompute,运维编排,云速搭
基于Elasticsearch的订单检索加速最佳实践
基于Elasticsearch的订单检索加速最佳实践
随着企业信息化程度越来越高,核心业务数据存储在传统关系型数据库中不可避免地会遇到一个问题:单表记录不断增多,数据检索速度会变慢,尤其是对中文的模糊查询(建立普通索引完全不起作用)。虽然数据库自身在不断完善,但效果有限且没办法灵活扩展,复杂场景无法应对。 本方案基于阿里云Elasticsearch作为二级索引库,数据集成产品提供Binlog实时订阅,实时解析、增量数据实时更新及二级索引库之间进行数据实时同步,为数据库提供“能力增益”, 不仅能从根本解决主库抗压问题,提升稳定性;同时支持高效率、高性能、高弹性、低成本、多复杂场景的检索加速服务。
更多 信息,请参见:www.aliyun.com/product/bigdata/product/elasticsearch 文档版本:20210517 III 基于 Elasticsearch的订单检索加速最佳实践 前言 DataWorks:DataWorks基于 MaxCompute/EMR/MC-Hologres等大数据计算引 擎,为客户提供专业高效、安全可靠的一站式大数据开发与治理平台,自带阿里巴 巴数据中与数据治理...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,DataWorks,Elasticsearch
块存储EBS
阿里云块存储EBS是为云服务器ECS提供的低时延、持久性、高可靠的块级随机存储,拥有丰富的产品类型,多元的存储特性,适用于自建数据库加速,快照数据保护等场景,ESSD PL3规格最高可提供100万IOPS以及4000MB/S吞吐能力,有效提升存储性能,大大降低成本。
您无需构建、维护和保护自己的密钥管理基础设施,您也无需要更改任何已有的应用程序和运维流程,无需做额外的加解密操作,磁盘加密功能对于您的业务是无感的.实例匹配/共享访问.支持挂载到企业级实例及裸金属服务器上使用,如c6/g6/r6、ebmc6/ebmg6/ebmr6、c5/r5/g5/g5se等.大型OLTP关系数据库.ELK分布式日志搜索.吞吐量:...
来自: 云产品
DTS数据同步集成MaxCompute数仓
DTS数据同步集成MaxCompute数仓
场景描述 本文Step by Step介绍了通过数据传输服务 DTS实现从云数据库RDS到MaxCompute的 数据同步集成,并介绍如何使用DTS和 MaxCompute数仓联合实现数据ETL幂等和数 据生命周期快速回溯。 解决问题 1.实现大数据实时同步集成。 2.实现数据ETL幂等。 3.实现数据生命周期快速回溯。 产品列表 MaxCompute 数据传输服务DTS DataWorks 云数据库RDS MySQL 版
方案架构 方案优势 DTS简便易用,可以通过控制台一键完成同步,也可以通过 Open API批量生成。DTS将 binlog作为大数据同步的手段,能够实现 ETL幂等,大大提高数据仓库的 数据质量。文档版本:20220126(发布日期)1 DTS数据同步集成 MaxCompute数仓 最佳实践概述 针对不规范设计的表,仍然可以通过 binlog的时间来生成创建...
来自: 最佳实践 | 相关产品:专有网络 VPC,云数据库RDS MySQL 版,数据传输,DataWorks,大数据计算服务 MaxCompute
数据库异地灾备
数据库异地灾备
场景描述 适用于不满足于单地域,对数据可靠性 (RPO)和服务可用性(RTO)要求更高 的,希望防范断电、断网等机房故障,抵 御地震、台风等自然灾害,具备异地容灾 备份恢复能力的客户业务场景。 解决问题 1.实时备份,RPO达到秒级 2.表级恢复,故障恢复时间大大缩短 3.长期归档,自动管理备份生命周期 4.异地灾备,构建数据库灾备中心 产品列表 专有网络VPC 云服务器ECS 弹性公网IP(EIP) 负载均衡SLB 云数据库RDSMySQL 数据库备份服务DBS 对象存储服务OSS 数据湖分析服务DLA 数据管理服务DMS 数据传输服务DTS
具有与平台无关的 RESTful API接口,您可以在 任何应用、任何时间、任何地点存储和访问任意类型的数据。详见:https://www.aliyun.com/product/oss DLA:数据湖分析服务(Data Lake Analytics,简称 DLA)。无服务器(Serverless)化的云上交互式查询分析服务。无需 ETL,就可通过此服务在云上通过标准 JDBC 直接对阿里云 ...
来自: 最佳实践 | 相关产品:云数据库RDS MySQL 版,对象存储 OSS,数据管理,数据湖分析,数据库备份DBS,云速搭CADT
室内地图解决方案
室内地图面向室内大型复杂场景的地图需求,例如百货、商超等业态,满足复杂业态下室内地图的产品需求;可以有效的全面支撑场内专柜数字化、IOT设备地图数字化、工程物业地图数字化等能力,实现商场内关于“场”维度的数字化。通过室内地图能力,我们可以将整个商场数字化,可视化,是支撑整个新零售数字化改造的重要支点。
面向应用的二次开发SDK包,轻松实现不同场景的应用开发,实现丰富地图标准化组件及API,接入成本低,满足业务方多样化的定制需求;支持地图主题定制,满足不同行业用户需求.频道页一级标题组件.谢赟辉,靖鑫,也树.谢赟辉,靖鑫,也树.招商信息公开化、透明化、提高招商效率,为业务提供更多商务决策参考数据、提高招商匹配度、...
来自: 解决方案
数据湖-在线学习场景数据分析
数据湖-在线学习场景数据分析
场景描述 本场景以在线教育中一个答题闯关类的应用为 例,使用WebServer来模拟演示这类日志数据 的分析处理。通过Nginx和Pythonflask搭建 WebServer,模拟应用中的关键页面,比如登 录、课程内容等,之后构造若干用户使用的模拟 日志数据,投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。 解决问题 基于数据湖(EMR+OSS)搭建大数据平台。 EMR和OSS使用和配置。 数据统一存储到OSS。 产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC
其数据持久性不低于99.9999999999%(12个 9),服务可用性(或业务连续性)不低于99.995%,OSS具有与平台无关的RESTful API接口,可以在任何应用、任何时间、任何地点存储和访问任意类型的数据,非常 适合作为集中统一的存储平台。阿里云E-MapReduce(ElasticMapReduce,简称EMR),是运行在阿里云平台上 的一种大数据处理...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce
人地关系数据智能解决方案
人地关系数据智能解决方案基于人地关系线下大数据能力,充分挖掘实体商家业务场景,打造行业应用模型,为零售及旅游行业商家提供综合解决方案,降低运营成本,提高管理效率。
阿里云以选址 API+ISV 前端可视化开发服务,为客户打造自有选址平台,提供城市分析、点位分析、竞争分析等功能,从原有数月级选址评估周期缩短至天级,实现精准抢占优质点位目标.成都某购物中心,通过 i-WOW 辅助完成商圈及对标项目重合分析,及时调整会员运营政策,进行客群关注业态及品牌的调整,使业务逻辑全面数字化...
来自: 解决方案
< 1 2 3 4 ... 13 >
共有13页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用