基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的大数据一站式开发及<em>数据</em>治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
功能强大:支持 SQL进行实时及离线数据清洗、数据分析数据同步、异构数据 源计算等 Data Lake相关功能,以及各种流式及静态数据源关联查询。安全:原生的多租户系统,以项目进行隔离,所有计算任务在安全沙箱中运行。文档版本:20201020 2 基于 Dataworks的大数据一站式开发及数据治理 前置条件 前置条件 在进行本文操作...
来自: 最佳实践 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
Elasticsearch
阿里云检索分析服务 Elasticsearch 版是100%兼容开源的分布式检索、分析套件。提供ELK等开源全托管的产品服务能力。为结构化/非结构化数据提供低成本、高性能及可靠性的检索、分析平台级产品服务。具备读写分离、存算分离、弹性伸缩、智能化运维、免费的X-Pack高级商业特性等产品特性。
凭借 Elasticsearch 数据分析能力实现海量物流数据的价值挖掘,并使用Kibana进行可视化展现.物流供应链服务类企业.采用 Elasticsearch 订单索引架构,不仅降低了50%的成本,同时达到毫秒级准实时查询,QPS提升近1倍,并保障了数据安全.电商平台服务类企业.日志集中采集、管理,实现超8000个/秒的文档索引能力,为业务分析...
来自: 云产品
SLS多云日志采集、处理及分析
SLS多云日志采集、处理及<em>分析</em>
场景描述 从第三方云平台或线下IDC服务器上采集 日志写入到阿里云日志服务,通过日志服务 进行数据分析,帮助提升运维、运营效率, 建立DT 时代海量日志处理能力。 针对未使用其他日志采集服务的用户,推荐 在他云或线下服务器安装logtail采集并使用 Https安全传输;针对已使用其他日志采集 工具并且已有日志服务需要继续服务的情 况,可以通过Log producer SDK写入日志 服务。 解决问题 1.第三方云平台或线下IDC客户需要使用 阿里云日志服务生态的用户。 2.第三方云平台或线下IDC服务器已有完 整日志采集、处理及分析的用户。 产品列表 E-MapReduce 专有网络VPC 云服务器ECS 日志服务LOG DCDN
SLS多云日志采集、处理及分析 最佳实践 业务架构 场景描述 从第三方云平台或线下 IDC服务器上采集 日志写入到阿里云日志服务,通过日志服 务进行数据分析,帮助提升运维、运营效 率,建立 DT 时代海量日志处理能力。针对未使用其他日志采集服务的用户,推 荐在他云或线下服务器安装 logtail采集并使 用 Https安全传输;针对...
来自: 最佳实践 | 相关产品:云服务器ECS,日志服务(SLS),NAT网关,E-MapReduce,全站加速 DCDN,云速搭CADT
云原生内存数据库Tair
云原生内存数据库Tair是阿里云推出的,基于云原生架构的内存数据库,兼容Redis API,支持内存、持久内存、ESSD三种存储介质,并提供大量扩展型数据结构及企业级能力。
通过Tair扩展型数据结构,您可轻松实现高性能分布式锁、多条件排行榜、滑动窗口、JSON数据存储等功能.大量扩展型数据结构.云原生内存数据库Tair图引擎,经历阿里巴巴集团内丰富的应用场景打磨,以及海量互联网应用场景锤炼,具备行业最佳实践经验,为行业提供多元异构数据的融合、分析、决策引擎。2020年底,图引擎作为国内...
来自: 云产品
云原生多模数据库Lindorm
云原生多模数据库Lindorm提供各规模、多模型的云原生数据库服务。可兼容HBase/Cassandra、OpenTSDB、Solr、SQL、HDFS等多种开源标准接口。支持海量数据的低成本存储处理和弹性按需付费,是互联网、IoT、车联网、广告、社交等场景首选数据库,也是为阿里核心业务提供支撑的数据库之一。
面向海量非结构化数据,具备弹性低成本、HDFS协议兼容的文件存储能力,与多模引擎共享存储,同时支持外部系统直接访问多模引擎的底层文件,适用于大数据分析数据湖等场景,可使用开源HDFS客户端直接访问.深度集成阿里云时空数据库引擎Ganos,具备高效的时空多维索引和空间/时空查询能力,可结合流引擎与计算引擎实现复杂...
来自: 云产品
Function Compute构建高弹性大数据采集系统
Function Compute构建高弹性大<em>数据</em>采集系统
当前互联网很多场景都存在需要将大量的数据信息采集起来然后传输到后端的各类系统服务中,对数据进行处理、分析,形成业务闭环。比如游戏行业中的游戏发行、游戏运营,产互行业中的数字营销,物联网、车联网行业中的硬件、车辆信息上报等等。这些场景普遍存在数据采集量大、数据传输需要稳定且吞吐量大的特点,给整个数据采集传输系统带来很大的挑战。在这个场景中,有三个关键的环节,数据采集、数据传输、数据处理。该最佳实践主要涉
Function Compute构建高弹性大数据采集系统 最佳实践 业务架构 场景描述 当前互联网很多场景都存在需要将大量的数据 信息采集起来然后传输到后端的各类系统服务 中,对数据进行处理、分析,形成业务闭环。比 如游戏行业中的游戏发行、游戏运营,产互行业 中的数字营销,物联网、车联网行业中的硬件、车辆信息上报等等。这些...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,日志服务(SLS),函数计算,消息队列 Kafka 版,云速搭CADT
基于Flink的资讯场景实时数仓
基于Flink的资讯场景实时数仓
场景描述 本实践针对资讯聚合类业务场景,Step by Step介绍 如何搭建实时数仓。 解决问题 1.如何搭建实时数仓。 2.通过实时计算Flink实现实时ETL和数据流。 3.通过实时计算Flink实现实时数据分析。 4.通过实时计算Flink实现事件触发。 产品列表 实时计算 专有网络VPC 云数据库RDSMySQL版 分析型数据库MySQL版 消息队列Kafka 对象存储OSS NAT网关 DataV数据可视化
数据分析包括以下两步:a)通过实时计算 Flink抽取 DWD中对应信息并进行轻度汇总(如部分业务指标 计算),生成 DWS(Data Warehouse Summary,汇总数据层),并将数据存 储到 AnalyticDB for MySQL。b)通过 AnalyticDB for MySQL进行多维数据分析和大屏实时查询。4.业务系统:业务系统通过 DataV数据可视化实现业务指标实时...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,NAT网关,云原生数据仓库AnalyticDB My,云速搭CADT
云数据库MongoDB版
阿里云云数据库MongoDB版是完全兼容MongoDB协议、高度兼容DynamoDB协议的在线文档型数据库服务。支持单节点、双节点、副本集和分片集群四种部署架构,能够满足不同的业务场景需要。
基于JSON文档数据对象模型可以快速支持开发迭代,快速创建发放实例并导入数据支持游戏上线运行.可以通过克隆实例去开新区滚服,分担业务流量对数据库的负载压力,支持更多玩家同时在线参与游戏.可以通过DTS迁移数据库合并到一个实例里,保证游戏氛围/可玩性以及降低资源成本.负载均衡SLB.云服务器ECS.云数据库MongoDB.推荐...
来自: 云产品
云速搭部署SLS实现日志采集处理分析
云速搭部署SLS实现日志采集处理<em>分析</em>
通过云速搭部署ECS+SLS,在ECS上安装logtail收集Nginx应用日志写入SLS。通过日志生成器模拟Nginx日志生成,并通过SLS进行日志分析。
文档版本:20211203 30 云速搭部署 SLS实现日志采集处理分析 Logtail日志采集处理分析 注意:查询分析设置的修改操作只会对新写入的数据生效,如果您需要提前对查询 设置的某些字段分析统计生效,请使用指定字段查询的自定义方式在日志写入到日 志库之前进行开启统计查询。步骤4 再次启动日志发生器和停止日志发生器。...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,日志服务(SLS),云速搭CADT
E-HPC低成本实现量化策略回测
E-HPC低成本实现量化策略回测
在量化交易场景下,量化策略的构建流程一般包括:想法、数据获取、建模、回测、结果分析等,在回测过程中往往需要海量的算力,进行大量数据的分析和处理,如何快速、高效和低成本的进行批量任务的调度,并快速获取结果是量化领域遇到的普遍挑战,这也是云计算能够带给客户的巨大优势。
E-HPC低成本实现量化策略回测 最佳实践 业务架构图 场景描述 在量化交易场景下,量化策略的构建流程一般包 括:想法、数据获取、建模、回测、结果分析等,在回测过程中往往需要海量的算力,进行大量 分析和处理,如何快速、高效和低成本的进 行批量任务的调度,并快速获取结果是量化领域 遇到的普遍挑战,这也是...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,弹性公网IP,文件存储NAS,弹性高性能计算E-HPC,云速搭
云上日志集中审计
云上日志集中审计
场景描述 云上的各类云产品和客户部署的业务系统会产生各类 日志,企业合规及安全运营等都需要在一个地方能 集中的查看和分析日志;目前各云产品日志大部分 都进了sls,但都是产品独立的project,不方便集中 审计;客户的业务系统日志各种形态都有;多云和混 合云的场景,日志也需要能集中审计。 解决问题 1.所有日志集中到SLS一个中心project下。 2.满足等保合规和内部合规需求。 3.满足运维和安全运营需求。 产品列表 日志服务SLS 专有网络VPC 弹性公网IPEIP 负载均衡SLB 云服务器ECS 云数据库RDS 云防火墙CFW
文档版本:20200630(发布日期)34 云上日志集中审计 集中云安全产品日志 步骤3 根据需要,选择配置参数,本实践示例配置:配置项 说明 当前版本 企业版 资产 50台 带宽(互联网防火墙吞吐量)50Mbps 日志分析 是 日志存储容量 4000GB 购买时长 1个月 文档版本:20200630(发布日期)35 云上日志集中审计 集中云安全产品...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,负载均衡 SLB,弹性公网IP,日志服务(SLS)
云上IT治理workshop
云上IT治理workshop
假设您负责假设您负责一家集团公司的IT 基础设施,集团 旗下有多个分公司(如制造分公司和销售分公 司),各分公司有独立的开发、测试以及运维团 队。现在选择阿里云作为合作伙伴,拟达到以下 业务目标: 1. 各个分公司拥有独立的账号,可以购买云资 源,由集团账号统一付费。 2. 集团对各个分公司的账号以及权限拥有管理 权限。 3. 网络资源由独立的平台账号统一规划和创 建,分配给各个公司使用。 4. 集团对分公司账号具有配置管理和操作审计 权限。 5. 各分公司内部独立管理账号权限以及资源。
您 可以将这些行为事件下载或保存到日志服务或 OSS 存储空间,然后进行行为 、安全分析、资源变更行为追踪和行为合规性审计等操作。详见:https://www.aliyun.com/product/actiontrail CADT:是一款为上云应用提供自助式云架构管理的产品,显著地降低应用云上管 理的难度和时间成本。本产品提供丰富的预制应用架构模板...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,访问控制,操作审计,资源管理,配置审计
阿里云DNS
阿里云DNS覆盖了公网权威域名解析、内网域名解析、移动解析以及专有云的域名解析场景。为广大用户提供稳定、安全、快速、智能的域名解析服务,助力网站快速实现域名迁移及网站搭建,企业上云就来阿里云。
企业需求自定义内网域名,并把域名解析到专有网络VPC内的云服务器ECS,负载均衡SLB、云数据库Redis版、对象存储OSS等云资源,实现云资源在VPC内直接通过内网域名互相访问.内网域名解析时,私有域名只能在被与之关联的VPC内进行访问.支持自定义域名托管Zone及各种后缀与子域名,满足企业在构建私有域名DNS系统时的定制化需求...
来自: 云产品
车辆数据安全稳定上云和分析
阿里云物联网平台提供全托管的企业级实例服务,无需自建物联网基础设施即可实现车辆数据的安全稳定上云。
解决问题:数据价值未利用通过对车辆数据的实时和离线分析,挖掘数据潜在价值,进行业务数据分析和预测性维护。相关产品物联网平台物联网无线连接服务云服务器 ECS在线咨询方案优势高可用物联网平台尊享型实例提供双副本容灾保障,具备故障发生时秒级切换能力,SLA 99.99%处于全球领先水平。高安全支持车辆通过X.509证书与...
来自: 解决方案
企业标准版数据分析解决方案
企业标准版数据分析解决方案通过实时数仓+离线数仓的组合方案,实现多源数据采集、集成、计算和展现,满足客户不同维度、不同查询时效性的要求,解决企业客户普遍会遇到的数据分析瓶颈,帮助业务决策,提升销售转化。
本方案无缝对接各类云上数据库和自建数据库,实现多源数据精准实时分析,大幅提升数据分析和报表开发效率,零代码鼠标拖拽式操作交互,让业务人员也能轻松实现海量数据可视化分析.搭建数据分析平台技术门槛高.TB 或 PB 级数据量分析效率较低.多来源、多维度的数据采集、集成和分析难度高.支持关系型数据库、文件存储、...
来自: 解决方案
企业轻量级数据分析解决方案
企业轻量级数据分析解决方案,为用户提供低门槛的数据存储与分析能力。帮助用户快速实现数据赋能,解锁数据运营能力。
通过该方案,为客户带来轻量级的实时数据分析能力,减轻实时数据分析需求带来的负担,帮助用户提升数据分析效能.实时数据分析.实时数据分析.该解决方案通过可兼容 MySQL 语法的数据分析服务,以及可视化 BI 服务,帮助用户构建轻量化、高性能的数据分析能力.企业没有专业团队,数据平台建设难度大.数据分散,经营数据打通...
来自: 解决方案
Spark on ECI大数据分析
Spark on ECI大<em>数据分析</em>
场景描述 方案优势 1.计算引擎弹性扩缩容,兼顾资源弹性与计 算资源成本优化。 2.计算与存储分离架构,结合阿里云原生云 存储产品,海量数据湖优势。 3.Kubernetes原生的调度性能优势,提升在 大规模分析作业时的分析性能优势分。 4.集群资源隔离和按需分配。 解决问题 1.计算资源弹性能力不足,计算资源成本管 控能力欠缺. 2.集群资源调度能力和隔离能力不足。 3.计算与存储无法分离,大数据量分析时出 现数据存储资源瓶颈。 4.Spark submit方式提交分析作业参数支持 有限等缺点。 产品列表 容器服务Kubernetes版(ACK) 弹性容器实例(ECI) 文件存储HDFS 对象存储OSS 专有网络VPC 容器镜像服务ACR
Spark on Kubernetes解决方案的用户 对 Spark大数据分析平台计算资源成本控制考虑的用户 需要有灵活可扩展计算平台资源弹性及管控的用户 名词解释 文件存储 HDFS:阿里云文件存储 HDFS是面向阿里云 ECS实例及容器服务等计 算资源的文件存储服务,允许用户像在 Hadoop分布式文件系统中管理和访问 ,无需对数据分析应用做...
来自: 最佳实践 | 相关产品:专有网络 VPC,对象存储 OSS,容器服务 ACK,弹性容器实例 ECI,文件存储HDFS
互联网电商行业离线大数据分析
互联网电商行业离线大<em>数据分析</em>
电商网站销售数据通过大数据分析后将业务指标数据在大屏幕上展示,如销售指标、客户指标、销售排名、订单地区分布等。大屏上销售数据可视化动态展示,效果震撼,触控大屏支持用户自助查询数据,极大地增强数据的可读性。
互联网电商行业离线大数据分析 最佳实践 业务架构 场景描述 本实践介绍了使用阿里云MaxCompute、数据库(RDS)、DataWorks等产品实现电商网站离线数据 ,分析后的业务指标数据实时在大屏展示。通过完整 的实践Demo为例,提供从电商网站搭建,数据从RDS 同步到MaxCompute、再到DataWorks进行数据分析,最后在大屏上展示...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,DataWorks,大数据计算服务 MaxCompute,DataV数据可视化,API网关,云速搭CADT
基于Flink+ClickHouse构建实时游戏数据分析
基于Flink+ClickHouse构建实时游戏<em>数据分析</em>
在互联网、游戏行业中,常常需要对用户行为日志进行分析,通过数据挖掘,来更好地支持业务运营,比如用户轨迹,热力图,登录行为分析,实时业务大屏等。当业务数据量达到千亿规模时,常常导致分析不实时,平均响应时间长达10分钟,影响业务的正常运营和发展。 本实践介绍如何快速收集海量用户行为数据,实现秒级响应的实时用户行为分析,并通过实时流计算Flink/Blink、云数据库ClickHouse等技术进行深入挖掘和分析,得到用户特征和画像,实现个性化系统推荐服务。 通过云数据库ClickHouse替换原有Presto数仓,对比开源Presto性能提升20倍。 利用云数据库ClickHouse极致分析性能,千亿级数据分析从10分钟缩短到30秒。 云数据库ClickHouse批量写入效率高,支持业务高峰每小时230亿的用户数据写入。 云数据库ClickHouse开箱即用,免运维,全球多Region部署,快速支持新游戏开服。 Flink+ClickHouse+QuickBI
步骤4 配置仪表盘,单击更新按钮,生成分析图表,默认为线图,我们可以通过高级配置选 文档版本:20201224 70 基于 Flink+ClickHouse构建实时游戏数据分析 数据可视化 择适合的图形表示。步骤5 配置仪表盘,保持仪表板,修改名字为用户行为分析,选择位置,然后单击确认。文档版本:20201224 71 基于 Flink+ClickHouse构建...
来自: 最佳实践 | 相关产品:云服务器ECS,弹性公网IP,实时计算,Quick BI,消息队列 Kafka 版,云数据库 ClickHouse
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测
基于湖仓一体架构使用MaxCompute对OSS湖<em>数据分析</em>预测
本篇最佳实践先创建EMR集群作为数据湖对象,Hive元数据存储在DLF,外表数据存储在OSS。然后使用阿里云数据仓库MaxCompute以创建外部项目的方式与存储在DLF的元数据库映射打通,实现元数据统一。最后通过一个毒蘑菇的训练和预测demo,演示云数仓MaxCompute如何对于存储在EMR数据湖的数据进行加工处理以达到业务预期。
基于湖仓一体架构使用MaxCompute对OSS湖数据分析预测实践 业务架构 场景描述 数据湖和数据仓库是当前大数据技术条件下构建分布式系 统的两种数据架构设计取向,数据湖偏向灵活性,数据仓 库侧重成本、性能、安全、治理等企业级特性。但是数据 湖和数据仓库的边界正在慢慢模糊,数据湖自身的治理能 力、数据仓库延伸到外部...
来自: 最佳实践 | 相关产品:对象存储 OSS,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,API网关,数据湖构建,云速搭
< 1 2 3 >
共有3页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用