基于DataWorks的大数据一站式开发及数据治理
基于DataWorks的<em>大数据</em>一站式开发及<em>数据</em>治理
概述 基于Dataworks做大数据一站式开发,包含数据实时采集到kafka通过实时计算对数据进行ETL写入HDFS,使用Hive进行数据分析。通过Dataworks进行数据治理,数据地图查看数据信息和血缘关系,数据质量监控异常和报警。 适用场景  日志采集、处理及分析  日志使用Flink实时写入HDFS  日志数据实时ETL  日志HIVE分析  基于dataworks一站式开发  数据治理 方案优势  大数据一站式开发,完善的数据治理能力。  性能优越:高吞吐,高扩展性。  安全稳定:Exactly-Once,故障自动恢复,资源隔离。  简单易用:SQL语言,在线开发,全面支持UDX。  功能强大:支持SQL进行实时及离线数据清洗、数据分析、数据同步、异构数据源计算等Data Lake相关功能 ,以及各种流式及静态数据源关联查询。
自定义 HDFS Sink.47 文档版本:20201020 IV 基于 Dataworks的大数据一站式开发及数据治理 最佳实践概述 最佳实践概述 概述 本实践基于 Dataworks做大数据一站式开发,包含数据实时采集到 kafka通过实时 数据进行 ETL写入 HDFS,使用 Hive进行数据分析。通过 Dataworks进行数据 治理,数据地图查看数据信息和血缘关系...
来自: 最佳实践 相关产品:块存储,云服务器ECS,E-MapReduce,DataWorks,实时计算,云速搭
数据集成 Data Integration
阿里云数据集成 Data Integration是跨异构数据、低成本、弹性扩展的数据采集同步平台,为DataX的商业版,支持ETL,支持50+数据源跨网络离线(全量/增量)同步。
数据集成支持在数据抽取过程中进行简单的数据转换操作(如日期解析、数据过滤等),导入到大数据处理中心,利用大数据引擎强大的计算能力可以再进行更复杂的数据转换操作.支持阿里云经典网络、专有网络(VPC)环境下的数据同步以及本地IDC网络环境下的数据集成.支持多种异构数据源.数据集成支持数据的批量(离线)同步,和...
来自: 云产品
利用低成本链路完成业务数据迁移上云
利用低成本链路完成业务<em>数据</em>迁移上云
场景描述 随着云计算被越来越多的客户所接受,除业务系 统上云外,很多客户已经把业务数据搬迁上云。 业务数据量一般都比较大,迁移上云需要大量的 网络带宽,BGP费用比较高。阿里云对用户开 放所需地域购买静态单线共享带宽包的权限(移 动/联通/电信均可),可用为迁移数据有效降低 成本。 解决问题 1.业务数据上云网络成本高 产品列表 专有网络VPC 云服务器ECS 网络存储NAS 共享带宽包
4 文档版本:20191230 利用低成本链路完成业务数据迁移上云 配置云上环境 地域 华东2(上海)可用区B 实例  架构:x86计算  分类:通用型  通用网络增强型sn2ne ecs.sn2ne.large(2vCPU,8GiB) 购买实例数量:1台 镜像 公共镜像 CentOS 7.664位 存储  系统盘 高效云盘40GiB  数据盘 高效云盘20GiB(根据实际数据...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,文件存储NAS
云原生数据仓库AnalyticDB PostgreSQL版
阿里云MPP架构的云原生数据仓库,可提供PB级海量数据在线/离线分析服务,是面向各行各业的有竞争力的数仓方案,真正做到“人人可用的数据分析服务”。
全部节点主备高可用模式,自动监控恢复,保证服务高可.GIS 时空大数据分析.GIS 时空大数据分析.内置支持空间数据库引擎PostGIS和强大的Ganos时空引擎,可以实现实时的定位及路径规划,以及对空间/时空数据进行高效的存储、索引、查询和分析计算。用户只需在应用程序中使用简单的SQL,配合GIS函数操作,即可处理复杂的空间...
来自: 云产品
企业上云数据安全
企业上云<em>数据</em>安全
场景描述 企业是否选择上公共云,或者哪些系统或数据上 公共云,对数据安全的关心是重要因素之一。本 最佳实践重点在于介绍狭义的数据加密存储安 全范畴,即首先使用SDDP产品进行敏感数据发 现和分级分类,然后对高级别敏感数据进行按 需、不同类型的全链路加密存储。 解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别SDDP 密钥管理服务KMS 云数据库RDS 对象存储OSS
本最佳实践重点在于介绍狭义的数据加密 存储安全范畴,即首先使用 SDDP产品进行敏 感数据发现和分级分类,然后对高级别敏感 进行按需、不同类型的全链路加密存储。解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密 产品列表 敏感数据识别 SDDP 密钥...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,对象存储 OSS,密钥管理服务,敏感数据保护,云速搭CADT
基于弹性计算的AI推理
基于弹性<em>计算</em>的AI推理
场景描述 本方案适用于使用GPU进行AI在线推理的场 景。在推理之前,模型已经训练完成。例如,刷脸 支付中,我们在刷脸的时候,就是推理的一个过 程。再比如图像分类,目标检测,语音识别,语 义分析等返回结果的过程。 解决问题 使用GPU云服务器搭建推理环境 使用容器服务Kubernetes版构建推理 环境 使用NAS存储模型数据 使用飞天AI加速推理工具加速推理 产品列表 GPU云服务器 容器服务Kubernetes版 NAS共享存储
ᅳ.meta文件是 MetaGraphDef序列化的二进制文件,保存了网络结构相关的 ,包括 graph_def和 saver_def等。ᅳ.index文件为数据文件提供索引,存储的核心内容是以 tensor name为键以 BundleEntry为值的表格 entries,BundleEntry主要内容是权值的类型、形状、偏移、校验和等信息。ᅳ.data文件保存所有变量的值,即网络...
来自: 最佳实践 | 相关产品:云服务器ECS,文件存储NAS,容器服务 ACK
跨链数据可信连接服务
跨链数据连接服务 ODATS 是利用蚂蚁区块链领先技术实现的跨链数据连接服务。通过制定标准化的区块链UDAG全栈跨链协议,保证跨链交易的安全性、可扩展性及可靠性,打破区块链数据孤岛,实现同构及异构链之间的可信互通,助力企业之间可信协作,促进产业生态可信融合。
基于多方安全计算、可信执行环境、联邦学习等技术,解决企业数据协同计算过程中的数据安全和隐私保护问题,实现数据可用不可见。经过5年多打磨和规模商业化应用,广泛应用于联合营销、联合风控、政务数据开放、联合科研等领域.标题-copy-copy-copy.唐家哲,靖鑫,也树.跨链数据连接服务产品介绍.跨链数据连接服务开通和购买...
来自: 云产品
超级计算集群实现自然语言处理训练
超级<em>计算</em>集群实现自然语言处理训练
场景描述 本方案适用于自然语言训练场景,使用神龙 GPU云服务器(SCCGN6)+CPFS进行NLP的 训练,采用Bert模型。这里不使用容器,直接 使用裸机进行NLP的Bert训练,使用飞天AI加 速训练工具可以有效提升多机多卡的训练效率。 解决问题 使用神龙GPU云服务器搭建NLP训练环 境 使用SCC的RDMA网络 使用CPFS存储训练数据 使用飞天AI加速训练工具加速训练 产品列表 神龙GPU云服务器(SCCGN6) SCC超级计算集群 CPFS共享存储
 超级计算集群(SuperComputingCluster,SCC)使用高速RDMA网络互联的 CPU以及GPU等异构加速设备,面向高性能计算、人工智能/机器学习、科学/工程计算数据分析、音视频处理等应用,提供极致计算性能和并行效率的计算 集群服务。更多信息,请参见超级计算集群https://cn.aliyun.com/product/scc。 CPFS...
来自: 最佳实践 | 相关产品:文件存储NAS,超级计算集群
交通数据中台解决方案
阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力,帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务,助力交通行业数字化转型及智能应用的创新和推广。
阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力,帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务,助力交通行业数字化转型及智能应用的创新和推广.谢赟辉,靖鑫,也树.交通数据中台解决方案总体介绍.本方案充分汇聚交通行业中各类结构化、非结构化等多源异构数据,打通数据...
来自: 解决方案
跨链数据连接服务解决方案
利用蚂蚁区块链领先技术实现的跨链数据连接服务 Open Data Access Trusted Service(ODATS)。通过制定标准化的区块链UDAG全栈跨链协议,保证跨链交易的安全性、可扩展性及可靠性,打破区块链数据孤岛,实现同构及异构链之间的可信互通,助力企业之间可信协作,促进产业生态可信融合。
支持TEE、零知识证明等可验证隐私计算,完成对区块链数据的存在性认证,生成认证证明,保障链上数据隐私,降低跨链认证的复杂度,提高通讯效率.便捷接入、高效协同.可视化控制台快速注册区块链,便捷的授权流程保护链上数据隐私,标准通用的跨链合约,支持各类跨链场景信任可信传递.谢赟辉,靖鑫,也树.跨链数据链接服务架构....
来自: 解决方案
电商网站数据埋点及分析
电商网站<em>数据</em>埋点及分析
场景描述 数据埋点是数据产品经理、数据运营以及数据分 析师,基于业务需求(例如:CPC点击付费广 告中统计每一个广告位的点击次数),产品需求 (例如:推荐系统中推荐商品的曝光次数以及点 击的人数)对用户行为的每一个事件对应的位置 进行开发埋点,并通过SDK上报埋点的数据结 果,记录数据汇总后进行分析,推动产品优化或 指导运营。 解决问题 1.电商网站广告位效果统计分析 2.电网网站推荐商品曝光、点击、购买等行为统 计分析 3.电商网站用户分布分析 4.电商网站页面热点图分析等 产品列表 日志服务SLS Dataworks 云服务器ECS 云数据库RDS版 负载均衡SLB 专有网络VPC
文档版本:20220127 XVI 电商网站数据埋点及分析 电商网站数据埋点 步骤3 找到 customer_entity这张表(即用户表),执行 SQL操作,发现当前仅一条示例数据(如果有数据可以先删除,再执行数据生成)。文档版本:20220127 XVII 电商网站数据埋点及分析 电商网站数据埋点 步骤4 执行数据生成,构建假数据。文档版本:...
来自: 最佳实践 | 相关产品:云服务器ECS,云数据库RDS MySQL 版,日志服务(SLS),DataWorks,云速搭CADT
智能商业分析 Quick BI
瓴羊智能商业分析 Quick BI 是阿里云用户臻选的数据可视化工具,大幅提升数据分析和报表开发效率,一站式满足企业各种场景的数据分析和决策的诉求。
2024-01-12大数据计算 MaxCompute 这个表 可以给 Quick BI 使用吗?确实,MaxCompute 项目的数据可以被接入到阿里云的 Quick BI 中。利用这种能力,您可以对海量数据进行实时在线分析服务,同时支持拖拽式操作和丰富的可视化效果,使数据分析、业务数据探查、报表制作等工作变得轻松自如。在具体的操作过程中,您需要先确保...
来自: 云产品
机场视频监控
机场视频监控
场景描述 该最佳实践适用于国内机场的视频监控行业,将线下视频文件通过混合云阵列缓存后,通过专线上传到阿里云OSS上。 也适用于其他混合云场景中,利用阵列缓存文件,并通过网络传输到阿里云OSS上的场景。 解决问题 1.通过混合云阵列+专线将线下文件传到阿 里云OSS上 2.通过阿里云OSS跨区域复制功能实现异 地文件备份 3.通过OSS的自动生命周期管理功能实现 文件生命周期管理 产品列表 OSS对象存储 混合云阵列 高速通道(专线)
(注意,这里需要阵列的数据通道的IP 能够ping这个地址。 点击“应用”按钮,完成设置。1 2 10 企业上云实践 机场视频监控最佳实践 3 4 1.2.3.添加DNS 在设置首页面,点击访问,进入如下页面, 点击网络服务  点击DNS 点击添加DNS服务器  11 企业上云实践 机场视频监控最佳实践 1 2 3 进入如下页面, 填写DNS的...
来自: 最佳实践 | 相关产品:对象存储 OSS,高速通道,混合云存储阵列 Hybrid Cloud
云原生数据库
PolarDB是阿里云自研的云原生数据库,在存储计算分离架构下,利用了软硬件结合的优势,为用户提供秒级弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL和PostgreSQL生态,支持分布式扩展,高度兼容Oracle语法。
基于PolarDB 分布式版存储海量数据,通过AnalyticDB进行数据分析,可构建智能化的城市公交系统,满足路线规划、站点查询、公交预报、业务报表结算、公交调度等需求,提升运营效率和服务水平.PolarDB 分布式版采用分层架构可确保在并发、计算数据存储三个方面均可线性扩展,可根据业务潮汐特点灵活升降配PolarDB 分布式版...
来自: 云产品
基于MaxCompute的大数据BI分析
基于MaxCompute的<em>大数据</em>BI分析
场景描述 本文以电商行业为例,将业务数据和日志数据使用 MaxCompute做ETL之后,同步到ADB进行实时 分析,之后通过QuickBI进行快速可视化展示。 解决问题 1.互联网行业、电商、游戏行业等网站、App、 小程序应用内BI分析场景。 2.可扩展到各类网站BI分析场景使用。 产品列表 1.MaxCompute 2.分析型数据MySQL版 3.日志服务SLS 4.QuickBI 5.云服务器ECS 6.RDSMySQL版
文档版本:20211213 1 基于 MaxCompute的大数据 BI分析 最佳实践概述 方案优势 以 Hologres+QuickBI快速实时数据分析的核心能力为切入点,将客户的业务 、日志数据引导至阿里云的日志服务和分析性数据库。融合阿里云的日志服务 SLS 的生态,增强用户体验(如无缝对接 Flink、Elasticsearch、RDS、Hologres、EMR、dataV ...
来自: 最佳实践 | 相关产品:日志服务(SLS),大数据计算服务 MaxCompute,云原生数据仓库AnalyticDB My,Quick BI,云速搭CADT
基于Flink的资讯场景实时数仓
基于Flink的资讯场景实时数仓
场景描述 本实践针对资讯聚合类业务场景,Step by Step介绍 如何搭建实时数仓。 解决问题 1.如何搭建实时数仓。 2.通过实时计算Flink实现实时ETL和数据流。 3.通过实时计算Flink实现实时数据分析。 4.通过实时计算Flink实现事件触发。 产品列表 实时计算 专有网络VPC 云数据库RDSMySQL版 分析型数据库MySQL版 消息队列Kafka 对象存储OSS NAT网关 DataV数据可视化
架构层面:ᅳ 离线数仓一般 hive等进行数据计算和存储。ᅳ 实时数仓一般 Flink进行数据处理,OLAP等系统进行数据存储及分析。1.2.实时数仓技术架构 实时数仓的构建,从原始数据到最终业务系统,数据需要经过采集、加工、分析、挖 掘等步骤。与传统离线数仓的构建相似,中间会涉及数据 ETL,数仓的建模,数据多 文档版本...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,NAT网关,云原生数据仓库AnalyticDB My,云速搭CADT
基因分析平台
阿里云基因分析平台可以提供端到端的基因计算PaaS服务。支持GA4GH行业标准,集成生信分析应用,大幅优化成本效率,快速处理海量基因数据。
微基因针对规模基因数据和表型数据,开发了WePheno联合分析平台,利用阿里云基因计算能力,每天处理百个任务,随时更新报告.通用客户案例单logo.唐家哲,靖鑫,也树.通用客户案例单logo.产品动态时间线组件.唐家哲,靖鑫,也树.云数据库RDS MySQL版.MySQL 是全球最受欢迎的开源数据库之一,作为开源软件组合 LAMP中的重要一...
来自: 云产品
基于Elasticsearch的订单检索加速最佳实践
基于Elasticsearch的订单检索加速最佳实践
随着企业信息化程度越来越高,核心业务数据存储在传统关系型数据库中不可避免地会遇到一个问题:单表记录不断增多,数据检索速度会变慢,尤其是对中文的模糊查询(建立普通索引完全不起作用)。虽然数据库自身在不断完善,但效果有限且没办法灵活扩展,复杂场景无法应对。 本方案基于阿里云Elasticsearch作为二级索引库,数据集成产品提供Binlog实时订阅,实时解析、增量数据实时更新及二级索引库之间进行数据实时同步,为数据库提供“能力增益”, 不仅能从根本解决主库抗压问题,提升稳定性;同时支持高效率、高性能、高弹性、低成本、多复杂场景的检索加速服务。
步骤11 回到 rds的 dms界面中,对表 trading_order插入数据,再到 Elasticsearch中查看 。(dms登录方式本可查看文档章节 2.4创建 rds订单表”。在上图 dms中使用 insert into语句插入一条数据到 trading_order表中:insert into trading_order(order_amount,source_type,consignee_ada,order_type,company,consignee_...
来自: 最佳实践 | 相关产品:专有网络 VPC,云服务器ECS,云数据库RDS MySQL 版,DataWorks,Elasticsearch
< 1 2 3 4 ... 18 >
共有18页 跳转至: GO
产品推荐
这些文档可能帮助您

新品推荐

切换为电脑版

新人特惠 爆款特惠 最新活动 免费试用