建立数据透视表_建立数据透视表相关产品

场景描述本场景以在线教育中一个答题闯关类的应用为例，使用WebServer来模拟演示这类日志数据的分析处理。通过Nginx和Pythonflask搭建 WebServer，模拟应用中的关键页面，比如登录、课程内容等，之后构造若干用户使用的模拟日志数据，投递到数据湖进行分析后获取应用 PV、UV、课程内容访问排行、平均得分等等。解决问题基于数据湖（EMR+OSS）搭建大数据平台。 EMR和OSS使用和配置。数据统一存储到OSS。产品列表 E-MapReduce 对象存储OSS 云服务器ECS 访问控制RAM 专有网络VPC

通过Nginx和Pythonflask搭建WebServer，模拟应用中的关键页面，比如登录、课程内容等，之后构造若干用户使用的模拟日志数据，投递到数据湖进行分析后获取应用PV、UV、课程内容访问排行、平均得分等等。方案优势  支持超过10亿条元数据规模的数据管理，同时支持高可靠和高可用。 支持元数据实时备份和重建集群快速恢复...

来自：最佳实践相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,访问控制,E-MapReduce

云数据传输

云数据传输是一种为云上流量提供统一计费和出账服务的服务开通型产品。支持对公网类产品的公网流量按照阶梯计费，用量越大单价越低；对跨地域类产品的跨地域流量按流量计费，这种计费方式更加灵活

云数据传输 Cloud Data Transfer（简称“CDT”），是一种为云上流量提供统一计费和出账服务的开通型产品。提供更灵活优惠的计费方式，助您降低 IT 成本.支持公网类产品流量阶梯累积计费，用量越大单价越低.支持跨地域类产品按流量计费，无需提前规划带宽，计费方式更灵活.公网类产品支持云服务器 ECS、弹性公网IP、传统型...

| 产品优势 | 产品功能 | 应用场景 | 文档与工具

来自：云产品

自建Hive数据仓库跨版本迁移到阿里云Databricks数据洞察

自<em>建</em>Hive<em>数据</em>仓库跨版本迁移到阿里云Databricks<em>数据</em>洞察

场景描述客户在IDC或者公有云环境自建Hadoop集群构建数据仓库和分析系统，购买阿里云Databricks数据洞察集群之后，涉及到数仓数据和元数据的迁移以及Hive版本的订正更新。方案优势 1. 全托管Spark集群免运维，节省人力成本。 2. Databricks数据洞察与阿里云其他产品（OSS、RDS、MaxCompute、EMR）进行深度整合，支持以这些产品为数据源的输入和输出。 3. 使用Databricks Runtime商业版引擎相比开源Spark性能有3-5倍的提升。解决问题 1. Hive数仓数据迁移OSS方案。 2. Hive元数据库迁移阿里云RDS方案。 3. Hive跨版本迁移到Databricks数据洞察使用Delta表查询以提高查询效率。

自建 Hive数据仓库跨版本迁移到阿里云 Databricks数据洞察业务架构场景描述客户在 IDC或者公有云环境自建 Hadoop集群构建数据仓库和分析系统，购买阿里云 Databricks数据洞察集群之后，涉及到数仓数据和元数据的迁移以及 Hive版本的订正更新。方案优势 1.全托管 Spark集群免运维，节省人力成本。2.Databricks数据洞察...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储HDFS,spark

数据迁移上云

随着越来越多的企业选择将业务系统上云，各种类型的数据如何便捷、平滑的迁移上云，成了用户上云较为关注的点；业务上云后，因为业务或者其他方面调整等因素，也存在如跨区域，跨账号等数据迁移的场景。针对以上需求，阿里云上提供了较为丰富的工具（如ossimport）、服务(在线迁移服务)，旨在能够帮助客户便捷进行数据迁移。本文通过云架构设计工具CADT来快速创建云上基础资源，并以杭州区域来模拟线下IDC（或友商），深圳区域模拟阿里云云上资源。通过云上的工具命令、服务来提供常见数据迁移场景的最佳实践。

示例应用场景线下 IDC数据迁移至阿里云 OSS 线下 NAS数据迁移至阿里云 NAS 线上杭州区域 NAS数据通过 CEN迁移至深圳区域 NAS 最佳实践频道阿里云最佳实践分享群云服务器 ECS（产品名称）文档模板（手册名称）/文档版本信息阿里云企业上云实践数据迁移上云最佳实践文档版本：20201013 文档版本：20150122（发布日期...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,文件存储NAS,云企业网,云速搭CADT

数据传输解决方案

数据传输解决方案支持关系型数据库、NoSQL、大数据(OLAP)等数据源间的数据传输。它是一种集数据迁移、数据订阅及数据实时同步于一体的数据传输服务。数据传输致力于在公共云、混合云场景下，解决远距离、毫秒级异步数据传输难题。

DTS基于数据库日志监听解析的技术实现非侵入式的增量数据实时采集。可将MySQL，PostgreSQL、Oracle、DB2及SQLServer等数据库的增量日志实时采集，实现多种数据库的零停机上云迁移.支持多种数据库的零停机上云迁移.DTS可实现MySQL、Oracle、DRDS、PostgreSQL等多种数据源的实时同步，实现数据异地灾备。基于MySQL的实时双向...

来自：解决方案

云原生数据湖分析DLA

阿里云云原生数据湖分析是新一代大数据解决方案，采取计算与存储完全分离的架构，支持对象存储(OSS)、RDS(MySQL等)、NoSQL(MongoDB等)数据源的消息实时归档建仓，提供Presto和Spark引擎，满足在线交互式查询、流处理、批处理、机器学习等诉求。内置大量优化+弹性，比开源自建集群最高降低50%+的成本，最快可1分钟级拉起300个计算节点，快速满足业务资源要求。

拥有优越弹性，支持元数据发现，支持多源一键数据实时入湖分析等功能，直接使用SQL即可分析OSS等数十种源数据.多项企业级能力，涵盖各类业务需求.GUI工具丰富.支持Microstrategy、MySQL Workbench、DBeaver等多种MySQL GUI管理工具.多种可视化工具支持.与QuickBI、Tableau、DataV等BI工具集成度高、兼容性好.兼容标准SQL....

来自：云产品

数据湖构建 Data Lake Formation

数据湖构建服务是阿里云上数据湖架构中的核心部分，助力用户构建数据湖系统。支持多数据源实时入湖，实现湖上元数据统一管理，提供企业级权限控制，无缝对接多种计算引擎，打破孤岛，洞察业务价值

支持多种数据类型和入湖渠道支持数据统一清洗.智能元数据识别服务统一收集避免分散管理.企业级数据权限管理用户可以针对库、表、字段分别设置权限.支持上游多种计算引擎轻松构建全链路数据湖服务.兼容Hive Metastore 提供多语言Open API，易集成.独有JindoFS数据加速功能提供高性能数据湖分析加速能力.用户数过亿的某...

来自：云产品

数据可视化DataV

数据可视化DataV是阿里云一款数据可视化应用搭建工具，旨让更多的人看到数据可视化的魅力，帮助非专业的工程师通过图形化的界面轻松搭建专业水准的可视化应用，满足您会议展览、业务监控、风险预警、地理信息分析等多种业务的展示需求。

在线客服咨询.DataV数据可视化.DataV-数据看板产品文档.DataV-数据看板.DataV-孪生仿真产品文档.DataV-孪生仿真.DataV-可视分析卡片产品文档.DataV-可视分析卡片.DataV-可视分析地图产品文档.DataV-可视分析地图.DataV在业务数据可视化领域，通过丰富的可视化组件、低代码蓝图系统、AI设计辅助、多种数据源接入的能力，帮助...

来自：云产品

云Clickhouse冷热数据分层存储

基于云ClickHouse可以给电商、游戏、互联网以及其他行业提供高性能、高稳定性、低维护成本、高性价比的实时数据分析、精准营销、业务运营、业务分析、业务预警、业务营销、数仓加速等场景化方案，本实践会向客户提供数据库低维护成本、数据库链路构建、冷热分层存储、快熟分析等操作实践。解决问题 1. 维护成本低不用建设维护体系，稳定性高，数据倾斜自动均衡。 2. 完善的数据同步链路，可以平滑将业务库、大数据、日志服务的数据同步到Clickhouse，降低研发成本。 3. 平滑升级版本，业务中断小。冷热分层后透明读取，帮客户节约整体数据存储成本。

热存可存储数据物理大小=云 ClickHouse集群磁盘空间*(1-数据移动因子)，关于数据移动因子描述参考：https://help.aliyun.com/document_detail/202879.html 通过该步骤创建一个宽表并写入大量数据，突破“热存可存储数据物理大小”，触发部文档版本：20210416 42 云 ClickHouse冷热数据分层存储最佳实践 ...

来自：最佳实践 | 相关产品：云数据库RDS MySQL 版,数据传输,日志服务（SLS）,云数据库 ClickHouse

云原生数据仓库AnalyticDB PostgreSQL版

阿里云MPP架构的云原生数据仓库，可提供PB级海量数据在线/离线分析服务，是面向各行各业的有竞争力的数仓方案，真正做到“人人可用的数据分析服务”。

多表关联及探索性数据查询，在不改变用户数据模型的情况下可实现高速的数据关联查询，大幅提高企业内分析效率.复杂数据查询加速.入仓即可用的实时性，同时广泛支持主流商业智能工具，可稳定，实时，高效的支持企业数字化运营.实时商业智能.实时日志分析.游戏互联网游戏日志实时分析实时分析.云原生数据仓库AnalyticDB ...

来自：云产品

数据中台安全解决方案

针对阿里云提供的数据中台解决方案，基于数据全生命周期安全管控，结合云上客户最佳实践，为客户提供可参考的数据中台安全解决方案。

以数据中台为底座的消费者资产运营分析解决方案.消费者运营分析解决方案.提供从交通数据接入到数据应用的全链路智能数据构建与管理能力.交通数据中台解决方案.提供保险企业数据基础建设和统一的数据服务.保险数据中台解决方案.阿里云安全整合云平台等保测评经验和云安全产品优势，联合等保咨询、等保测评机构提供一站式等保...

来自：解决方案

交通数据中台解决方案

阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力，帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务，助力交通行业数字化转型及智能应用的创新和推广。

阿里云交通数据中台解决方案提供从交通数据接入到数据应用的全链路智能数据构建与管理能力，帮助客户快速形成数据资产、挖掘数据价值、赋能交通业务，助力交通行业数字化转型及智能应用的创新和推广.交通数据中台解决方案.根据您提交的需求，将有售前专家免费服务！根据您提交的需求，将有售前专家免费服务！售前专家免费...

| 方案架构 | 应用场景 | 方案优势 | 合作流程

来自：解决方案

DataWorks数据安全合规服务

DataWorks数据安全合规服务是基于蚂蚁安全实验室核心能力，结合已获取多项专利的AI检测能力，对App进行隐私安全合规分析的专家服务，助力客户全面、准确、高效地规避合规风险。

DataWorks数据安全合规服务基于蚂蚁安全实验室核心安全能力沉淀及已获取多项专利的AI检测能力，为客户提供专业隐私合规服务.严格参照国家相关法律，以及网信办、工信部、公安部、市场监管总局四部门发布的相关执行标准进行APP合规检测和隐私合规检测，对App隐私风险进行逐项检查.自动化隐私风险发现和检测，对App收集使用...

| 产品功能 | 产品优势 | 应用场景 | 文档与工具

来自：云产品

保险数据中台解决方案

保险数据中台解决方案为保险企业提供完整数据中台方案，包含数据中台内容建设、数据资产管理、数据智能研发、数据消费、数据服务、数据实验室等组成部分，适应数字产业发展，以金融科技为企业赋能。

险企数据中台统一数据、形成数据资产层，提供数据基础建设和统一的数据服务。它是险企数据化的业务抽象，不仅能降低重复建设、减少信息流转中烟囱式协作的成本，也是险企差异化竞争优势所在.全量数据的集中存储、建模、计算.高效的数据开发工具，极大程度上实现数据开发的自动化.体系化的数据资产、数据血缘、数据安全管理...

| 方案架构 | 方案优势 | 客户案例

来自：解决方案

云上数据集成解决方案

云上数据集成解决方案提供可跨异构数据存储系统、可靠、安全、低成本、可弹性扩展的数据传输交互服务，有效帮助您解决云环境、个人站点环境下异构数据存储系统的数据互通难题，让您数据不再成为孤岛！助您实现大数据分析和实时商务智能。

离线（批量）的数据同步主要通过定义数据来源和去向的数据源和数据集，由数据集成提供一套抽象化的数据抽取插件（称之为Reader）、数据写入插件（称之为Writer），并基于此框架设计一套简化版的中间数据传输格式，从而达到任意结构化、半结构化数据源之间数据传输的目的。这期间也会涉及到数据源本身所处的网络，针对于各种...

| 立即咨询 | 方案架构 | 方案优势 | 客户案例

来自：解决方案

企业上云数据安全

场景描述企业是否选择上公共云，或者哪些系统或数据上公共云，对数据安全的关心是重要因素之一。本最佳实践重点在于介绍狭义的数据加密存储安全范畴，即首先使用SDDP产品进行敏感数据发现和分级分类，然后对高级别敏感数据进行按需、不同类型的全链路加密存储。解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密产品列表 敏感数据识别SDDP 密钥管理服务KMS 云数据库RDS 对象存储OSS

本最佳实践重点在于介绍狭义的数据加密存储安全范畴，即首先使用 SDDP产品进行敏感数据发现和分级分类，然后对高级别敏感数据进行按需、不同类型的全链路加密存储。解决问题 1.帮助客户发现敏感数据 2.对敏感数据进行分类、分级 3.对不同级别的数据如何选择加密方式 4.具体如何进行加密产品列表敏感数据识别 SDDP 密钥...

来自：最佳实践 | 相关产品：专有网络 VPC,云服务器ECS,对象存储 OSS,密钥管理服务,敏感数据保护,云速搭CADT

大数据近实时数据投递MaxCompute

本文介绍离线大数据场景使MaxCompute构建云上近实时数仓，打通云下数据上云链路，解决数据复杂类型支持和动态分区问题，满足高级数据处理需求的最佳实践。 l混合云环境下，现有业务系统零改造，打通数据上云链路。 l使用UDF实现复杂数据类型转换和数据动态分区。 l使用DataWorks配置周期调度业务流程，数据自动入仓。 l借助MaxCompute优化计算引擎，实现降本增效。产品列表云服务器ECS 专有网络VPC 访问控制RAM 数据总线DataHub E-MapReduceEMR DataWorks 大数据计算服务MaxCompute

文档版本：20240419 53 大数据近实时数据投递 MaxCompute 解析 tmp表数据至 final表节点周期实例列表界面，可以看到今天的周期实例已创建，等待调度周期的时间后，定位到相应时间点，可以到到实例执行状态。在工作空间的数据开发界面，选择临时查询，打开之前创建的 ODPS SQL节点。文档版本：20240419 54 大数据近实时数据...

来自：最佳实践 | 相关产品：块存储,专有网络 VPC,云服务器ECS,访问控制,E-MapReduce,DataWorks,大数据计算服务 MaxCompute,数据总线,云速搭CADT

跨链数据可信连接服务

跨链数据连接服务 ODATS 是利用蚂蚁区块链领先技术实现的跨链数据连接服务。通过制定标准化的区块链UDAG全栈跨链协议，保证跨链交易的安全性、可扩展性及可靠性，打破区块链数据孤岛，实现同构及异构链之间的可信互通，助力企业之间可信协作，促进产业生态可信融合。

跨链数据连接服务 ODATS(Open Data Access Trusted Service)是利用蚂蚁区块链领先技术实现的跨链数据连接服务。通过制定标准化的区块链UDAG全栈跨链协议，保证跨链交易的安全性、可扩展性及可靠性，打破区块链数据孤岛，实现同构及异构链之间的可信互通，助力企业之间可信协作，促进产业生态可信融合.跨链数据连接服务 ...

来自：云产品

云原生企业级数据湖解决方案

云原生企业级数据湖解决方案，数据湖解决方案，无缝对接多种计算分析平台，数据湖中的数据可以直接进行数据分析、处理。

OSS能支撑 EB 规模的数据湖，支持多种数据通道，全面覆盖日志、消息、数据库、HDFS 各种数据源•OSS 无缝对接EMR Hive、Spark、Presto、Impala 等大数据处理引擎，消除数据孤岛•阿里云 EMR 大数据专家级服务支持•阿里云 Data Lake Formation 提供数据湖元数据管理、数据湖加速等服务；EMR大数据专家级服务支持.WHY 阿里...

来自：解决方案

DTS数据同步集成MaxCompute数仓

场景描述本文Step by Step介绍了通过数据传输服务 DTS实现从云数据库RDS到MaxCompute的数据同步集成，并介绍如何使用DTS和 MaxCompute数仓联合实现数据ETL幂等和数据生命周期快速回溯。解决问题 1.实现大数据实时同步集成。 2.实现数据ETL幂等。 3.实现数据生命周期快速回溯。产品列表 MaxCompute 数据传输服务DTS DataWorks 云数据库RDS MySQL 版

数据抽取不幂等或容错率低，如凌晨 0:00启动的 ETL任务因为各种原因(数据库 HA切换、网络抖动或 MAXC写入失败等)失败后，再次抽取无法获取 0:00时的数据状态。2.针对不规范设计表，如没有 create_time/update_time的历史遗留表，传统 ETL需全量抽取。3.实时性差，抽取数据+重试任务往往需要 1-3小时。另外数据库的数据...

来自：最佳实践 | 相关产品：专有网络 VPC,云数据库RDS MySQL 版,数据传输,DataWorks,大数据计算服务 MaxCompute

建立数据透视表_相关内容

新品推荐