企业信息大数据-企业信息大数据文档介绍内容-移动阿里云

查看数据迁移任务的详情

下载对象配置信息数据传输支持下载以指定对象方式选择迁移对象的数据迁移任务的配置信息，以批量导入的格式输出。详情请参见下载和导入迁移对象配置。下载冲突数据双向同步任务中，如果您已配置正向任务和反向任务，并且存在冲突数据...

MaxCompute数据源

MaxCompute数据源作为数据中枢，为您提供读取和写入数据至MaxCompute的双向通道。功能介绍说明 DataWorks的MaxCompute数据源可使用 Tunnel Endpoint 地址访问相应MaxCompute项目的Tunnel服务，从而通过上传、下载等方式同步该项目的数据，...

基本介绍

背景信息云数据库HBase增强版是由云原生多模数据库Lindorm宽表引擎提供的、完全兼容HBase的云上托管数据库，从2011年开始云数据库HBase增强版正式承载阿里内部业务的海量数据实时存储需求，支撑服务了淘宝、支付宝、菜鸟、优酷、高德等...

基于Delta lake的一站式数据湖构建与分析实战

数据湖计算与分析相比于数据仓库，数据湖以更开放的方式对接多种不同的计算引擎，如传统开源大数据计算引擎Hive、Spark、Presto、Flink等，同时也支持云厂商自研的大数据引擎，如阿里云MaxCompute、Hologres等。在数据湖存储与计算引擎...

DataWorks产品安全能力介绍

为充分契合数据安全治理的核心理念与通用思路，DataWorks针对资产梳理、技术体系/运营体系建设提供了一系列全面的数据安全产品能力，基于“I（Identify）P（Protect）D（Detect）R（Respond）”理论框架，从资产识别、安全防护、行为检测、...

AnalyticDB for MySQL 2.0数据导入

MaxCompute中已经没有原始数据，原始数据只存在于 AnalyticDB for MySQL 2.0集群的数据库中，可以使用两种数据迁移方式将 AnalyticDB for MySQL 2.0集群中的数据导入到企业版。具体操作，请参见数据迁移。准备工作了解 AnalyticDB for ...

2024年

通过数据同步功能同步SLS数据至数仓版通过数据同步功能同步SLS数据至湖仓版无感数据集成（Zero-ETL）支持无感集成（Zero-ETL）功能，可创建 RDS for MySQL 和 PolarDB for MySQL 的同步链路，可以帮助您一站式完成数据同步和管理，实现...

数据服务入门

背景信息 DataWorks数据服务作为数据库和数据应用之间的桥梁，旨在为个人、团队及企业提供全面的数据服务及共享能力，帮助用户统一管理面向阿里云内外部的API服务。数据服务已与API网关连通，支持一键发布API至API网关。数据服务与API网关...

DataWorks数据安全治理路线

DataWorks基于数据安全治理的常见思路，针对资产梳理、技术体系建设和运营体系...企业也可以考虑将DataWorks风险相关的事件信息接入至企业已有的安全运营平台统一管控。数据安全持续运营相关的实践场景，请参见阶段三：数据安全持续运营。

什么是数据湖构建

DLF与多个阿里云大数据计算引擎无缝对接，打破数据孤岛，帮助用户快速实现云原生数据湖及OpenLake解决方案的构建与管理。该平台能够实现元数据的统一、湖表格式的统一以及数据存储的统一，显著简化客户在数据湖构建和管理过程中的运维工作...

管理敏感数据

默认包含如下分类：一级分类：个人信息、企业信息、位置信息等。二级分类：手机号、邮箱、银行卡等。说明用户可自定义新的数据分类。更多信息，请参见管理敏感数据识别规则。敏感数据信息汇总：可通过不同层级（库视角、表视角、字段视角...

常见问题

DAS企业版 V3采用冷热混合存储，企业版 V0/V1的数据迁移至企业版 V3后，最近7天的数据采用热存储，其余数据采用冷存储。企业版 V0/V1控制台展示的是压缩后的数据，迁移后企业版 V3控制台展示的为压缩前的原始数据，其数值可能会大于迁移前...

使用限制

功能集群系列高可用系列基础系列 2022 企业集群版 2019 企业集群版 2017 企业集群版 2022 标准版 2019 标准版 2017 标准版 2016 标准版、企业版 2014 标准版、企业版 2012 标准版、企业版 2008 R2 2022 Web版、标准版、企业集群版 2019 ...

应用场景

解决方案 DataWorks 联合 MaxCompute、Hologres 等云原生大数据引擎，提供一套湖仓一体、流批融合的一站式智能数据平台解决方案，帮助企业打破数据处理的时效壁垒。统一的数据接入与分层通过 DataWorks 数据集成(Data Integration)，...

云产品集成

常见云产品如下：大数据开发治理平台 DataWorks 实时计算 Flink 版数据库管理 DMS DataV 数据可视化 Quick BI 数据分析与展现前提条件已获取 OceanBase 数据库的基本连接信息，详细步骤请参见获取连接参数。大数据开发治理平台 ...

企业版产品系列

大中型企业的生产数据库。互联网、物联网、零售电商、物流、游戏等行业的数据库。对数据安全性要求非常高的金融、证券、保险行业的核心数据库。多主集群（Limitless）在一个集群中通过多个主节点来实现从一写多读架构到多写多读架构的升级...

关联数据

管理人员人员功能帮您管理经常访问您数据库的企业内部人员信息。新增人员信息并使用应用身份识别功能（更多信息，请参见应用身份识别）后，数据库审计系统会自动帮您识别SQL语句中的人员信息并将该信息关联到对应的SQL语句中。以下步骤为...

综合：网站用户画像分析

案例用户信息数据结构以下为MySQL用户信息数据表 ods_user_info_d 的表结构：字段名称字段说明 uid 用户名 gender 性别 age_range 年龄分段 zodiac 星座案例目标数据结构根据原始数据分析可获得的有效数据，并基于业务需求确认最终数据...

基于MaxCompute进行大数据BI分析

背景信息 MaxCompute：用于进行大规模数据计算，详情请参见什么是MaxCompute。AnalyticDB MySQL：用于进行海量数据实时高并发在线分析，详情请参见云原生数据仓库AnalyticDB MySQL版。DataWorks：可实现ETL功能，对复杂数据集进行采集、...

数据库节点

SelectDB SelectDB是基于Apache Doris打造的新一代多云原生实时数据仓库，聚焦于满足企业级大数据实时分析需求，为您提供极致性价比、简单易用的数据分析服务。更多介绍，请参见 SelectDB。Redshift Amazon Redshift是云平台的一种完全托管...

简介

时空数据管理面临的挑战 Ganos 解决什么问题 Ganos 为数据库构建了面向新型时空多模多态数据的一体化表达、存储、查询、分析与渲染支撑能力，解决了以往时空大数据使用流程复杂、使用门槛高、应用效率低等问题...

简介

时空数据管理面临的挑战 Ganos 解决什么问题 Ganos 为数据库构建了面向新型时空多模多态数据的一体化表达、存储、查询、分析与渲染支撑能力，解决了以往时空大数据使用流程复杂、使用门槛高、应用效率低等问题...

实时数仓概述

背景信息随着信息技术的发展和互联网的普及，企业越来越看重业务的时效性。特别是在数据分析领域，企业对数据的时效性要求也越来越高。在数仓领域，大量的业务开始从传统批量处理的离线模式，转向基于增量流式的实时处理模式。所以实时数...

OSS数据安全保护方案

敏感数据主要包括个人隐私信息、密码、密钥、敏感图片等高价值数据，通常会以不同的格式存储在您的OSS Bucket中，如果发生泄漏，会给您带来重大的经济和声誉损失。OSS结合数据安全中心 DSC（Data Security Center）使用，不仅能通过DSC...

DLF商业化公告

DLF介绍数据湖构建（Data Lake Formation，DLF）是一款全托管的统一元数据和数据存储及管理平台，提供企业级安全能力的同时保持开放和开源社区兼容，面向全模态数据存储及管理，集成湖存储格式 Apache Paimon、Apache Iceberg、Lance ...

客户案例

互联网行业：快狗打车云上大数据仓库客户简介快狗打车则一直坚持通过“连接网络化”、“运力共享化”、“过程数据化”、“匹配智能化”等数字信息化解决方案，将闲散运力统一整合到平台上，通过大数据将运力精准匹配市场需求，实现运力的...

离线集成

解决企业复杂大数据批处理难题，支持企业精细化运营、数据营销、智能推荐等大数据业务场景。离线集成功能底层基于Spark开发，支持提升Hadoop平台运行速度的应用场景。说明如果您在使用该功能的过程中有任何疑问或问题，请使用钉钉搜索钉钉...

云消息队列 Kafka 版数据迁移至MaxCompute

本文介绍如何使用DataWorks数据同步功能，将云消息队列 Kafka 版集群上的数据迁移至阿里云大数据计算服务MaxCompute，便于分析加工离线数据。前提条件在开始本教程前，确保您在同一地域中已完成以下操作：云消息队列 Kafka 版购买并...

什么是数据安全中心

满足等保2.0及《数据安全法》《个人信息保护法》等合规要求，适用于合规审计与企业级数据安全治理场景。使用场景敏感数据识别与治理识别并分类结构化与非结构化敏感数据。对图片中的敏感信息执行智能遮盖。支持数据库敏感字段一键加密，...

最佳实践

阿里图片空间信息库阿里巴巴集团图片空间是淘宝智能图片中心面向商家提供的免费图片存储管理服务，由于淘宝、天猫主站上累积的用户图片数据量非常大，图片空间业务也面临非常巨大的存储空间和写入性能压力，尤其每年双11之前，商家大量...

流式ETL

实时数据集成：ETL强大的流式数据转换处理能力大幅提升数据集成效率，低代码的开发方式也进一步降低了数据集成的难度和成本，让企业专注于数据价值实现。实时数据仓库：行业领先的流数据处理能力帮助企业快速搭建实时数据仓库。离线数仓...

连接不同主账号数据源

云企业网配置网络连通登录账号B，访问云企业网控制台，单击创建云企业网实例，在对话框中设置实例名称后单击确认。说明 DataWorks作为大数据处理平台，在实际业务中可能会接入不同账号、VPC下的数据源，建议在DataWorks所在账号创建...

什么是ETL

实时数据集成：ETL强大的流式数据转换处理能力大幅提升数据集成效率，低代码的开发方式也进一步降低了数据集成的难度和成本，让企业专注于数据价值实现。实时数据仓库：行业领先的流数据处理能力帮助企业快速搭建实时数据仓库。离线数仓...

Tair（企业版）

Tair（企业版）是基于阿里集团内部使用的Tair产品研发的云上托管企业级内存数据库，从2009年开始正式承载阿里集团业务，历经天猫双十一、优酷春晚、菜鸟、高德等业务场景的磨练，是一款真正的企业级内存数据库产品。实例存储介质随着...

产品教程

MaxCompute Hologres EMR Spark 数据分析 大数据AI公共数据集分析本教程通过DataWorks，联合云原生大数据计算服务MaxCompute，使用大数据AI公共数据集（淘宝、飞猪、阿里音乐、Github、TPC等公共数据），指导您如何快速进行大数据分析，...

组件操作

EMR提供的组件包括开源和自研两大类，涵盖数据开发、计算引擎、数据服务、资源管理、数据存储、数据集成等领域，您可以按需选择和配置。说明在创建集群时，如果没有您想使用的组件，或者想使用的开源组件仅对存量用户开放，您可以自行安装...

不同版本功能区别

敏感数据识别与分类分级功能免费版 7天免费试用版高级版企业版数据库审计（等级保护合规版）仅采购增值服务版分类分级（版本内提供）支持支持支持支持不支持支持数据识别：非结构化数据识别量 5 GB 1TB 1TB 3TB 不支持 5 GB ...

逻辑数仓

数据管理DMS提供的逻辑数仓具有强大的数据源管理能力，可以实现将企业的异构数据源进行逻辑聚合，形成物理分散、逻辑统一的虚拟数仓，然后快速地提供数据分析和访问服务，满足业务人员、BI分析师、运营人员等各种角色的需求。背景信息企业...

API概览

数据归档数据归档 CreateDataArchiveOrder 创建数据归档工单使用此API可以创建数据归档工单，将数据归档至专属存储、RDS MySQL等目标中。GetDataArchiveOrderDetail 获取数据归档工单详情调用此API获取数据归档工单详情，包含工单的创建...