大数据需要的技术-大数据需要的技术文档介绍内容-移动阿里云

EMR+DLF数据湖解决方案

步骤三：初始化数据初始化数据一般常见的几种情况如下：已有大数据集群，需要进行数据迁移，此时可以考虑通过 Jindo DistCp 工具将老集群的数据迁移到OSS中。从RDS/MySQL/Kafka 等业务系统接入数据，此时可以考虑通过实时计算Flink实现...

云原生多模数据库Lindorm助力蚂蚁链IoT数据降本

业务挑战业务增速快，数据总量不断增大，MySQL出现性能瓶颈日增数据量大，一年数据增量超6TB，存储成本压力大数据冷热区分明显，和数据生成时间强相关 数据需要实时归档到离线进行分析解决方案阿里云Lindorm历经阿里众多核心服务的大...

MaxCompute近实时增全量一体化架构介绍

数据自动治理优化存在的问题 Transactional Table 2.0支持分钟级近实时增量数据导入，高流量场景下可能会导致增量小文件数量膨胀，尤其是桶数量较大的情况，从而引发存储访问压力大、成本高，数据读写I/O效率低下等问题。如果Update和...

常见问题

1.售前咨询渠道尊敬的“准”大数据专家服务用户您好：如果您准备购买阿里云大数据专家服务，但是遇到如服务范围、规格、服务选择等售前方面的问题，您可以通过钉钉与我们联系，您将“当面”获得阿里云大数据专家咨询专家的建议。...

服务授权

当您寻求阿里云的技术支持时，如果技术支持过程中需要对您的数据库实例进行操作，您需要授权，技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后，临时服务账号会被自动删除。在没有经过您授权服务账号的情况下，阿里...

服务授权

当您寻求阿里云的技术支持时，如果技术支持过程中需要对您的数据库实例进行操作，您需要授权，技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后，临时服务账号会被自动删除。在没有经过您授权服务账号的情况下，阿里...

服务授权

当您寻求阿里云的技术支持时，如果技术支持过程中需要对您的数据库实例进行操作，您需要授权，技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后，临时服务账号会被自动删除。在没有经过您授权服务账号的情况下，阿里...

服务授权

当您寻求阿里云的技术支持时，如果技术支持过程中需要对您的数据库实例进行操作，您需要授权，技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后，临时服务账号会被自动删除。在没有经过您授权服务账号的情况下，阿里...

产品优势

无锁备份利用底层分布式存储的快照技术，只需分钟级别即可完成对上TB数据量大小的数据库的备份，且整个备份过程不需要加锁，效率更高，影响更小。开始使用PolarDB PolarDB MySQL版快速入门 PolarDB PostgreSQL版快速入门 PolarDB ...

产品优势

无锁备份利用底层分布式存储的快照技术，只需分钟级别即可完成对上TB数据量大小的数据库的备份，且整个备份过程不需要加锁，效率更高，影响更小。跨机并行查询支持跨机并行查询计算引擎，多个节点跨机并行执行SQL，充分发挥所有计算节点...

上海新能源汽车车辆基础数据

2019年开始上海市新能源汽车大数据平台从自建Hadoop集群迁移至阿里云Lindorm+DLA Spark产品，有效解决了我们平台存储和计算的横向动态扩容瓶颈，同时借助其产品中间件LTS实现了我们平台数据的冷热分离，有效降低了数据存储成本，依托于阿里...

操作指南

一、大数据专家服务流程指南二、服务流程说明用户可以根据自己实际需要，提前或者在问题发生时购买大数据专家服务，服务项包含大数据技术架构方案咨询、大数据解决方案POC、大数据搬站迁云方案咨询、跨地域迁移支持服务、大数据专家高阶...

产品概述

什么是PolarDB PolarDB 是阿里巴巴自研的新一代云原生数据库，在计算存储分离架构下，利用了软硬件结合的优势，为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL和PostgreSQL生态，高度兼容Oracle语法。...

客户案例

价值体现 DeNA中国是游戏行业首家应用闪电立方+MMA工具项目，在无专线等环境下，1个多月就完成10年增量RDS库300TB+历史数据50TB的数据迁移，具备较高的技术复杂度。相较之前客户基于python开源的airflow任务管理系统来说，DataWorks拥有...

什么是EMR on ACK

阿里云E-MapReduce（简称EMR）on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版（ACK）之上，利用ACK在服务部署和容器应用管理的优势，减少对底层集群资源的运维投入，以便于您可以更加专注...

DataWorks模块使用说明

使用流程概览：参考文档：数据集成概述数据建模与开发子模块：数据建模功能说明：数据建模是全链路数据治理的第一步，沉淀阿里巴巴数据中台建模方法论，从数仓规划、数据标准、维度建模、数据指标四个方面，以业务视角对业务的数据进行...

X-Engine简介

Engine:An Optimized Storage Engine for Large-scale E-Commerce Transaction Processing》，在数据管理国际会议SIGMOD'19发表，这是中国内地公司首次在国际性学术会议上发表OLTP数据库内核相关的技术成果。技术特点利用FPGA硬件加速...

银泰商业

到2019年，随着银泰业务的持续发展，IDC中残余的少量数据库资源对系统的性能及稳定性带来了很大的威胁，于是银泰寻求快速云化的方案，最终在2019年9月份实现了数据库的100%云化。业务挑战以前进行核心交易库从Oracle转成云上MySQL，投入的...

概述

数据内容安全管理安全中心提供的数据分级分类、敏感数据识别、数据访问审计、数据源可追溯等功能，在处理业务流程的过程中，能够快速及时识别存在安全隐患的数据，保障了数据内容的安全可靠，详情请参见数据保护伞。安全诊断的最佳实践 ...

通过RAM角色授权模式配置数据源

某企业有100个Bucket，存放该企业的所有数据，但大数据团队只需要使用其中两个Bucket的数据。如果使用预设的 AliyunDataWorksAccessingOSSRole 角色，可能导致其它98个Bucket被大数据团队访问，存在管理风险。因此，云账号负责人可以为大...

管理数据

更多操作批量管理数据域 需要大规模调整多个数据域下的资产时，您可以使用批量导入功能。通过下载并修改数据域模板文件，快速管理数据域。仅支持阿里云账号和具有 AliyunYundunSDDPFullAccess 权限的RAM用户使用该功能。登录数据安全中心...

用户价值

数据开发更简单：平台提供的各种工具产品能够极大的简化数据开发过程，缩短数据治理周期，降低数据治理成本。通过标准化、精细化、规格化的智能数据生产流程，完成流水线式的数据生产作业，提升数据资源生产效率、消除数据供应品质差异。...

产品功能

高效压缩存储 TSDB 使用高效的数据压缩技术，将单个数据点的平均使用存储空间降为1~2个字节，可以降低90%存储使用空间，同时加快数据写入的速度。时序数据计算能力 TSDB 提供专业全面的时序数据计算函数，支持降采样、数据插值和空间聚合...

导入数据至维表

创建完成维表后，您可以在维表中直接写入数据，也可以导入电子表格、本地CSV文件和Excel文件的数据至维表，为后续数据分析做准备。前提条件已创建完成一个维表，详情请参见创建维表。操作步骤在维表页面，单击全部维表下相应的文件...

IoT数据自动化同步至云端解决方案

背景信息物联网（The Internet of Things，简称IoT）是指通过信息传感器等各种装置和技术，实时采集任何需要的信息。通过各类网络的接入，实现物与物、物与人的连接，实现对物品和过程的智能化感知、识别和管理。物联网、大数据和云计算...

适配组件数据

数据看板创建完成后，您可以根据实际需要通过以下方式修改组件数据内容。背景信息本文以使用静态数据源为例，因此可以直接在组件的数据源配置区域粘贴准备好的数据。如果您的数据源为 CSV文件、数据库等其他类型的数据，需要首先添加...

新建自定义数据源

下文以自定义的mysql5数据源类型为例，mysql5数据源类型为RDBMS数据库类型，需要配置的数据源信息为链接地址、用户名和密码。在新建mysql5数据源对话框中，配置连接信息。参数描述数据源名称填写数据源名称。数据源名称由汉字、数字、...

创建SAP HANA数据源

通过创建SAP HANA数据源能够实现Dataphin读取SAP HANA的业务数据或向SAP HANA写入数据。本文为您介绍如何创建SAP HANA数据源。背景信息 SAP HANA是一款具有高性能内存的应用平台。如果您使用的是SAP HANA，在对接Dataphin进行数据开发或将...

DataWorks数据集成

对于数据导出，请登录 AnalyticDB PostgreSQL版的管理控制台进行IP 白名单设置，详情请参见添加白名单数据导入源端的数据源需要在DataWorks管理控制台进行添加，数据源添加的详细步骤请参考配置AnalyticDB for PostgreSQL数据源配置...

创建Vertica数据源

通过创建Vertica数据源能够实现Dataphin读取Vertica的业务数据或向Vertica写入数据。本文为您介绍如何创建Vertica数据源。背景信息 Vertica是一款基于列存储架构的数据库。如果您使用的是Vertica，在对接Dataphin进行数据开发时，您需要先...

创建Vertica数据源

通过创建Vertica数据源能够实现Dataphin读取Vertica的业务数据或向Vertica写入数据。本文为您介绍如何创建Vertica数据源。背景信息 Vertica是一款基于列存储架构的数据库。如果您使用的是Vertica，在对接Dataphin进行数据开发时，您需要先...

创建OceanBase数据源

通过创建OceanBase数据源能够实现Dataphin读取OceanBase的业务数据或向OceanBase写入数据。本文为您介绍如何创建OceanBase数据源。背景信息 OceanBase即阿里云数据库OceanBase，是阿里巴巴和蚂蚁金服100%自主研发的金融级分布式关系数据库...

复制数据库SQL Server 2008 R2版

若您需要创建一个与现有数据库数据完全相同的数据库，您可以使用复制数据库的方式。本文介绍如何通过RDS控制台复制并创建新的数据库。前提条件实例版本为SQL Server 2008 R2。说明 SQL Server 2008 R2（本地盘）实例支持通过RDS控制台复制...

未来规划

数据处理与分析：海量数据分析在线化（实时在线交互式分析）。如何对海量数据进行在线分析和计算，支持实时在线交互式分析，需要做并行处理（DSP 模型、MPP 模型等等），对并行调度计算进行优化。系统能力提升：智能化+安全（使用方便可靠...

创建IBM DB2数据源

通过创建IBM DB2数据源能够实现Dataphin读取IBM DB2的业务数据或向IBM DB2写入数据。本文为您介绍如何创建IBM DB2数据源。背景信息 IBM DB2是一套关系型数据库管理系统。如果您使用的是IBM DB2，在对接Dataphin进行数据开发时，您需要先...

大数据安全治理的难点

您需要了解哪些资产需要被保护、资产存在的风险、企业/组织是否合规、如何处理内放攻防、如何落地安全运营等关键问题，才能有效落地数据安全治理。同时，大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点，存在诸多安全治理...

新建自定义数据源

下文以自定义的mysql5数据源类型为例，mysql5数据源类型为RDBMS数据库类型，需要配置的数据源信息为链接地址、用户名和密码。在新建mysql5数据源对话框中，配置连接信息。参数描述数据源名称填写数据源名称。数据源名称由汉字、数字、...

创建OceanBase数据源

通过创建OceanBase数据源能够实现Dataphin读取OceanBase的业务数据或向OceanBase写入数据。本文为您介绍如何创建OceanBase数据源。背景信息 OceanBase即阿里云数据库OceanBase，是阿里巴巴和蚂蚁金服100%自主研发的金融级分布式关系数据库...

数据质量教程概述

在整体数据链路的处理过程中，为保证最终产出数据的质量，您需要对数据仓库ODS、CDM和ADS层的数据分别进行监控。数据仓库分层的定义请参见数仓分层。本教程基于搭建互联网在线运行分析平台教程，ods_user_trace_log、dw_user_trace_log...

创建PolarDB-X数据源

通过创建PolarDB-X数据源能够实现Dataphin读取PolarDB-X的业务数据或向PolarDB-X写入数据。本文为您介绍如何创建PolarDB-X数据源。背景信息 PolarDB-X（原DRDS升级版）是由阿里巴巴自主研发的云原生分布式数据库。如果您使用的是PolarDB-X...