大数据需要的技术

_相关内容

EMR+DLF数据湖解决方案

步骤三:初始化数据 初始化数据一般常见的几种情况如下:已有大数据集群,需要进行数据迁移,此时可以考虑通过 Jindo DistCp 工具将老集群的数据迁移到OSS中。从RDS/MySQL/Kafka 等业务系统接入数据,此时可以考虑通过实时计算Flink实现...

云原生多模数据库Lindorm助力蚂蚁链IoT数据降本

业务挑战 业务增速快,数据总量不断增大,MySQL出现性能瓶颈 日增数据,一年数据增量超6TB,存储成本压力 数据冷热区分明显,和数据生成时间强相关 数据需要实时归档到离线进行分析 解决方案 阿里云Lindorm历经阿里众多核心服务的...

MaxCompute近实时增全量一体化架构介绍

数据自动治理优化 存在的问题 Transactional Table 2.0支持分钟级近实时增量数据导入,高流量场景下可能会导致增量小文件数量膨胀,尤其是桶数量较大的情况,从而引发存储访问压力大、成本高,数据读写I/O效率低下等问题。如果Update和...

常见问题

1.售前咨询渠道 尊敬的“准”大数据专家服务用户您好:如果您准备购买阿里云大数据专家服务,但是遇到如服务范围、规格、服务选择等售前方面的问题,您可以通过钉钉与我们联系,您将“当面”获得阿里云大数据专家咨询专家的建议。...

服务授权

当您寻求阿里云的技术支持时,如果技术支持过程中需要对您的数据库实例进行操作,您需要授权,技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后,临时服务账号会被自动删除。在没有经过您授权 服务账号 的情况下,阿里...

服务授权

当您寻求阿里云的技术支持时,如果技术支持过程中需要对您的数据库实例进行操作,您需要授权,技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后,临时服务账号会被自动删除。在没有经过您授权 服务账号 的情况下,阿里...

服务授权

当您寻求阿里云的技术支持时,如果技术支持过程中需要对您的数据库实例进行操作,您需要授权,技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后,临时服务账号会被自动删除。在没有经过您授权 服务账号 的情况下,阿里...

服务授权

当您寻求阿里云的技术支持时,如果技术支持过程中需要对您的数据库实例进行操作,您需要授权,技术支持人员才可以通过服务账号提供技术支持服务。在授权有效期结束后,临时服务账号会被自动删除。在没有经过您授权 服务账号 的情况下,阿里...

产品优势

无锁备份 利用底层分布式存储的快照技术,只需分钟级别即可完成对上TB数据量大小的数据库的备份,且整个备份过程不需要加锁,效率更高,影响更小。开始使用PolarDB PolarDB MySQL版快速入门 PolarDB PostgreSQL版快速入门 PolarDB ...

产品优势

无锁备份 利用底层分布式存储的快照技术,只需分钟级别即可完成对上TB数据量大小的数据库的备份,且整个备份过程不需要加锁,效率更高,影响更小。跨机并行查询 支持跨机并行查询计算引擎,多个节点跨机并行执行SQL,充分发挥所有计算节点...

上海新能源汽车车辆基础数据

2019年开始上海市新能源汽车大数据平台从自建Hadoop集群迁移至阿里云Lindorm+DLA Spark产品,有效解决了我们平台存储和计算的横向动态扩容瓶颈,同时借助其产品中间件LTS实现了我们平台数据的冷热分离,有效降低了数据存储成本,依托于阿里...

操作指南

一、数据专家服务流程指南 二、服务流程说明 用户可以根据自己实际需要,提前或者在问题发生时购买数据专家服务,服务项包含大数据技术架构方案咨询、数据解决方案POC、数据搬站迁云方案咨询、跨地域迁移支持服务、数据专家高阶...

产品概述

什么是PolarDB PolarDB 是阿里巴巴自研的新一代云原生数据库,在计算存储分离架构下,利用了软硬件结合的优势,为用户提供具备极致弹性、高性能、海量存储、安全可靠的数据库服务。100%兼容MySQL和PostgreSQL生态,高度兼容Oracle语法。...

客户案例

价值体现 DeNA中国是游戏行业首家应用闪电立方+MMA工具项目,在无专线等环境下,1个多月就完成10年增量RDS库300TB+历史数据50TB的数据迁移,具备较高的技术复杂度。相较之前客户基于python开源的airflow任务管理系统来说,DataWorks拥有...

什么是EMR on ACK

阿里云E-MapReduce(简称EMR)on ACK提供了全新构建大数据平台的方式。您可以将开源大数据服务部署在阿里云容器服务Kubernetes版(ACK)之上,利用ACK在服务部署和容器应用管理的优势,减少对底层集群资源的运维投入,以便于您可以更加专注...

DataWorks模块使用说明

使用流程概览:参考文档:数据集成概述 数据建模与开发 子模块:数据建模 功能说明:数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行...

X-Engine简介

Engine:An Optimized Storage Engine for Large-scale E-Commerce Transaction Processing》,在数据管理国际会议SIGMOD'19发表,这是中国内地公司首次在国际性学术会议上发表OLTP数据库内核相关的技术成果。技术特点 利用FPGA硬件加速...

银泰商业

到2019年,随着银泰业务的持续发展,IDC中残余的少量数据库资源对系统的性能及稳定性带来了很大的威胁,于是银泰寻求快速云化的方案,最终在2019年9月份实现了数据库的100%云化。业务挑战 以前进行核心交易库从Oracle转成云上MySQL,投入的...

概述

数据内容安全管理 安全中心提供的数据分级分类、敏感数据识别、数据访问审计、数据源可追溯等功能,在处理业务流程的过程中,能够快速及时识别存在安全隐患的数据,保障了数据内容的安全可靠,详情请参见 数据保护伞。安全诊断的最佳实践 ...

通过RAM角色授权模式配置数据

某企业有100个Bucket,存放该企业的所有数据,但大数据团队只需要使用其中两个Bucket的数据。如果使用预设的 AliyunDataWorksAccessingOSSRole 角色,可能导致其它98个Bucket被大数据团队访问,存在管理风险。因此,云账号负责人可以为...

管理数据

更多操作 批量管理数据需要大规模调整多个数据域下的资产时,您可以使用批量导入功能。通过下载并修改数据域模板文件,快速管理数据域。仅支持阿里云账号和具有 AliyunYundunSDDPFullAccess 权限的RAM用户使用该功能。登录 数据安全中心...

用户价值

数据开发更简单:平台提供的各种工具产品能够极大的简化数据开发过程,缩短数据治理周期,降低数据治理成本。通过标准化、精细化、规格化的智能数据生产流程,完成流水线式的数据生产作业,提升数据资源生产效率、消除数据供应品质差异。...

产品功能

高效压缩存储 TSDB 使用高效的数据压缩技术,将单个数据点的平均使用存储空间降为1~2个字节,可以降低90%存储使用空间,同时加快数据写入的速度。时序数据计算能力 TSDB 提供专业全面的时序数据计算函数,支持降采样、数据插值和空间聚合...

导入数据至维表

创建完成维表后,您可以在维表中直接写入数据,也可以导入电子表格、本地CSV文件和Excel文件的数据至维表,为后续数据分析做准备。前提条件 已创建完成一个维表,详情请参见 创建维表。操作步骤 在 维表 页面,单击 全部维表 下相应的 文件...

IoT数据自动化同步至云端解决方案

背景信息 物联网(The Internet of Things,简称IoT)是指通过信息传感器等各种装置和技术,实时采集任何需要的信息。通过各类网络的接入,实现物与物、物与人的连接,实现对物品和过程的智能化感知、识别和管理。物联网、大数据和云计算...

适配组件数据

数据看板创建完成后,您可以根据实际需要通过以下方式修改组件数据内容。背景信息 本文以使用 静态数据源 为例,因此可以直接在组件的数据源配置区域粘贴准备好的数据。如果您的数据源为 CSV文件、数据库 等其他类型的数据需要首先 添加...

新建自定义数据

下文以自定义的mysql5数据源类型为例,mysql5数据源类型为RDBMS数据库类型,需要配置的数据源信息为链接地址、用户名和密码。在新建mysql5数据源对话框中,配置连接信息。参数 描述 数据源名称 填写数据源名称。数据源名称由汉字、数字、...

创建SAP HANA数据

通过创建SAP HANA数据源能够实现Dataphin读取SAP HANA的业务数据或向SAP HANA写入数据。本文为您介绍如何创建SAP HANA数据源。背景信息 SAP HANA是一款具有高性能内存的应用平台。如果您使用的是SAP HANA,在对接Dataphin进行数据开发或将...

DataWorks数据集成

对于数据导出,请登录 AnalyticDB PostgreSQL版 的管理控制台进行IP 白名单设置,详情请参见 添加白名单 数据导入 源端的数据需要在DataWorks管理控制台进行添加,数据源添加的详细步骤请参考 配置AnalyticDB for PostgreSQL数据源 配置...

创建Vertica数据

通过创建Vertica数据源能够实现Dataphin读取Vertica的业务数据或向Vertica写入数据。本文为您介绍如何创建Vertica数据源。背景信息 Vertica是一款基于列存储架构的数据库。如果您使用的是Vertica,在对接Dataphin进行数据开发时,您需要先...

创建Vertica数据

通过创建Vertica数据源能够实现Dataphin读取Vertica的业务数据或向Vertica写入数据。本文为您介绍如何创建Vertica数据源。背景信息 Vertica是一款基于列存储架构的数据库。如果您使用的是Vertica,在对接Dataphin进行数据开发时,您需要先...

创建OceanBase数据

通过创建OceanBase数据源能够实现Dataphin读取OceanBase的业务数据或向OceanBase写入数据。本文为您介绍如何创建OceanBase数据源。背景信息 OceanBase即阿里云数据库OceanBase,是阿里巴巴和蚂蚁金服100%自主研发的金融级分布式关系数据库...

复制数据库SQL Server 2008 R2版

若您需要创建一个与现有数据数据完全相同的数据库,您可以使用复制数据库的方式。本文介绍如何通过RDS控制台复制并创建新的数据库。前提条件 实例版本为SQL Server 2008 R2。说明 SQL Server 2008 R2(本地盘)实例支持通过RDS控制台复制...

未来规划

数据处理与分析:海量数据分析在线化(实时在线交互式分析)。如何对海量数据进行在线分析和计算,支持实时在线交互式分析,需要做并行处理(DSP 模型、MPP 模型等等),对并行调度计算进行优化。系统能力提升:智能化+安全(使用方便可靠...

创建IBM DB2数据

通过创建IBM DB2数据源能够实现Dataphin读取IBM DB2的业务数据或向IBM DB2写入数据。本文为您介绍如何创建IBM DB2数据源。背景信息 IBM DB2是一套关系型数据库管理系统。如果您使用的是IBM DB2,在对接Dataphin进行数据开发时,您需要先...

大数据安全治理的难点

需要了解哪些资产需要被保护、资产存在的风险、企业/组织是否合规、如何处理内放攻防、如何落地安全运营等关键问题,才能有效落地数据安全治理。同时,大数据系统基于“存储、用户、入口、流转、交付”等多方面的特点,存在诸多安全治理...

新建自定义数据

下文以自定义的mysql5数据源类型为例,mysql5数据源类型为RDBMS数据库类型,需要配置的数据源信息为链接地址、用户名和密码。在新建mysql5数据源对话框中,配置连接信息。参数 描述 数据源名称 填写数据源名称。数据源名称由汉字、数字、...

创建OceanBase数据

通过创建OceanBase数据源能够实现Dataphin读取OceanBase的业务数据或向OceanBase写入数据。本文为您介绍如何创建OceanBase数据源。背景信息 OceanBase即阿里云数据库OceanBase,是阿里巴巴和蚂蚁金服100%自主研发的金融级分布式关系数据库...

数据质量教程概述

在整体数据链路的处理过程中,为保证最终产出数据的质量,您需要数据仓库ODS、CDM和ADS层的数据分别进行监控。数据仓库分层的定义请参见 数仓分层。本教程基于 搭建互联网在线运行分析平台 教程,ods_user_trace_log、dw_user_trace_log...

创建PolarDB-X数据

通过创建PolarDB-X数据源能够实现Dataphin读取PolarDB-X的业务数据或向PolarDB-X写入数据。本文为您介绍如何创建PolarDB-X数据源。背景信息 PolarDB-X(原DRDS升级版)是由阿里巴巴自主研发的云原生分布式数据库。如果您使用的是PolarDB-X...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用