大数据指的是什么

_相关内容

数据治理

数据地图 为什么数据地图数据总览页存储量和存储趋势图相差较?数据地图血缘展示延迟问题 数据地图新建表搜不到 当前表业务逻辑变更如何通知下游?哪些类型的Hive表支持在数据地图中预览?数据保护伞 数据保护伞为什么有时候查询脱敏有...

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用的抽象)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况进行纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念层次归类,目的是便于...

划分数据

数据仓库是面向主题(数据综合、归类并进行分析利用)的应用。数据仓库模型设计除横向的分层外,通常也需要根据业务情况纵向划分数据域。数据域是联系较为紧密的数据主题的集合,是业务对象高度概括的概念,目的是便于管理和应用数据。通常...

功能特性

数据迁移 数据迁移功能帮助您实现同构或异构数据源之间的数据迁移,适用于数据上云迁移、阿里云内部跨实例数据迁移、数据库拆分扩容等业务场景 功能集 功能 功能描述 参考文档 同构迁移 逻辑迁移 支持同构数据库间的数据迁移。自建MySQL...

常见问题

离线同步常见问题 离线同步任务运维常见问题 为什么数据源测试连通性成功,但是离线同步任务执行失败?如何切换数据集成任务执行资源组?脏数据如何排查和定位?如何查看脏数据?如果离线同步传输数据时,脏数据超出限制,是否所有数据都...

Schema约束

在Lindorm时序引擎中的Schema约束指的是以下行为:校验数据写入的目标表是否存在 校验数据写入的标签(Tag)或量测值(Field)是否已预先定义 校验数据写入的数据类型与预先定义的数据类型是否一致 保障数据查询时字段返回类型的一致性 ...

数据扫描和识别

DSC对结构化数据(例如MaxCompute)的扫描机制是什么?DSC是否会登录到数据库内获取数据?目前存在哪些触发重新扫描的场景?数据扫描会影响我的数据库性能吗?数据安全中心(Data Security Center,简称DSC)采用全量扫描、增量扫描和定时...

数据组织优化

Clustering 当前痛点 Transactional Table 2.0支持分钟级近实时增量数据导入,高流量场景下可能会导致增量小文件数量膨胀,从而引发存储访问压力、成本高,并且大量的小文件还会引发Meta更新以及分析执行慢,数据读写I/O效率低下等问题,...

产品概述

什么是E-MapReduce 开源大数据开发平台E-MapReduce(简称EMR),是运行在阿里云平台上的一种大数据处理的系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理...

DataWorks On CDP/CDH使用说明

一、数据集成 DataWorks的数据集成模块为您提供读取和写入数据至CDP/CDH Hive、CDP/CDH HBase的能力,您需要将Hive或HBase组件创建为 DataWorks的 Hive或HBase数据源,实现将其他数据源的数据同步至Hive或HBase数据源,或将Hive或HBase数据...

JindoFS介绍和使用

JindoFS是基于阿里云对象存储OSS,为开源大数据生态构建的Hadoop兼容文件系统(Hadoop Compatible File System,HCFS)。JindoFS提供兼容对象存储的纯客户端模式(SDK)和缓存模式(Cache),以支持与优化Hadoop和Spark生态大数据计算对OSS...

数据任务概述

Dataphin补数据任务可以对历史数据进行补数,将数据写入至对应时间分区。代码中若使用调度参数,则该参数将根据补数据时选择的业务日期自动替换为具体值,结合业务代码将对应时间数据写入对应分区。帮助您对数据中缺失、错误、重复或不完整...

数据任务概述

Dataphin补数据任务可以对历史数据进行补数,将数据写入至对应时间分区。代码中若使用调度参数,则该参数将根据补数据时选择的业务日期自动替换为具体值,结合业务代码将对应时间数据写入对应分区。帮助您对数据中缺失、错误、重复或不完整...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

如何处理Tair集群数据倾斜

什么会产生数据倾斜 Tair 集群架构作为一个分布式系统,整个数据库空间会被分为16384个槽(Slot),每个数据分片节点将存储与处理指定Slot的数据(Key),例如3分片集群实例,3个分片分别负责的Slot为:[0,5460]、[5461,10922]、[10923,...

如何处理Redis集群数据倾斜

什么会产生数据倾斜 Redis 集群架构作为一个分布式系统,整个数据库空间会被分为16384个槽(Slot),每个数据分片节点将存储与处理指定Slot的数据(Key),例如3分片集群实例,3个分片分别负责的Slot为:[0,5460]、[5461,10922]、[10923,...

数据服务

什么数据服务无法连接ECS自建的数据库?是否必须开通API网关?如何配置数据源?数据服务是否支持MaxCompute(ODPS)数据源?向导模式生成API与脚本模式有何功能差异?数据服务中的API分组的作用是什么,与API网关中的分组有什么关联?...

数据库代理常见问题

数据库代理是什么架构?有故障切换机制吗?代理个数和代理规格是什么关系?代理个数和代理地址个数有关系吗?数据库代理的性能会随着代理地址的增多而提升吗?数据库代理对用户的连接数有限制吗?使用数据库代理地址连接时报超时错误怎么办...

确认表血缘

任务配置上下游节点依赖前,您需先确认当前节点的表血缘关系(例如,表数据间的血缘关系、表产出的分区数据),基于血缘关系配置节点的调度依赖。本文为您介绍如何确认表血缘,以及未基于表血缘配置节点依赖的影响。背景信息 确认表血缘,...

名词解释

概念 说明 地域 地域(Region)是您所购买的图数据库GDB实例的服务器所处的地理位置。需要在开通图数据库GDB实例时指定地域,购买实例后暂不支持更改。可用区 可用区是在同一地域下具有独立电力和网络的物理区域。可用区内以及可用区...

常见问题

数据迁移和数据同步的区别如下表所示:对比项 数据迁移 数据同步 适用场景 主要用于上云迁移,例如将本地数据库、ECS上的自建数据库或第三方云数据库迁移至阿里云数据库。主要用于两个数据源之间的数据实时同步,适用于异地多活、数据灾备...

数据加工过程卡点校验

本文为您介绍在线或离线业务系统的数据在生成过程中进行的卡点校验。在线系统卡点校验 在线业务系统产生的数据数据仓库的重要数据来源。在线业务系统复杂多变,每次变更都会产生数据的变化。因此,数据仓库需要适应多变的业务发展,及时...

购买流程

说明 数据流量是客户端从订阅通道中消费的数据总量,按1元/GB计费,不足1GB,按1GB计算。适合数据量较小的订阅实例。选择为 半价配置费+1元/GB数据流量费,从2020年12月18日开始,DTS会对该订阅任务额外收取数据流量费用。源实例地域-...

恢复全量数据

什么数据库恢复要收费?由于数据是恢复到新实例上,因此需要收取新实例费用,费用详情可在创建实例时查看。说明 如临时使用,您可以创建按量付费或Serverless的新实例,把数据 迁移到原实例,然后 释放新实例。实例创建完成后开始计费。...

计费模式

本文介绍数据湖构建中各资源的计费规格,包括入湖作业资源用量、数据存储对象和元数据请求三部分。计量计费项 重要 DLF产品目前所有功能为 0折扣活动阶段,即使超过免费阶梯限定后,目前也均不会产生实际计费。元数据对象的存储量 元数据...

DELETE

DELETE 用于删除表中的数据。注意事项 执行 DELETE 命令时,表中必须存在主键。DELETE 暂不支持使用表的别名。不建议通过 DELETE 命令删除全表、全分区的数据,建议使用 TRUNCATE TABLE、TRUNCATE TABLE PARTITION 命令,详情请参见 ...

新建数据处理任务

系统提供数据处理能力,包括倾斜数据处理、地形数据处理、三维模型处理、影像优化处理。本文以新建倾斜数据处理任务为例,介绍如何新建数据处理任务。前提条件 已添加空间元数据,具体操作,请参见 添加数据。已添加OSS类型云计算资源。...

常见问题

如果实时同步延迟较(延迟大于5秒),请根据您的业务场景选择合适的优化方式:数据基本没有更新,同时数据是整行写入的(一行数据不会分批次写入):请联系Lindorm技术支持(钉钉号:s0s3eg3)修改配置。每次写入过程中,不做并发检查,...

新建 PolarDB-X 2.0 数据

背景信息 云原生数据库 PolarDB 分布式版(简称 PolarDB-X)是由阿里巴巴自主研发的云原生分布式数据库,为您提供高吞吐、存储、低延时、易扩展和超高可用的云时代数据库服务。详情请参见 什么是云原生数据库 PolarDB 分布式版。前提条件...

简介

HBase Ganos是什么 HBase Ganos是阿里云推出的一款包含管理 空间几何数据、时空轨迹、专题栅格、遥感影像的时空大数据引擎系统。系统兼容开源GeoMesa、GeoServer等生态,内置了高效的时空索引算法、空间拓扑几何算法、遥感影像处理算法等,...

PolarDB PostgreSQL版(兼容Oracle)间的迁移

通过数据传输服务DTS(Data Transmission Service),可以实现 PolarDB PostgreSQL版(兼容Oracle)集群间的迁移。背景信息 PolarDB PostgreSQL版(兼容Oracle)作为一款企业级关系型数据库管理系统,具有广泛的应用和强大的社区支持。每个...

文档修订记录

Check节点 2024.1.12 新增功能 最佳实践 新增DataWorks大数据安全治理实践新增指南,为您介绍数据安全治理的常见思路、DataWorks产品的安全能力,以及在DataWorks上基于“基础防护建设”、“数据安全防护措施”、“数据安全持续运营”三个...

Tunnel命令常见问题

java.io.IOException:Error writing request body to server 产生原因 这是上传数据到服务器时产生的异常,通常是因为上传过程中的网络连接断开或超时导致的:当您的数据源并非是本地文件,需要从数据库等地方获取时,数据在写入的过程中还...

什么是数据库代理

数据库代理概述 RDS PostgreSQL数据库代理是位于数据库服务端和应用服务端之间的网络代理服务,用于代理应用服务端访问数据库时的所有请求。您可以连接数据库代理访问地址使用数据库代理的各项功能,以简化RDS PostgreSQL数据库实例的连接...

SQL洞察

语句是什么?A:logout!是连接断开。logout!的耗时,是上一次交互时间到 logout!发生时间的差值,可以理解为连接空闲的时长。状态 列的 1158 是网络链接断开,其可能的原因是:客户端连接超时。服务端异常断开。服务端连接Reset...

新功能发布记录

开启安全访问代理 接入达梦数据库 新增 全面直接接入达梦数据库(DM),包括数据导入、数据查询、数据变更、数据导出、数据服务与数据可视化等功能。支持的数据库类型与功能 数据类目 新增 对表进行分类,便于管理人员、开发人员及运维人员...

PolarDB PostgreSQL版间的迁移

通过数据传输服务DTS(Data Transmission Service),可以实现 PolarDB PostgreSQL版 集群间的迁移。前提条件 已创建源和目标 PolarDB PostgreSQL版 数据库集群,详情请参见 创建PolarDB PostgreSQL版数据库集群。已将源和目标 PolarDB ...

整体架构

云原生数据仓库AnalyticDB MySQL版 是阿里巴巴自主研发、经过超大规模以及核心业务验证的PB级实时数据仓库。概述 自2012年第一次在集团发布上线以来,AnalyticDB MySQL版 至今已累计迭代发布近百个版本,支撑起集团内的电商、广告、物流、...

概述

DataWorks(数据工场,原大数据开发套件)是阿里云重要的PaaS(Platform-as-a-Service)平台产品,为您提供 数据集成、数据开发、数据地图、数据质量 和 数据服务 等全方位的产品服务,一站式开发管理的界面,帮助企业专注于数据价值的挖掘...

MySQL数据

MySQL数据源为您提供读取和写入MySQL的双向通道,本文为您介绍DataWorks的MySQL数据同步的能力支持情况。支持的MySQL版本 离线读写:支持MySQL 5.5.x、MySQL 5.6.x、MySQL 5.7.x、MySQL 8.0.x,兼容 Amazon RDS for MySQL、Azure MySQL。离...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用