大数据通过什么

_相关内容

数据模型

场景示例 某风力电厂包含一系列的智能风力发电机设备,创建名为 Wind-generators 的table来存储所有设备的信息,设备由 ID、型号、厂商 等Tag信息描述,每个设备会持续上报 功率、风速 等Field指标,指标数据通过时序数据库的API实时写入到...

产品简介

开源大数据开发平台E-MapReduce(简称EMR)是运行在阿里云平台上的一种大数据处理系统解决方案。EMR基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统分析和处理数据。EMR还可以与阿里云...

查看敏感数据识别结果

仅支持在 结构化数据、半结构化数据、非结构化数据 或 大数据 分类下分别选择一个或多个数据类型,不支持跨分类同时选择多个数据类型。如果您未选中任意数据类型,数据安全中心默认展示所有数据类型下的敏感数据识别结果。数据模板:在 ...

数据类型版本说明

MaxCompute目前提供了三种不同类型的数据类型版本,包括1.0数据类型、2.0数据类型以及Hive兼容数据类型,您...建立1.0数据类型的表,将2.0数据类型的表中数据通过CAST函数导入1.0数据类型的表,即可将2.0数据类型的数据转化为1.0数据类型。

限制说明

数据大小 云数据库 Memcache 版支持的单条缓存数据的 Key 最大不超过 1 KB,Value 最大不超过 1 MB,过数据不适合存储。事务支持 云数据库 Memcache 版不支持事务,有事务性要求的数据不适合写入,而应该直接写入数据库。使用场景 当...

常见问题

如何理解开源与云原生的大数据技术与产品?MaxCompute作为大数据平台,对业务数据是否有好的监控手段?MaxCompute的项目发挥什么作用?如何获取MaxCompute中的Accesskey_ID和AccessKey_Secret?现有账号的AccessKey被禁用,创建一个新的...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件 在进行本实验前,请确保已完成 采集数据 和 加工数据。已通过数据集成将存储于RDS MySQL的用户基本信息(ods_user_info_d)同步至MaxCompute的ods_user_info_d表。已通过数据集成将...

配置数据质量监控

本文为您介绍如何通过数据质量实现表数据监控。前提条件 在进行本实验前,请确保已完成 采集数据 和 加工数据。已通过数据集成将存储于RDS MySQL的用户基本信息(ods_user_info_d)同步至MaxCompute的ods_user_info_d表。已通过数据集成将...

产品架构

DTS服务端的日志拉取模块主要实现从数据源抓取原始数据通过解析、过滤、标准格式化等流程,最终将增量数据在本地持久化。日志抓取模块通过数据库协议连接并实时拉取源实例的增量日志。例如源实例为RDS MySQL,那么数据抓取模块通过Binlog...

升级数据库版本

本文介绍云数据库MongoDB支持升级的数据版本以及如何升级数据版本。注意事项 升级分片集群实例的数据版本时,实例的协议类型需为 MongoDB协议。升级采用轮转升级的方式进行,升级过程中会自动对实例进行2~3次重启,请在业务低...

数据洞察

DataWorks数据洞察是指通过深度数据分析和解读来获取深刻的数据理解和发现,它支持数据探索和可视化。您可以通过数据洞察了解数据分布,创建数据卡片,并组合成数据报告。此外,数据洞察结果能够通过长图形式的报告进一步分享。该功能利用...

数据源概述

说明 数据同步基于数据源控制任务读写端数据库,您需要在数据集成同步任务配置前,配置好您需要同步的源端和目标端数据库或数据仓库的相关信息,以便在同步过程中,可通过选择数据源名称来控制同步读取和写入的数据库或数据仓库。...

备份集查询功能概览

背景信息 传统的备份数据查询有两种方式:将备份数据文件导入至数据库,再通过数据库操作对数据进行查询,但是这种方式耗费时间长,且可能会导致数据文件被修改。通过 Hive 的方式直接对文件进行查询,但是这种方式对数据文件格式有严格的...

什么是备份数据

名词解释 备份数据量,是指通过DBS备份链路的数据量。常见概念 在数据库备份DBS业务场景下,含有常见以下几个概念:数据库磁盘空间、数据文件空间、备份数据量、存储数据量等。概念 说明 数据库磁盘空间 数据库磁盘空间由数据库的数据文件...

大数据安全治理的难点

企业可通过什么手段来识别、预判风险的存在?风险评估的意义在于让组织的各业务方明确手头资产的风险所在,有利于高层以此推动落地安全项目。通过风险评估后,组织还可以根据评估结果对不同风险采取差异化的应对策略:风险缓解(Risk ...

敏感数据溯源

DataWorks的数据溯源功能,支持通过提取数据泄露文件中数据的水印信息,帮助您定位到可能会泄露目标数据的责任人。本文为您介绍如何创建溯源任务,并通过该任务查找可能会泄露数据的责任人。前提条件 已创建 数据识别规则,详情请参见 配置...

导入与导出

数据同步过程中,可以修改源表中的字段类型,目前仅支持整型数据类型之间、浮点数据类型之间的列类型更改,并且只能将取值范围小的数据类型更改为取值范围数据类型,或者将单精度数据类型更改为双精度数据类型。整型数据类型:支持...

数据可视化展现

本文为您介绍如何通过DataWorks数据分析实现用户画像数据可视化展示。前提条件 在开始试验前,请确认您已经完成了 加工数据。即已通过数据开发DataStudio将数据加工为用户画像基本数据数据分析场景 本案例通过数据分析对用户画像数据进行...

云产品集成

大数据开发治理平台 DataWorks DataWorks 是一款为数据仓库、数据湖、湖仓一体等解决方案提供统一的全链路大数据开发治理平台。您可以使用 DataWorks 添加 ApsaraDB For OceanBase 数据源,管理 OceanBase 数据库中的数据通过数据集成...

集成与开发概览

您可以通过流批一体的数据集成对在线数据进行入仓、加工处理,通过数据开发模块对数仓数据进行分层开发,之后结合数据服务和可视化能力对外提供数据使用和分析服务。您也可以将这些功能作为基础能力集成到您自己的数据平台中使用,建设属于...

观远BI连接MaxCompute

MaxCompute支持您将MaxCompute项目数据接入观远BI,帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析工作以及制作数据卡片和数据看板。本文为您介绍如何通过MaxCompute JDBC驱动,连接观远BI和MaxCompute项目,并进行可视化...

实验介绍

数据加工 使用 DataWorks数据开发(DataStudio)模块,将日志数据通过函数正则等方式拆解为可分析字段,并与用户信息表加工汇总产出基本的用户画像数据,并提交调度系统,结合DataWorks调度参数实现周期性数据清洗操作。学习如下内容:如何...

数据库管理常见问题

通过控制台创建数据库与使用SQL创建数据库有什么区别?通过控制台创建数据库与使用SQL创建数据库本身并无区别,但是通过控制台创建时,可以同时给指定账号授予权限,操作更加便捷。为什么查询数据库列表时页面报错?该查询操作需要连接到您...

自媒体:易撰

所属行业:自媒体 网站地址:易撰 客户介绍 长沙营智信息技术有限公司是专业的新媒体大数据服务商,其旗下知名品牌易撰,基于新媒体大数据挖掘技术及NLP算法分析,为各内容创客、广告主提供全面、科学、精准的大数据分析服务以及大数据架构...

管理问题数据

数据质量支持您保留数据质量监控过程中从数据表中发现的非预期数据,帮助您快速排查、定位问题,提升数据质量。本文为您介绍如何管理数据质量监控过程中从数据表中发现的非预期数据。背景信息 问题数据数据质量支持在部分规则校验不通过...

通用数据查询与管理

如果需要快速地查找数据,例如查找工作空间、数据源中的表、数据分析和数据服务中的代码或API,您可以在数据地图中进行查找。进入数据地图 登录 DataWorks控制台,切换至目标地域后,单击左侧导航栏的 数据治理>数据地图,在右侧页面中单击...

创建IBM DB2数据

通过创建IBM DB2数据源能够实现Dataphin读取IBM DB2的业务数据或向IBM DB2写入数据。本文为您介绍如何创建IBM DB2数据源。背景信息 IBM DB2是一套关系型数据库管理系统。如果您使用的是IBM DB2,在对接Dataphin进行数据开发时,您需要先...

数据保护伞概述

数据保护伞是一款数据安全管理产品,为您提供数据发现、数据脱敏、数据水印、访问控制、风险识别、数据溯源等多种功能,帮助您快速梳理敏感数据并进行安全管控,保障数据安全。本文为您介绍数据保护伞的使用流程、使用限制等内容。使用流程...

DataWorks数据集成

对于数据导出,请登录 AnalyticDB PostgreSQL版 的管理控制台进行IP 白名单设置,详情请参见 添加白名单 数据导入 源端的数据源需要在DataWorks管理控制台进行添加,数据源添加的详细步骤请参考 配置AnalyticDB for PostgreSQL数据源 配置...

创建Microsoft SQL Server数据

通过创建Microsoft SQL Server数据源能够实现Dataphin读取Microsoft SQL Server的业务数据或向Microsoft SQL Server写入数据。本文为您介绍如何创建Microsoft SQL Server数据源。前提条件 若您需在Dataphin中创建基于阿里云产品的数据源,...

产品优势

智能化 运用大数据和机器学习能力,通过智能化的算法,对敏感数据和高风险活动,例如数据异常访问和潜在的泄露风险进行有效识别和监控,并提供修复建议。可视化 提供敏感数据识别结果可视化能力,让企业数据安全现状一目了然。提供动态可视...

快速体验

数据加工 使用 DataWorks数据开发(DataStudio)模块,将日志数据通过函数正则等方式拆解为可分析字段,并与用户信息表加工汇总产出基本的用户画像数据,并提交调度系统,结合DataWorks调度参数实现周期性数据清洗操作。学习如下内容:如何...

创建并管理数据

若您想在DataWorks操作您的数据库或数据仓库(例如,MaxCompute项目数据),需先在DataWorks的数据源管理页面,将数据库或数据仓库创建为DataWorks的数据源,并将该数据源绑定至DataWorks相应的功能模块使用。例如,同步MaxCompute数据前,...

创建Aliyun HBase数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 服务类型 根据数据源HBase选择...

创建IBM DB2数据

通过创建IBM DB2数据源能够实现Dataphin读取IBM DB2的业务数据或向IBM DB2写入数据。本文为您介绍如何创建IBM DB2数据源。背景信息 IBM DB2是一套关系型数据库管理系统。如果您使用的是IBM DB2,在对接Dataphin进行数据开发时,您需要先...

开发管控:管理者

通过操作审计查询行为事件日志 数据脱敏及泄露数据溯源 为防止重要文件泄露,您可通过数据保护伞的脱敏配置,对重要数据设置脱敏规则,并依据数据水印功能对泄露数据进行溯源。说明 仅 空间管理员 或 安全管理员 角色的用户,以及拥有 ...

创建Tablestore数据

说明 通常情况下,生产数据源和开发数据源需配置非同一个数据源,以使开发数据源与生产数据源的环境隔离,降低开发数据源对生产数据源的影响。但Dataphin也支持配置成同一个数据源,即相同参数值。参数 描述 Endpoint 即实例访问地址。推荐...

创建Microsoft SQL Server数据

通过创建Microsoft SQL Server数据源能够实现Dataphin读取Microsoft SQL Server的业务数据或向Microsoft SQL Server写入数据。本文为您介绍如何创建Microsoft SQL Server数据源。使用限制 Dataphin仅支持 超级管理员、数据源管理员、板块...

功能简介

数据同步为用户提供批量、实时多源异构数据的便捷同步或接入能力,系统提供完善的数据接入配置、任务运行监控等功能,有效保障数据接入的稳定性和可控性,满足各类平台、数据源及应用系统间的数据汇聚需求。通过数据同步的自定义同步任务...

数据质量教程概述

数据质量是数据分析结论有效性和准确性的基础。本文为您介绍数据质量保障教程的业务场景以及如何衡量数据质量的高低。前提条件 在开始本教程前,请您首先完成 搭建互联网在线运行分析平台 教程,详情请参见 业务场景与开发流程。业务场景 ...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用