元数据什么意思

_相关内容

元数据仓库共享模型概述

Dataphin元数据仓库(简称:仓),是统一管理Dataphin内部业务元数据和相应计算引擎元数据数据仓库,存在于Dataphin仓租户中(OPS租户)的一个Dataphin项目空间中,由一系列的周期性数据集成节点、SQL脚本节点、Shell节点组成。...

数据湖管理FAQ

元数据发现相关问题 为什么配置了信息发现,并在“手动执行”之后,过了几天新的数据看不到了?OSS数据源配置数仓模式和自由模式的差异以及适用场景是什么?为什么Excel导出的CSV文件没有被识别建表?为什么一个目录下面是同样Schema的...

使用DLA分析OSS中的事件

更多信息,请参见 什么是云原生数据湖分析。使用DLA分析OSS中事件的原理如下:通过操作审计创建跟踪,将事件持续投递到OSS存储空间。将事件从OSS存储空间导入DLA。DLA将OSS存储空间内以Array形式保存的多条日志记录拆分为多条数据,以JSON...

EMR元数据迁移DLF最佳实践

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持多源数据入湖以及一站式数据探索的能力。本方案支持已有EMR集群元数据库使用RDS或内置MySQL数据库迁移DLF,通过统一的元数据管理,多种数据源入湖...

常见问题

ClickHouse中Shard和Replica是什么意思?如何进行性能测试?集群创建后,是否还能修改Shard和Replica?EMR ClickHouse中使用HDFS时的配置有哪些?EMR ClickHouse与云数据库ClickHouse产品有哪些区别?ClickHouse是否支持查询使用DLF元数据...

数据索引

数据索引是OSS对外提供的文件(Object)元数据索引能力。您可以利用Object的元数据自定义索引的条件,从而快速获取Object列表。数据索引可以帮助您更好地管理与了解数据结构,方便您后续查询、统计和管理Object。使用场景 基于数据审计或者...

新旧版本使用指引

更新数据集 UpdateSet-更新媒体集的显示名称 GetDataset-查询数据集信息 GetSet-获取媒体集信息 ListDatasets-列出数据集 ListSets-获取媒体集列表 DeleteDataset-删除数据集 DeleteSet-删除媒体集 元数据索引 IndexFileMeta-文件信息...

EMR元数据迁移到数据湖构建(DLF)

本文为您介绍如何将Hive MetaStore存储在MySQL、RDS中的元数据迁移到DLF中,并介绍如何在EMR集群中配置使用DLF作为数据湖统一元数据。适用场景 从其他大数据集群迁移到阿里云E-MapReduce产品。从阿里云EMR老集群(MySQL做元数据),整体...

元数据管理常见问题

本文介绍使用智能媒体管理过程中可能遇到的元数据管理相关的问题。什么是工作流模板?工作流模板(Template)定义了部分接口所需要执行的工作流。在创建智能媒体管理项目、数据集时,可以设置工作流模板ID(TemplateId)。在为存储在阿里云...

数据管理DMS中重新加载库表结构的元数据说明

概述 本文主要介绍数据管理DMS中,为什么需要重新加载库表结构的元数据。详细信息 通过数据管理DMS登录某个数据库实例时,DMS会加载该实例当前的数据库、表等元数据的结构信息。例如,数据库的名称列表、表的名称列表、当前表的结构字段、...

API概览

元数据 API 标题 API概述 目录 目录 CreateCatalog 创建数据数据目录 创建数据数据目录。DeleteCatalog 删除数据数据目录 删除数据目录。UpdateCatalog 更新目录 更新数据目录内容。ListCatalogs 获取数据目录列表 分页查询,获取...

管理元数据

本文为您介绍如何新建元数据、编辑元数据、检测元数据、转交负责人及删除元数据。介绍页面 在Dataphin首页,单击顶部菜单栏的 资产。在 资源 页面,按照下图操作指引,进入 元数据管理 页面。在 元数据管理 页面,查看系统元数据及自定义的...

管理元数据

本文为您介绍如何新建元数据、编辑元数据、检测元数据、转交负责人及删除元数据。介绍页面 在Dataphin首页,单击顶部菜单栏的 资产。在 资源 页面,按照下图操作指引,进入 元数据管理 页面。在 元数据管理 页面,查看系统元数据及自定义的...

元数据管理

元数据管理是构建数据湖重要一环,通过有效集中式的元数据管理,可以提升数据资产价值。您可以使用该功能管理元数据库和元数据表。创建元数据库 登录 数据湖管理控制台,选择 元数据 目录下的 元数据管理。单击 新建数据库。配置元数据库...

元数据抽取

在业务运行中,经常会沉淀到大量数据数据湖中这部分数据可能是没有像数据仓库一样经过严格的数据管理流程或沉淀规范明确的元数据信息。元数据抽取可以分析数据湖中特定格式的数据,并自动生成元数据信息,通过周期性或手动执行,实现数据...

元数据采集

DataWorks数据地图为您提供 元数据采集 功能,方便您将不同系统中的元数据进行统一汇总管理,您可以在数据地图查看从各数据源汇集而来的元数据信息。本文为您介绍如何创建采集器,将各数据源的元数据信息汇集至DataWorks。前提条件 您需要...

数据湖构建的审计事件

数据湖构建已与操作审计服务集成,您可以在操作审计中查询用户操作数据湖构建产生的管控事件。操作审计支持将管控事件投递到日志服务SLS的LogStore或对象存储OSS的存储空间中,满足实时审计、问题回溯分析等需求。操作审计记录了用户通过...

Hive统一元数据

EMR-2.4.0之前版本,所有集群采用的是集群本地的MySQL数据库作为Hive元数据库;EMR-2.4.0及后续版本,E-MapReduce(简称EMR)支持统一的高可靠的Hive元数据库。背景信息 因为元数据库需要使用公网IP来连接,所以集群必须要有公网IP,同时请...

元数据迁移

元数据迁移提供可视化的元数据迁移能力,可以帮您快速的将Hive Metastore的元数据迁移到数据湖构建(DLF)中。前提条件 支持Hive版本:2.3.x 版本。支持元数据库类型:MySQL。创建元数据迁移任务 创建迁移任务 打开 数据湖构建控制台。选择...

迁移元数据上云

元数据存储于RabbitMQ集群的内部数据库,在集群的各个节点之间自动复制。集群内各节点的元数据内容都相同。使用限制 由于RabbitMQ和 云消息队列 RabbitMQ 版 在权限管控机制等方面存在差异,rabbit_version、users、permissions、...

Hive元数据说明

DLF统一元数据 元数据存储在阿里云数据湖构建(Data Lake Formation,简称DLF)中。数据湖构建具有高可用、免运维和高性能等优点,兼容Hive Metastore,无缝对接EMR上开源计算引擎,并支持元数据多版本管理和Data Profile功能。另外,DLF还...

概述

例如相册场景,一个相册创建一个数据集,调用 BatchIndexFileMeta-批量索引文件信息 或者 IndexFileMeta-索引文件信息 接口为照片建立元数据索引,使用人脸聚类功能,将相册中存在相似人脸的多张照片进行分组。具体操作,请参见 创建...

创建元数据

在基于HBase、Elasticsearch或MongoDB数据源创建服务单元之前,需要先创建对应数据源中数据表的元数据,以实现通过元数据确定数据源中数据表的结构。后续您可以通过该元数据读取到对应数据源的数据。本文为您介绍如何创建HBase、...

EMR元数据迁移公告

本文为您介绍迁移E-MapReduce(简称EMR)元数据数据元数据DLF(Data Lake Formation)中的原因及迁移流程。迁移原因 2020年阿里云EMR推出全新的数据湖构建和统一元数据服务,为EMR用户提供了更好的统一元数据服务方案。阿里云EMR团队...

计费模式

本文介绍数据湖构建中各资源的计费规格,包括入湖作业资源用量、数据存储对象和元数据请求三部分。计量计费项 重要 DLF产品目前所有功能为 0折扣活动阶段,即使超过免费阶梯限定后,目前也均不会产生实际计费。元数据对象的存储量 元数据...

EMR+DLF数据湖解决方案

通过EMR+DLF数据湖方案,可以为企业提供数据湖内的统一的元数据管理,统一的权限管理,支持数据湖的多种管理如数据生命周期,湖格式自动优化,存储分析等。同时支持多源数据入湖以及一站式数据探索的能力。本文为您介绍EMR+DLF数据湖方案...

数据目录

什么数据目录(Catalog)数据目录(Catalog)是数据湖构建(Data Lake Formation)的元数据最上层实体,它可以包含多个数据库。适用场景 主要适用于元数据隔离的场景,比如多个E-MapReduce集群,每个集群绑定不同的Catalog,每个EMR集群...

元数据导入

本文介绍如何在 云消息队列 Kafka 版 控制台创建元数据导入任务,将元数据迁移至 云消息队列 Kafka 版 已有实例。前提条件 下载JDK 8 购买并部署云消息队列 Kafka 版实例:购买并部署VPC实例 购买并部署公网/VPC实例 说明 购买实例的规格可...

元数据

元数据用于产品内的展示、检索使用,同时也是敏感数据规则自动化识别的基础信息,也是库、表、字段、数据行、可编程对象等细粒度的权限管控的基础信息。数据管理DMS会根据数据库实例的管控模式提供不同的采集范围与采集方式。背景信息 ...

数据元数据管理

Databricks 数据洞察DBR 7.3,Spark 3.0.1,Scala 2.12及之后版本,在创建集群选择元数据类型时支持数据元数据作为Hive数据库。数据元数据是服务化高可用并且可扩展的元数据库,您无需额外购买独立的元数据库,就可以实现多个引擎计算,...

产品简介

阿里云数据湖构建(Data Lake Formation,简称 DLF)是一款全托管的快速帮助用户构建云上数据湖及Lakehouse的服务,为客户提供了统一的元数据管理、统一的权限与安全管理、便捷的数据入湖能力以及一键式数据探索能力。DLF可以帮助用户快速...

通过元数据文件迁移上云

本文介绍如何在 云消息队列 Kafka 版 控制台创建迁移任务,将元数据迁移至 云消息队列 Kafka 版 已有实例。前提条件 下载JDK 8 购买并部署 云消息队列 Kafka 版 实例:购买并部署VPC实例 购买并部署公网/VPC实例 背景信息 Kafka集群元数据...

SAML配置

2.进入 Microsoft Azure AD界面,配置SP的元数据信息,获取IDP的元数据信息 步骤一:在Azure AD中创建应用 管理员用户登录 Microsoft Azure AD界面,点击 查看。在左侧导航栏,选择 企业应用程序>所有应用程序。单击 新建应用程序。在 浏览...

实例元数据

访问 实例元数据 重要 实例或实例元数据中若包含了敏感数据,建议您采取适当的措施来保护敏感数据,例如访问控制、数据加密等。实例元数据访问 模式说明 实例元数据支持普通模式和加固模式两种访问模式。普通模式和加固模式 的区别 对比项 ...

数据查询

接入性能监控数据后,您可以通过数据查询页面,查看目标Profile在某一段时间内的数值情况。前提条件 已接入性能监控数据。具体操作,请参见 接入Pyroscope性能监控数据。背景信息 接入性能监控数据后,性能监控数据被存储于名为${实例ID}-...

set-meta(管理文件元数据

ossutil64 set-meta oss:/examplebucket/exampleobject.txt X-Oss-Meta-Createdby-delete 示例二:批量删除多个Object的自定义元数据 批量删除多个Object的自定义元数据步骤如下:将待删除自定义元数据的Object名称写入本地文件localfile....

元数据导出

DLF提供了元数据导出工具,可以帮您将DLF元数据导出到Hive Metastore元数据中。前提条件 已有一个EMR集群,且Metastore服务配置的元数据库与导出的目标RDS库要一致。同步任务会使用EMR集群的Metastore服务,以Spark作业的方式运行在该EMR...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...

文件元数据离线分析

EMR-3.30.0及后续版本的Block模式,支持dump整个namespace的元数据信息至OSS中,并通过Jindo Sql工具直接分析数信息。背景信息 在HDFS文件系统中,整个分布式文件的元数据存储在名为fsimage的快照文件中。文件中包含了整个文件系统的命名...
< 1 2 3 4 ... 77 >
共有77页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用