信息流数据分析平台-信息流数据分析平台文档介绍内容-移动阿里云

基础：购房群体简单分析

本案例指导您完成购房群体分析，帮助您掌握DataWorks的数据开发与数据分析流程。案例介绍本案例基于用户买房数据，分析不同群体的购房情况。通过DataWorks进行数据开发和数据分析。将本地数据通过DataWorks上传至MaxCompute的 bank_data ...

离线集成

数据管理DMS离线集成是一种低代码的数据开发工具，您可以组合各类任务节点，形成数据流，通过周期调度运行达到数据加工、数据同步的目的。支持的数据库类型 MySQL：RDS MySQL、PolarDB MySQL版、MyBase MySQL、PolarDB分布式版、AnalyticDB...

通过任务编排实现跨库数据同步

本文通过在任务编排中创建跨库Spark任务，实现了定期将在线库中的订单表和商品表同步到数据仓库中进行数据分析，并将分析结果回流在线库中供管理者查询。前提条件准备一个MySQL数据库作为在线库，用于存放订单表和商品表，且您拥有该数据...

停用计费说明

删除数据分析卡片报告在 数据分析 卡片以及 数据分析 报告，删除所有卡片和报告。关闭运维中心智能基线在运维中心任务监控智能基线，关闭或者删除所有基线。退订包年包月商品您可根据需要，对已购买的功能类或资源类包年包月商品...

基于Flink、EMR Serverless Spark与Paimon构建流批...

本文演示了使用实时计算Flink版和EMR Serverless Spark构建Paimon数据湖分析流程。该流程包括将数据写入OSS、进行交互式查询以及执行离线数据Compact操作。EMR Serverless Spark完全兼容Paimon，通过内置的DLF元数据与其他云产品（例如，...

基因实体表格

本文介绍基因分析平台中的实体概念，以及如何通过表格管理基因数据文件和元数据信息。基因实体表格介绍基因数据除测序文件（如FASTQ，BAM等）外，还需要包括临床、样本、实验等相关元数据信息，这些组合在一起，才能形成生物医学多组学的...

功能更新动态（2024年）-独享模式（半托管）

申请、续期和交还表权限授权与回收表权限数据源管理数据源连接测试新增成功有风险状态，该状态下的数据源仅可用于数据服务、数据质量功能，不可用于数据开发和数据集成功能。ElasticSearch数据源新增支持HTTPS连接；支持自签名证书。...

创建CDH Spark节点

Spark是一个通用的大数据分析引擎，具有高性能、易用和普遍性等特点，可用于进行复杂的内存分析，构建大型、低延迟的数据分析应用。DataWorks为您提供CDH Spark节点，便于您在DataWorks上进行Spark任务的开发和周期性调度。本文为您介绍...

用户画像分析（MaxCompute简化版）

通过本教程，您可以了解如何使用DataWorks和MaxCompute产品组合进行数仓开发与分析，并通过案例体验DataWorks数据集成、数据开发和运维中心模块的相关能力。案例介绍为了更好地制定企业经营策略，现需要从用户网站行为中获取网站用户群体...

组件操作

Kafka是一个开源的分布式事件流平台，具备高吞吐、低延迟和持久化能力，广泛用于构建实时数据流处理和数据管道的应用场景。使用SASL登录认证Kafka服务使用SSL加密Kafka链接 Kafka常见问题相关文档 EMR产品的整体架构，请参见产品架构。...

智能搜索（PolarSearch）

您无需手动将PolarDB中的数据同步至其他数据检索平台，便可直接通过API或SDK进行文本文档、图片特征、日志等多模态数据的毫秒级全文检索、向量检索与智能分析。说明当前功能目前正处于灰度阶段。如您有相关需求，请提交工单与我们联系，...

数据库节点

SelectDB SelectDB是基于Apache Doris打造的新一代多云原生实时数据仓库，聚焦于满足企业级大数据实时分析需求，为您提供极致性价比、简单易用的数据分析服务。更多介绍，请参见 SelectDB。Redshift Amazon Redshift是云平台的一种完全托管...

观远BI连接MaxCompute

MaxCompute支持您将MaxCompute项目数据接入观远BI，帮助企业的业务人员和数据分析师开展以问题为导向的探索式分析工作以及制作数据卡片和数据看板。本文为您介绍如何通过MaxCompute JDBC驱动，连接观远BI和MaxCompute项目，并进行可视化...

进阶：商品订单畅销类目分析

入门简介本教程以电商场景为例，演示如何构建从原始数据接入→数据分析计算→可视化输出的完整数据管道，通过标准化的开发流程，快速搭建可复用的数据生产链路，保证调度可靠性与运维可观测性。使业务人员无需深入技术细节即可完成数据...

基本概念

本文为您介绍DataWorks中，数据集成、数据建模、数据开发、数据分析、数据服务等模块开发过程中涉及的相关基本概念。通用概念工作空间工作空间是DataWorks管理任务、成员，分配角色和权限的基本单元。工作空间管理员可以为工作空间加入...

基于GraphRAG生成高质量QA对

总结销售业绩报告通过目标设置、多维度数据分析、趋势分析、退款与售后评估、快捷查询以及实时数据支持等功能，为销售团队提供了全面且高效的业绩评估工具。这些功能不仅帮助团队精准定位业绩增长或下降的原因，还能指导团队优化运营策略...

什么是数据库网关

DG相关服务相关服务说明数据传输服务DTS 数据传输服务DTS（Data Transmission Service）是阿里云提供的实时数据流服务，支持关系型数据库（RDBMS）、非关系型的数据库（NoSQL）、数据多维分析（OLAP）等数据源间的数据交互，集数据同步...

新功能发布记录

云数据库RDS、云原生数据库PolarDB、云数据库MongoDB、云数据库 Tair（兼容 Redis）、云原生数据仓库AnalyticDB PostgreSQL版产品的备份恢复功能均由数据灾备提供，各产品功能动态详情如下。功能发布更新 2025年 09月功能名称变更类型 ...

功能发布记录

2024-11-21 所有地域使用新版数据开发（Data Studio）的用户元数据采集数据地图支持在数据地图的MaxCompute表详情页创建数据洞察，通过深度数据分析和解读来获取数据统计及分布情况。2024-11-21 华东1（杭州）、华东2（上海）、华北2...

配置跨库Spark SQL节点

在线业务会产生大量的数据，当需要对这些数据进行加工分析时，一般需要将在线业务的数据同步到专门用于数据加工和分析的数据仓库，再进行数据分析。数据仓库的数据回流到在线库，用于数据查询。在数据仓库中对数据进行加工分析后，往往需要...

同步数据

本教程以MySQL中的用户基本信息 ods_user_info_d 表和OSS中的网站访问日志数据 user_log.txt 文件为例，通过数据集成离线同步任务分别同步至StarRocks的 ods_user_info_d_starrocks、ods_raw_log_d_starrocks 表。旨在介绍如何通过...

产品架构

在Lindorm系统中，LindormSearch 既可以作为一种独立的模型，提供半结构化、非结构化数据的松散文档视图，适用于日志数据分析、内容全文检索；也可以作为宽表引擎、时序引擎的索引存储，对用户保持透明，即宽表/时序中的部分字段通过内部的...

数据看板

对话工厂分析数据指标信息查看对话工厂分析是针对对话工厂中对话流的问答情况进行统计分析，看板上可以直接获取的数据展示截图与释义如下：筛选条件时间范围：支持设置时间筛选条件为“昨天、最近一周、最近一月和自定义时间范围”。...

元数据采集

代码来源采集口径触发采集方式数据开发数据开发-创建节点并编辑代码自动采集数据开发（旧版）数据开发（旧版）-创建节点并编辑代码 数据分析 数据分析-新建SQL查询并编辑代码数据服务数据服务-新建API数据推送服务 API资产数据...

同步数据

本文将介绍如何创建HttpFile和MySQL数据源以访问用户信息和网站日志数据，配置数据同步链路将这些数据同步到在环境准备阶段创建的OSS存储中，并通过创建Spark外表解析OSS中存储的数据。通过查询验证数据同步结果，确认是否完成整个数据同步...

同步数据

本文将介绍如何创建HttpFile和MySQL数据源以访问用户信息和网站日志数据，配置数据同步链路将这些数据同步到在环境准备阶段创建的OSS存储中，并通过创建Spark外表解析OSS中存储的数据。通过查询验证数据同步结果，确认是否完成整个数据同步...

产品优势

多场景支持：支持离线数仓搭建、数仓提速、离线数据分析、数据中台搭建、大规模数据集成、离线计算、异构数据集成等。低门槛：近乎零代码，简单配置连线后即可满足各项离线数据集成任务，同时任务支持复杂调度。基于资产的虚拟湖：配合数据...

普通集成

视觉智能开放平台-目标检测图像搜索大模型服务平台百炼域名与网站企业服务大数据搜索与分析日志服务大数据计算云原生大数据计算服务大数据（数加）Data Lake Analytics Elasticsearch Quick BI 实时数仓 Hologres 数据湖构建存储...

什么是数据湖构建

阿里云数据湖构建（Data Lake Formation，简称DLF）是一款全托管的统一元数据和数据存储及管理平台，为客户提供元数据管理、权限管理和存储优化等功能。DLF与多个阿里云大数据计算引擎无缝对接，打破数据孤岛，帮助用户快速实现云原生数据...

数据服务

数据服务作为统一的数据服务出口，实现了数据的统一市场化管理，有效地降低数据开放门槛的同时保障了数据开放安全。5分钟快速了解前提条件已购买数据服务增值服务并且当前租户已开通数据服务模块。功能说明因Dataphin数据源功能已...

数据服务概述

数据服务作为统一的数据服务出口，实现了数据的统一市场化管理，有效地降低数据开放门槛的同时，保障了数据开放的安全。5分钟快速了解前提条件已购买数据服务增值服务，开通Dataphin 功能说明因Dataphin数据源功能已下线，您可以使用...

创建瓴羊One·分析数据源

在电商行业的数据分析中，商家往往面临着电商数据获取难、数据跨平台加工及整合难、缺少专业的行业分析思路等难题。通过瓴羊One·分析数据源，商家可以直接在Quick BI上接入各电商平台的数据，以在后续进行专题分析及关联分析，在解决电商...

基本概念

该系统兼容开源GeoMesa、GeoServer等生态，内置了高效的时空索引算法、空间拓扑几何算法等，结合云原生多模数据库 Lindorm 宽表引擎强大的分布式存储能力以及DAL Spark分析平台，可以广泛应用于空间或时空存储、查询、分析和数据挖掘场景...

配置DataHub输出

DataHub是流式数据（Streaming Data）的处理平台，为您提供发布、订阅和分发流式数据的功能，让您可以轻松构建基于流式数据的分析和应用。前提条件配置DataHub输出节点前，您需要先配置好相应的输入或转换数据源，实时同步支持的数据源。...

近实时数仓

背景信息企业依赖大数据平台快速地从海量数据中获得洞察从而更及时和有效地决策的同时，也对处理数据的新鲜度和处理本身的实时性要求越来越高。大数据平台普遍采用离线、实时、流三种引擎组合的方式以满足用户实时性和高性价比的需求。...

大数据安全治理的难点

例如，技术人员可以使用命令行，但数据分析师或运营就需要使用可视化界面或BI工具。不同的入口其登录认证、鉴权逻辑、审计能力可能存在差异。最常见的莫过于多个用户使用同一个身份从某个入口访问/操作数据的场景，此类场景就是典型的传递...

功能特性

自建Oracle迁移至云原生数据仓库AnalyticDB PostgreSQL版异构数据库间的数据类型映射关系切流数据库上云割接数据库割接用于帮助用户在完成数据库评估、应用评估改造后，将业务最终平滑地迁移到云上数据库。数据库割接周期性任务定时...

管理元数据

Paimon：高性能数据湖场景 Iceberg：大规模数据分析场景用户信息系统自动显示当前用户和关联的RAM用户。如果没有关联的RAM用户，创建DLF Catalog后将无法访问DLF数据目录。确认配置信息无误，单击确定按钮完成DLF Catalog创建。创建...

通过跨库Spark SQL任务将数据同步到OSS

电商管理者希望能够按商品类别统计并查看前一天的订单数量和金额，本文通过在任务编排中创建跨库Spark任务，实现定期将在线库中的订单表和商品表同步到OSS中进行数据分析，管理者可以在OSS中查看分析结果。前提条件准备一个MySQL数据库...

同步数据

本教程以MySQL中的用户基本信息 ods_user_info_d 表和OSS中的网站访问日志数据 user_log.txt 文件为例，通过数据集成离线同步任务分别同步至MaxCompute的 ods_user_info_d、ods_raw_log_d 表。旨在介绍如何通过DataWorks数据集成实现异构...