派生指标:原子指标、修饰词、时间周期三大要素构成,用于统计目标指标在具体时间、维度、业务条件下的数值表现,反映企业某一业务活动的业务状况。例如,统计 近30天在PC端的支付金额、近30天PC端支付用户数。复合指标:由一个或多个的...
PolarDB 支持条件下推(连接条件下推至物化派生表)功能,可以将符合下推规则的条件表达式,从 JOIN 语句中的 ON 子句中转移至物化派生表(Derived Tables)中,从而有效地将数据过滤的过程前移,确保谓词条件尽早地应用于数据源,进而减少...
即当派生表(Derived Tables)不能合并到外部查询时,将外部WHERE条件下推到派生表(Derived Tables)中减少SQL需要处理的行数,从而提升SQL查询的性能。前提条件 集群版本适用的数据库引擎版本如下,如何查看集群版本,请参见 查询版本号...
规范定义是指以业务对象建模作为理论基础,构建总线矩阵,划分并定义主题域(数据域)、业务活动、业务对象、原子指标、业务限定、时间周期和派生指标。本文为您介绍在本教程中如何进行规范定义。基本概念 业务实体:业务对象 业务对象是...
修饰词与原子指标、时间周期组合后,可构成派生指标。概念说明 修饰词是一种业务修饰,用来圈定或者聚焦统计数据的业务范围和限定。例如,统计线上渠道的销售金额、生鲜门店的销售金额,线上渠道和生鲜门店就是聚焦的业务范围和限定。一个...
由于派生指标只是针对某业务活动某段时间的数据量统计,无法满足贴近用户实际使用的业务增长率、差值计算等数据的比对需求(例如,统计某业务活动的周环比增长率)。因此,DataWorks为您提供了由派生指标通过运算规则进行计算而形成的复合...
规范定义是指以业务对象建模作为理论基础,构建总线矩阵,划分并定义主题域(数据域)、业务活动、业务对象、原子指标、业务限定、时间周期和派生指标。本文为您介绍在本教程中如何进行规范定义。基本概念 业务实体:业务对象 业务对象是...
统计时效 派生指标的计算频次,即派生指标产出的时间间隔。派生指标 即基于原子指标、时间周期和维度,圈定业务统计范围并分析获取业务统计指标的数值。派生指标=原子指标+业务限定+统计周期+维度或维度的组合(统计粒度)。汇总逻辑表 ...
统计时效 派生指标的计算频次,即派生指标产出的时间间隔。派生指标 即基于原子指标、时间周期和维度,圈定业务统计范围并分析获取业务统计指标的数值。派生指标=原子指标+业务限定+统计周期+维度或维度的组合(统计粒度)。汇总逻辑表 ...
本文为您介绍如何新建无派生指标的汇总逻辑表。前提条件 在执行操作前,请先完成业务对象的逻辑表创建。具体操作,请参见 维度逻辑表。操作步骤 在Dataphin首页的顶部菜单栏,选择 研发 数据开发。在顶部菜单栏中选择 项目(Dev-Prod模式...
创建派生指标 业务限定 统计的业务范围,用于筛选出符合业务规则的记录(类似于SQL中where后的条件,不包括时间区间)。原子指标是计算逻辑的标准化定义,业务限定则是条件限制的标准化定义。创建业务限定 汇总逻辑表 派生指标归属的表就是...
创建派生指标 业务限定 统计的业务范围,用于筛选出符合业务规则的记录(类似于SQL中where后的条件,不包括时间区间)。原子指标是计算逻辑的标准化定义,业务限定则是条件限制的标准化定义。创建业务限定 汇总逻辑表 派生指标归属的表就是...
为保证统计指标标准、规范、无二义性地生成,OneData方法论将派生指标抽象为四部分:派生指标=原子指标+业务限定+统计周期+统计粒度。例如,原子指标(销售额)+业务限定(产品类别)+统计周期(每月统计一次)+统计粒度(按产品类别和月份...
应用表是面向具体业务场景时,用于组织相同时间周期、相同维度的多个原子指标、派生指标或统计粒度的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建应用表。功能介绍 应用表是将一个数据集市或主题域中...
概述 本文为您介绍Dataphin在生产环境中下线并发布派生指标为什么不需要重新发布。详细信息 在生产环境研发中的规范建模模块下线并删除派生指标为什么不需要重新发布。原因:该派生指标在之前没有被发布即在当前下线删除时不需要重新发布。...
本文为您介绍如何新建无派生指标的汇总逻辑表。前提条件 在执行操作前,请先完成业务对象的逻辑表创建。具体操作,请参见 维度逻辑表。操作步骤 在Dataphin首页的顶部菜单栏,选择 研发 数据开发。在顶部菜单栏中选择 项目(Dev-Prod模式...
汇总表用于组织一个数据域下相同时间周期、相同维度的多个派生指标的统计数据,为后续的业务查询,OLAP分析,数据分发等提供基础。本文为您介绍如何创建汇总表。功能介绍 汇总表是将一个数据域中的多个派生指标通过时间周期及关联维度整合...
问题描述 Dataphin规范建模中派生指标已下线,但是下线原子指标时,依然报错“存在依赖,不可操作派生指标 xxx”。问题原因 派生指标是依赖校验原子指标的,无论派生指标是草稿状态还是发布状态,都会依赖原子指标。解决方案 下线原子指标...
派生表与视图的列裁剪优化 消除冗余DISTINCT OR/IN表达式转UNION ALL IN谓词转JOIN 子查询优化 子查询折叠 子查询解关联 连接(JOIN)消除 LEFT JOIN(左连接)消除 基于代价的查询变换 连接条件下推 条件下推:条件下推(HAVING to WHERE...
问题描述 Dataphin删除并下线派生指标报错:“*sql解析错误column not found*”。问题原因 该派生指标有所依赖的下游任务。解决方案 排查哪些任务依赖了该派生指标,解除依赖即可删除。适用于 Dataphin
概述 本文主要介绍Dataphin中如何对两个派生指标进行逻辑运算,生成新的指标。比如以下场景如何实现:目前有“最近7天男性支付数”、“历史至今男性注册人数”两个派生指标,需要统计“最近7天男性支付数”占“历史至今男性注册人数”该...
Y Y Y Y N 新建派生指标 Y Y N N N 编辑派生指标 Y Y N N N 保存派生指标 Y Y N N N 删除派生指标 Y Y N N N 下线派生指标 Y Y N N N 提交派生指标 Y Y N N N 数据处理权限列表 权限点 项目管理员 项目开发者 项目访客 项目分析师 普通成员...
Y Y Y Y N 新建派生指标 Y Y N N N 编辑派生指标 Y Y N N N 保存派生指标 Y Y N N N 删除派生指标 Y Y N N N 下线派生指标 Y Y N N N 提交派生指标 Y Y N N N 数据处理权限列表 权限点 项目管理员 项目开发者 项目访客 项目分析师 普通成员...
在 条件下推(WHERE条件下推派生表)之前增加谓词推导的流程,v1.c1=t1.c2 and t1.c2=v1.c2 通过非等值和等值关系的传递,可以得到单表条件 v1.c1 v1.c2,进而通过条件下推,将 v1.c1 v1.c2 条件下压到派生表中,转换成派生表中对应的字段 ...
当查询仅从包含大量列的派生表或视图中选取少数几列时,可能会因读取和处理不必要的数据而导致性能下降。此问题在处理宽表或复用大而全的通用视图时尤为突出。PolarDB MySQL版 的列裁剪(Column Pruning)功能可自动优化此类查询。它在查询...
派生指标=时间周期+修饰词+原子指标,派生指标可以理解为对原子指标业务统计范围的圈定。业务限定:统计的业务范围,筛选出符合业务规则的记录(类似于SQL中 where 后的条件,不包括时间区间)。统计周期:统计的时间范围,例如最近一天,...
派生指标=时间周期+修饰词+原子指标,派生指标可以理解为对原子指标业务统计范围的圈定。业务限定:统计的业务范围,筛选出符合业务规则的记录(类似于SQL中 where 后的条件,不包括时间区间)。统计周期:统计的时间范围,例如最近一天,...
汇总数据层的一个表通常会对应一个统计粒度(维度或维度组合)及该粒度下若干派生指标。汇总表设计原则 聚集是指针对原始明细粒度的数据进行汇总。DWS汇总数据层是面向分析对象的主题聚集建模。在本教程中,最终的分析目标为:最近一天某个...
原子指标用于明确业务的统计口径和计算逻辑,是基于用户的业务...后续步骤 创建的原子指标后续可以被派生指标及模型引用,用于统计某一业务活动统计目标指标在具体时间、维度、业务条件下的数值表现。详情请参见 派生指标、发布模型至引擎。
问题描述 Dataphin规范建模的事实逻辑表关联维度的下游派生指标已下线,还是无法更换关联维度,报错“存在依赖,不可操作派生指标:xxx”。解决方案 如果需要更换事实逻辑表的关联维度,需要将所有相关的派生指标和业务限定都下线并删除。...
问题描述 Dataphin派生指标在逻辑汇总表补数据总是提示空跑,日志情况如下:问题原因 调度周期不是天调度,当天不在调度周期运行的日期则会直接空跑跳过。解决方案 修改调度周期。选择补数据日期可以向前或者向后选择调度运行的日期,比如...
问题描述 Dataphin公共定义中修改了统计周期的表达式,之前引用该统计周期的派生指标中看已经变更,但是任务执行还是按照之前统计周期执行查询。对应派生指标运行时统计周期值还是按照原来的表达式计算:问题原因 在公共定义中修改了统计...
PolarDB 条件下推是一种优化技术,旨在通过将查询条件提前到数据处理的更...条件下推(HAVING to WHERE)条件下推(WHERE条件下推派生表)条件下推(WHERE子句下推至IN子查询)条件下推(连接条件下推至物化派生表)谓词推导(条件下推增强)
DataWorks智能数据建模首页,为您展示了当前租户内创建的模型及派生指标数量,以及近三十天内当前工作空间成功发布至生产环境的模型列表,帮助您了解模型动态概况。本文为您介绍DataWorks智能数据建模首页信息概览。进入智能数据建模 进入...
业务日期(Bizdate):使用业务日期分区计算派生指标,可保障数据的强一致性,但需保留历史分区用于派生指标计算。生命周期:设置存储的生命周期,生命周期最大值为36500,大于等于该值将自动转为永久存储(显示为36500天)。系统支持快速...
本实践基于Dataphin系统进行下单业务的数据分析,对数据进行主题域划分、定义业务过程、构建逻辑模型和统计指标(原子指标、派生指标)的全过程进行展示。前提条件 需购买云原生大数据计算服务MaxCompute和智能数据建设与治理Dataphin...
本实践基于Dataphin系统进行下单业务的数据分析,对数据进行主题域划分、定义业务过程、构建逻辑模型和统计指标(原子指标、派生指标)的全过程进行展示。前提条件 需购买云原生大数据计算服务MaxCompute和智能数据建设与治理Dataphin...
问题描述 本文主要描述了Dataphin新建的派生指标发布失败,报错是对象在待发布列表中存在其依赖的对象的解决方法。问题原因 新建派生指标时关联的原子指标和汇总逻辑表没有和派生指标一起发布。解决方案 在发布时勾选派生指标,原子指标,...
业务日期(Bizdate):使用业务日期分区计算派生指标,可保障数据的强一致性,但需保留历史分区用于派生指标计算。生命周期:设置存储的生命周期,生命周期最大值为36500,大于等于该值将自动转为永久存储(显示为36500天)。系统支持快速...
问题描述 Dataphin中新建派生指标统计粒度只能选择全表,无法选择到其他维度字段。其中原子指标定义如下图:其中事实逻辑表和维度逻辑表已经关联,且都已经提交:问题原因 客户原子指标编辑之后没有提交导致。解决方案 新建派生指标的时候...