大数据模型建模方法-大数据模型建模方法文档介绍内容-移动阿里云

工艺模式建模

是比例比例阈值是否存在描述变量：存在参数名参数描述是否必填参数默认值参数范围案例库建模方法 案例指标优先：先基于评价变量筛选出优质案例，再基于筛选出的优质案例进行聚类。案例特性优先：先基于历史案例库聚类，再在每类...

随机森林

随机森林就是通过集成学习的思想将多棵树集成的一种算法，它的基本单元是决策树，而它的本质属于机器学习的一大分支——集成学习（Ensemble Learning）方法。计算逻辑原理随机森林就是种了很多决策树，对输入向量进行分类（回归）。每一棵...

Quick BI v5.5版本说明

变更内容智能小Q 支持仪表板分图表组件数据解读，用户自定义解读范围，实时预估数据字符数，更好地解决了大模型 Token 限制与数据量间的矛盾；智能解读、总分结合，多种解读方式支持你的分析层层深入。支持用户自助接入大模型，在智能问...

产品概述

产品为客户提供资产建模、数据采集、数据分析、设备监控和数据分析五大产品能力：资产建模：定义设备资产标准模型，管理设备资产数据提供设备资产全维度数据建模工具快速构建实体资产数据模型 对设备资产进行全生命周期管理为数据应用...

创建逻辑模型：明细表

明细表用于存储大量能够体现业务活动状况的实际数据或详细数值，是数据聚合后依据某个维度生成的结果表。例如，分析产品销售情况，您可以创建销售明细表，用来存储产品维度（作为外键）、时间维度（作为外键）以及销售总量。本文为您介绍...

网易有数BI连接MaxCompute

步骤二：网易有数BI可视化建模创建数据模型，为后续进行数据可视化分析做准备。步骤三：使用网易有数BI查询及分析数据在网易有数BI上访问MaxCompute项目数据并进行可视化分析。步骤一：网易有数BI连接MaxCompute 登录网易有数BI控制台，...

使用大模型

数据开发中调用 1、大模型节点调用大语言模型 DataWorks新版数据开发支持使用 大模型节点对数据进行处理，在大模型节点中可配置大模型服务并调用大语言模型。2、Shell节点调用大语言模型本示例展示如何在Shell节点调用大语言模型回答特定...

什么是云原生应用组装平台BizWorks

数据模型设计：包括数据模型属性设置、关系配置，支持数据模型导入导出，并可依据模型设置快捷生成数据库脚本。应用服务设计：设计和管理业务域提供的应用服务及其下属的应用服务方法。模型导入导出：提供模型的导入和导出功能。微服务...

X-数据标准

X-数据标准基于圈选的资产通过大模型，结合语义分析，识别核心字段，可抽取码表定义、智能推荐标准映射以及智能生成标准定义。前提条件需购买数据标准功能和X-数据标准功能才能使用X-数据标准。已配置并开启X-数据标准，详情请参见智能...

支持向量机

模型地址字符算法参数参数名参数描述是否必填参数默认值参数范围建模类型选择使用分类模型还是回归模型进行建模。是分类分类回归错误项的惩罚系数惩罚系数越大，即对分错样本的惩罚程度越大，因此在训练样本中准确率越高，...

阶段一：基础防护建设

数据建模链路：先由数据团队主管定义好建模过程中可能使用到的数据标准，再由数据建模人员设计并提交模型，最后经由数据团队主管、运维或部署人员审核无误后发布至生产环境。数据开发与生产链路：开发人员在开发环境先开发代码、配置调度...

管理数据模型

在数据模型页面，您可以根据业务需要，查看并管理已创建的数据模型。查看数据模型 在数据模型列表页，您可以查看所有数据模型及其绑定的 API 数量与创建时间。说明 API 的请求数据模型和响应数据模型同时被使用，则绑定的 API数量按照 1 ...

决策树

参数说明 IN端口参数名参数描述是否必填输入数据类型数据源类型特征变量配置模型特征列是整数或浮点数说明若存在非数值数据，则会抛出异常。CSV组件。IGateOffline组件。平台上其他数据处理组件。按照平台组件开发的自定义组件...

表面网格模型

表面网格模型 数据模型 Ganos表面网格模型在OGC Simple Feature标准模型的基础上，新增以下数据模型：INDEXSURFACE IndexSurface用于基于索引的方式来描述多面体信息，例如以下多面体，可以分别使用顶点坐标串（p1,p2,p3,p4,p5）以及使用...

表面网格模型

表面网格模型 数据模型 Ganos表面网格模型在OGC Simple Feature标准模型的基础上，新增以下数据模型：INDEXSURFACE IndexSurface用于基于索引的方式来描述多面体信息，例如以下多面体，可以分别使用顶点坐标串（p1,p2,p3,p4,p5）以及使用...

创建逻辑模型：维度表

而在DataWorks智能建模的维度模型设计中，为了提高下游的查询效率，降低获取数据的复杂性，减少关联表的数量，通常可将一些高频使用的字段作为冗余字段（例如，用户ID、常用的分析维度）。示例一：“订单创建明细表”可冗余“收货地址维度...

DataWorks On Hologres使用说明

二、数据开发与运维模块描述相关文档数据建模数据建模是全链路数据治理的第一步，沉淀阿里巴巴数据中台建模方法论，从数仓规划、数据标准、维度建模、数据指标四个方面，以业务视角对业务的数据进行诠释，让企业内部实现“数同文”的...

polar.ai.lru_entity_size

用于设置模型缓存大小。数据类型 Integer 取值取值范围：0~100，默认值为4。描述设置模型缓存大小后，需要重新连接以使其生效。默认为缓存4个模型的元数据，减少读模型元数据表的次数。示例设置当前会话模型缓存大小。SET polar.ai.lru_...

部署模式及版本功能介绍

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎，为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能描述 Dataphin共享模式（全托管版）全托管又称公共云多租户...

基于对象特征的推荐

背景信息该工作流首先对一份真实电商的4月份和5月份数据进行模型训练并生成预测模型，然后通过6月份的购物数据对该预测模型进行评估，最终选择最优的模型，并将其部署为EAS服务供业务方调用。重要本工作流使用的数据为真实电商脱敏数据，...

DataWorks On MaxCompute使用说明

二、数据开发与运维模块描述相关文档数据建模数据建模是全链路数据治理的第一步，沉淀阿里巴巴数据中台建模方法论，从数仓规划、数据标准、维度建模、数据指标四个方面，以业务视角对业务的数据进行诠释，让企业内部实现“数同文”的...

Designer组件概览

优选算法组件优选算法组件主要包含常用的通用算法（如数据读取算法、SQL脚本、Python脚本等）和大模型数据处理算法（如LLM数据处理、LVM数据处理等）、大模型训练和推理算法。推荐使用基于DLC的算法组件，支持异构资源及用户自定义环境等...

新用户使用指引

部署EAS模型服务 AI+大数据开发场景步骤描述相关文档 ① 使用 MaxCompute 存储数据时，先在 DataWorks 中进行预处理，然后在 PAI 中引用 MaxCompute 表作为训练数据源。通用数据开发 ② 内置140+成熟算法组件，通过拖拽方式低代码、可视...

地图组件

参数说明抗锯齿类型默认配置下模型查看器的抗锯齿类型是 FXAA 方法，您还可以选择 SSAA 方法，但是 SSAA 方法开销会比 FXAA 方法大很多，电脑性能不是特别优秀的前提，不建议选择。锐化晕影锐化晕影是一种将画面锐化和镜头晕影结合的...

进入智能数据建模

DataWorks智能数据建模首页，为您展示了当前租户内创建的模型及派生指标数量，以及近三十天内当前工作空间成功发布至生产环境的模型列表，帮助您了解模型动态概况。本文为您介绍DataWorks智能数据建模首页信息概览。进入智能数据建模 进入...

用户窃电识别

本文为您介绍如何通过 Designer 预置工作流模板，快速构建窃漏电用户的识别模型，达到自动检查用户是否窃漏电的目的，从而大幅度降低稽查工作人员的工作量、保障用户正常用电及安全用电。背景信息传统防窃漏电主要通过定期巡检、定期校验...

使用数据模型设计器

使用数据模型设计器，您可以直观地看到数据模型的主键、字段和模型之间的引用关系，也可以在图形化界面创建、编辑及删除数据模型。操作步骤登录BizWorks，在选择平台下拉列表中选中建模平台。单击页面右上角图标或其文本框区域，在...

工具集

数据导入 IFC导入 IFC（Industry Foundation Classes）是一种开放的、面向行业的数据模型和文件格式，用于描述和交换建筑和基础设施项目的信息。IFC是由国际标准化组织（ISO）制定的标准，旨在促进建筑信息模型（BIM）的协作和集成。IFC...

工具集

数据导入 IFC导入 IFC（Industry Foundation Classes）是一种开放的、面向行业的数据模型和文件格式，用于描述和交换建筑和基础设施项目的信息。IFC是由国际标准化组织（ISO）制定的标准，旨在促进建筑信息模型（BIM）的协作和集成。IFC...

导出数据建模基础信息

支持您通过导出数据建模基础信息功能，下载数据建模基础信息到本地进行查看并搭配导入功能，您可以快速实现工作组间的数据建模基础信息迁移。本文介绍如何导出数据建模基础信息。前提条件已存在数据建模基础信息，具体操作，请参见新建...

人工神经网络

说明就训练时间和验证分数而言，求解器“adam”在相对较大的数据集（具有数千个训练样本或更多）上的效果很好。但是，对于小型数据集，“lbfgs”可以收敛得更快并且性能更好。是 adam lbfgs sgd adam alpha L2惩罚（正则项）参数。是 0....

技术架构选型

在数据模型设计之前，您需要首先完成技术架构的选型。本教程中使用阿里云大数据产品MaxCompute配合DataWorks，完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中，DataWorks的数据集成负责完成数据的采集和基本的ETL。...

维度建模

模型设计理论以下简单介绍了维度建模模型设计方法论，举例说明了如何划分数据域等，更多关于维度建模方法论、事实表维度表模型设计内容，请参见《Star Schema完全参考手册》[1]中的第2章~第6章节和第11章节、《数据仓库工具箱（第3版）》...

离线数仓构建流程

步骤五：规范建模数据开发基于规范定义明确好的统计指标口径和规范建模部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一：开发维度逻辑表步骤二：开发事实逻辑表步骤三：...

离线数仓构建流程

步骤五：规范建模数据开发基于规范定义明确好的统计指标口径和规范建模部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一：开发维度逻辑表步骤二：开发事实逻辑表步骤三：...

MaxCompute表数据

单击查看模型，即可进入智能数据建模 维度建模页面，查看创建的模型表。您可以在表编辑页面，修改表信息、发布表、查看表的操作日志或进行表模型的数据开发。说明仅DataWorks智能数据建模生成的表会显示模型信息。维度建模概述表权限...

线性模型特征重要性

工作流运行成功后，右键单击线性模型特征重要性-1 组件，在快捷菜单，选择查看数据模型重要性表。指标计算公式如下。列名公式 weight abs(w_)importance abs(w_j)*STD(f_i)说明表示特征系数的绝对值*训练数据的标准差。右键单击线性...

智能应用

您可为智能应用接入阿里云（百炼）、DeepSeek等AI大模型，运用大模型能力进行数据查找、数据处理、数据开发、数据运维等，降低人工成本。本文为您介绍如何配置智能应用。前提条件至少开通一个智能化功能，才可访问智能应用管理页面。权限...

智能巡检

日志服务智能异常分析App提供模型训练和实时巡检功能，支持对日志、指标等数据进行自动化、智能化、自适应地模型训练和异常巡检。本文介绍智能巡检的背景信息、工作原理、功能特性、基本概念、调度与执行场景和使用建议。重要自2025年7月...

业务建模概述

BizWorks基于领域驱动设计方法论的模型设计平台，提供了对业务域、领域模型、数据模型的可视化建模能力，完成了业务建模过程的可视化、在线化。业务建模平台的概览页包括以下内容：序号名称描述 ① 业务建模概述统计业务建模对应的...