大数据模型建模方法

_相关内容

工艺模式建模

是 比例 比例 阈值 是否存在描述变量:存在 参数名 参数描述 是否必填 参数默认值 参数范围 案例库建模方法 案例指标优先:先基于评价变量筛选出优质案例,再基于筛选出的优质案例进行聚类。案例特性优先:先基于历史案例库聚类,再在每类...

随机森林

随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树,而它的本质属于机器学习的一分支——集成学习(Ensemble Learning)方法。计算逻辑原理 随机森林就是种了很多决策树,对输入向量进行分类(回归)。每一棵...

Quick BI v5.5版本说明

变更内容 智能小Q 支持仪表板 分图表组件数据解读,用户自定义解读范围,实时预估数据字符数,更好地解决了大模型 Token 限制与数据量间的矛盾;智能解读、总分结合,多种解读方式支持你的分析层层深入。支持 用户自助接入大模型,在智能问...

产品概述

产品为客户提供资产建模、数据采集、数据分析、设备监控和数据分析五产品能力:资产建模:定义设备资产标准模型,管理设备资产数据 提供设备资产全维度数据建模工具 快速构建实体资产数据模型 对设备资产进行全生命周期管理 为数据应用...

创建逻辑模型:明细表

明细表用于存储大量能够体现业务活动状况的实际数据或详细数值,是数据聚合后依据某个维度生成的结果表。例如,分析产品销售情况,您可以创建销售明细表,用来存储产品维度(作为外键)、时间维度(作为外键)以及销售总量。本文为您介绍...

网易有数BI连接MaxCompute

步骤二:网易有数BI可视化建模 创建数据模型,为后续进行数据可视化分析做准备。步骤三:使用网易有数BI查询及分析数据 在网易有数BI上访问MaxCompute项目数据并进行可视化分析。步骤一:网易有数BI连接MaxCompute 登录 网易有数BI控制台,...

使用大模型

数据开发中调用 1、大模型节点调用语言模型 DataWorks新版数据开发支持使用 大模型节点 对数据进行处理,在大模型节点中可配置大模型服务并调用语言模型。2、Shell节点调用语言模型 本示例展示如何在Shell节点调用语言模型回答特定...

什么是云原生应用组装平台BizWorks

数据模型设计:包括数据模型属性设置、关系配置,支持数据模型导入导出,并可依据模型设置快捷生成 数据库 脚本。应用服务设计:设计和管理业务域提供的应用服务及其下属的应用服务方法。模型导入导出:提供模型的导入和导出功能。微服务...

X-数据标准

X-数据标准基于圈选的资产通过大模型,结合语义分析,识别核心字段,可抽取码表定义、智能推荐标准映射以及智能生成标准定义。前提条件 需购买数据标准功能和X-数据标准功能才能使用X-数据标准。已配置并开启X-数据标准,详情请参见 智能...

支持向量机

模型地址 字符 算法参数 参数名 参数描述 是否必填 参数默认值 参数范围 建模类型 选择使用分类模型还是回归模型进行建模。是 分类 分类 回归 错误项的惩罚系数 惩罚系数越,即对分错样本的惩罚程度越,因此在训练样本中准确率越高,...

阶段一:基础防护建设

数据建模链路:先由数据团队主管定义好建模过程中可能使用到的数据标准,再由数据建模人员设计并提交模型,最后经由数据团队主管、运维或部署人员审核无误后发布至生产环境。数据开发与生产链路:开发人员在开发环境先开发代码、配置调度...

管理数据模型

数据模型页面,您可以根据业务需要,查看并管理已创建的数据模型。查看数据模型数据模型列表页,您可以查看所有数据模型及其绑定的 API 数量与创建时间。说明 API 的请求数据模型和响应数据模型同时被使用,则 绑定的 API数量 按照 1 ...

决策树

参数说明 IN端口 参数名 参数描述 是否必填 输入数据类型 数据源类型 特征变量 配置模型特征列 是 整数或浮点数 说明 若存在非数值数据,则会抛出异常。CSV组件。IGateOffline组件。平台上其他数据处理组件。按照平台组件开发的自定义组件...

表面网格模型

表面网格模型 数据模型 Ganos表面网格模型在OGC Simple Feature标准模型的基础上,新增以下数据模型:INDEXSURFACE IndexSurface用于基于索引的方式来描述多面体信息,例如以下多面体,可以分别使用顶点坐标串(p1,p2,p3,p4,p5)以及使用...

表面网格模型

表面网格模型 数据模型 Ganos表面网格模型在OGC Simple Feature标准模型的基础上,新增以下数据模型:INDEXSURFACE IndexSurface用于基于索引的方式来描述多面体信息,例如以下多面体,可以分别使用顶点坐标串(p1,p2,p3,p4,p5)以及使用...

创建逻辑模型:维度表

而在DataWorks智能建模的维度模型设计中,为了提高下游的查询效率,降低获取数据的复杂性,减少关联表的数量,通常可将一些高频使用的字段作为冗余字段(例如,用户ID、常用的分析维度)。示例一:“订单创建明细表”可冗余“收货地址维度...

DataWorks On Hologres使用说明

二、数据开发与运维 模块 描述 相关文档 数据建模 数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让企业内部实现“数同文”的...

polar.ai.lru_entity_size

用于设置模型缓存大小。数据类型 Integer 取值 取值范围:0~100,默认值为4。描述 设置模型缓存大小后,需要重新连接以使其生效。默认为缓存4个模型的元数据,减少读模型元数据表的次数。示例 设置当前会话模型缓存大小。SET polar.ai.lru_...

部署模式及版本功能介绍

产品描述 Dataphin是集产品、技术、方法论于一体的智能大数据平台建设引擎,为您提供数据引入、规范定义、建模研发、资产管理、数据服务等全链路智能数据建设及治理服务。功能 描述 Dataphin共享模式(全托管版)全托管又称公共云多租户...

基于对象特征的推荐

背景信息 该工作流首先对一份真实电商的4月份和5月份数据进行模型训练并生成预测模型,然后通过6月份的购物数据对该预测模型进行评估,最终选择最优的模型,并将其部署为EAS服务供业务方调用。重要 本工作流使用的数据为真实电商脱敏数据,...

DataWorks On MaxCompute使用说明

二、数据开发与运维 模块 描述 相关文档 数据建模 数据建模是全链路数据治理的第一步,沉淀阿里巴巴数据中台建模方法论,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让企业内部实现“数同文”的...

Designer组件概览

优选算法组件 优选算法组件主要包含常用的通用算法(如数据读取算法、SQL脚本、Python脚本等)和大模型数据处理算法(如LLM数据处理、LVM数据处理等)、大模型训练和推理算法。推荐使用基于DLC的算法组件,支持异构资源及用户自定义环境等...

新用户使用指引

部署EAS模型服务 AI+大数据开发场景 步骤 描述 相关文档 ① 使用 MaxCompute 存储数据时,先在 DataWorks 中进行预处理,然后在 PAI 中引用 MaxCompute 表作为训练数据源。通用数据开发 ② 内置140+成熟算法组件,通过拖拽方式低代码、可视...

地图组件

参数 说明 抗锯齿类型 默认配置下模型查看器的 抗锯齿类型 是 FXAA 方法,您还可以选择 SSAA 方法,但是 SSAA 方法开销会比 FXAA 方法大很多,电脑性能不是特别优秀的前提,不建议选择。锐化晕影 锐化晕影是一种将画面锐化和镜头晕影结合的...

进入智能数据建模

DataWorks智能数据建模首页,为您展示了当前租户内创建的模型及派生指标数量,以及近三十天内当前工作空间成功发布至生产环境的模型列表,帮助您了解模型动态概况。本文为您介绍DataWorks智能数据建模首页信息概览。进入智能数据建模 进入...

用户窃电识别

本文为您介绍如何通过 Designer 预置工作流模板,快速构建窃漏电用户的识别模型,达到自动检查用户是否窃漏电的目的,从而幅度降低稽查工作人员的工作量、保障用户正常用电及安全用电。背景信息 传统防窃漏电主要通过定期巡检、定期校验...

使用数据模型设计器

使用数据模型设计器,您可以直观地看到数据模型的主键、字段和模型之间的引用关系,也可以在图形化界面创建、编辑及删除数据模型。操作步骤 登录BizWorks,在 选择平台 下拉列表中选中 建模平台。单击页面右上角 图标或其文本框区域,在...

工具集

数据导入 IFC导入 IFC(Industry Foundation Classes)是一种开放的、面向行业的数据模型和文件格式,用于描述和交换建筑和基础设施项目的信息。IFC是由国际标准化组织(ISO)制定的标准,旨在促进建筑信息模型(BIM)的协作和集成。IFC...

工具集

数据导入 IFC导入 IFC(Industry Foundation Classes)是一种开放的、面向行业的数据模型和文件格式,用于描述和交换建筑和基础设施项目的信息。IFC是由国际标准化组织(ISO)制定的标准,旨在促进建筑信息模型(BIM)的协作和集成。IFC...

导出数据建模基础信息

支持您通过导出数据建模基础信息功能,下载数据建模基础信息到本地进行查看并搭配导入功能,您可以快速实现工作组间的数据建模基础信息迁移。本文介绍如何导出数据建模基础信息。前提条件 已存在数据建模基础信息,具体操作,请参见 新建...

人工神经网络

说明 就训练时间和验证分数而言,求解器“adam”在相对较数据集(具有数千个训练样本或更多)上的效果很好。但是,对于小型数据集,“lbfgs”可以收敛得更快并且性能更好。是 adam lbfgs sgd adam alpha L2惩罚(正则项)参数。是 0....

技术架构选型

数据模型设计之前,您需要首先完成技术架构的选型。本教程中使用阿里云数据产品MaxCompute配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。...

维度建模

模型设计理论 以下简单介绍了维度建模模型设计方法论,举例说明了如何划分数据域等,更多关于维度建模方法论、事实表维度表模型设计内容,请参见《Star Schema完全参考手册》[1]中的第2章~第6章节和第11章节、《数据仓库工具箱(第3版)》...

离线数仓构建流程

步骤五:规范建模 数据开发 基于 规范定义 明确好的统计指标口径和 规范建模 部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一:开发维度逻辑表 步骤二:开发事实逻辑表 步骤三:...

离线数仓构建流程

步骤五:规范建模 数据开发 基于 规范定义 明确好的统计指标口径和 规范建模 部分定义好的模型完成规范建模数据开发。包括维度逻辑表、事实逻辑表、原子指标、业务限定、派生指标。步骤一:开发维度逻辑表 步骤二:开发事实逻辑表 步骤三:...

MaxCompute表数据

单击 查看模型,即可进入 智能数据建模 维度建模 页面,查看创建的模型表。您可以在表编辑页面,修改表信息、发布表、查看表的操作日志或进行表模型数据开发。说明 仅DataWorks智能数据建模生成的表会显示模型信息。维度建模概述 表权限...

线性模型特征重要性

工作流运行成功后,右键单击 线性模型特征重要性-1 组件,在快捷菜单,选择 查看数据 模型重要性表。指标计算公式如下。列名 公式 weight abs(w_)importance abs(w_j)*STD(f_i)说明 表示特征系数的绝对值*训练数据的标准差。右键单击 线性...

智能应用

您可为智能应用接入阿里云(百炼)、DeepSeek等AI大模型,运用大模型能力进行数据查找、数据处理、数据开发、数据运维等,降低人工成本。本文为您介绍如何配置智能应用。前提条件 至少开通一个智能化功能,才可访问智能应用管理页面。权限...

智能巡检

日志服务智能异常分析App提供模型训练和实时巡检功能,支持对日志、指标等数据进行自动化、智能化、自适应地模型训练和异常巡检。本文介绍智能巡检的背景信息、工作原理、功能特性、基本概念、调度与执行场景和使用建议。重要 自2025年7月...

业务建模概述

BizWorks基于领域驱动设计方法论的模型设计平台,提供了对业务域、领域模型、数据模型的可视化建模能力,完成了业务建模过程的可视化、在线化。业务建模平台 的 概览 页包括以下内容:序号 名称 描述 ① 业务建模概述 统计业务建模对应的...
< 1 2 3 4 ... 200 >
共有200页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用