特征工程

_相关内容

EasyRec Processor(推荐打分服务)

EAS 内置的EasyRec Processor支持将EasyRec或TensorFlow训练的推荐模型部署为打分服务,并具备集成特征工程的能力。通过联合优化特征工程和TensorFlow模型,EasyRec Processor能够实现高性能的打分服务。本文为您介绍如何部署及调用EasyRec...

针对有异常标签的数据创建智能巡检任务

具体说明如下:单个实体进展信息 统计图表中展示该实体的进展信息,包括开始特征工程>特征工程完成>开始模型训练>模型训练完成>开始训练预测>训练预测完成>开始验证预测>验证预测完成>生成报告中>生成报告完成。时间配置 统计图表中展示...

选型指导

使用MaxCompute预付费资源,做特征工程、样本处理、深度学习模型训练 通过Flink写入到Redis中。DAU大于5万 可以增加向量召回。所有特征存储、向量查询都使用 Hologres 产品。使用多目标排序模型。当用户特征快速变化的情况,可考虑 ...

针对无标签数据创建智能巡检任务

具体说明如下:单个实体进展信息 统计图表中展示该实体的进展信息,包括开始特征工程>特征工程完成>开始模型训练>模型训练完成>开始训练预测>训练预测完成>开始验证预测>验证预测完成>生成报告中>生成报告完成。时间配置 统计图表中展示...

评分卡信用评分

其原理是先将分箱后的原始数据进行特征工程变换,再使用线性模型建模。评分卡建模理论通常适用于信用评估领域,例如信用卡风险评估和贷款发放业务。在其它领域,评分卡建模也可以作为分数评估,例如客服质量打分和芝麻信用打分。前提条件 ...

什么是人工智能平台PAI

支持一站式机器学习,您只需准备好训练数据(存放到OSS或MaxCompute中),所有建模工作(包括数据上传、数据预处理、特征工程、模型训练、模型评估和模型发布至离线或在线环境)都可以通过PAI实现。对接DataWorks,支持SQL、UDF、UDAF、MR...

基本概念

工程 工程又称为“建模工程”,是进行多方安全建模的研发场所,用户可基于虚拟宽表进行特征工程、模型研发和模型评估等操作。同时支持以可视化画布的形态编排建模流程,一个流程中可包含一个或多个组件,组件间以连线的方式表示数据的传递...

分箱

在评分卡训练过程中通过分箱进行特征工程,将特征离散化生成Dummy变量,并对训练过程中的每个Dummy变量的权重增加一定约束。各个约束项的含义如下:顺序升序约束:该特征的各个Dummy变量按照Index从小到大添加权重上升的约束,即Index越大...

心脏病预测

特征工程主要包括特征的衍生及尺度变化等功能。本工作流首先通过 类型转换 组件将输入特征转换为DOUBLE类型(因为逻辑回归模型的输入数据必须为DOUBLE类型),然后使用 过滤式特征选择 组件判断每个特征对于结果的影响(通过信息熵和...

PolarDB for AI助力菜鸟实现一站式数据智能

但是在AI模型的生命周期管理过程中,存在如下痛点:业务不灵活:数据标注加工、算法设计与开发、特征工程、模型训练、模型调优、模型评估、模型上线等工作涉及众多业务系统、至少三类工程师角色,业务逻辑复杂,全流程耗时过长,当有新需求...

特征管理

特征工程可能包括选择最相关的特征、将原始数据转换为更适合机器学习算法的格式、创建从原始数据派生的新特征等。以下是一些常见的特征使用场景:分类问题:邮件分类:使用邮件内容的单词和短语作为特征来识别垃圾邮件。图片识别:使用像素...

概述

然后,算法工程师通过自定义的特征工程流程、模型训练脚本以及定时任务脚本进行周期性的生产特征和模型;最后,开发工程师负责模型的上线、稳定性保证和监控运维。这就导致了不同系统之间会进行数据迁移,同一份数据可能在不同源之间冗余,...

新功能发布记录

提供行业算法模板,包含特征工程、召回、排序、在线推理等在内的完整推荐链路,仅需完成数据对接,即可快速接入个性化功能。开放丰富的运营工具,支持按页面配置选品、投放规则,辅助打散、混排、实时正向负向反馈等功能,提升用户浏览体验...

PS-SMART多分类

如果特征值为类别型字符串,需要进行特征离散化等特征工程处理。虽然PS-SMART多分类组件支持数十万特征任务,但是消耗资源大且运行速度慢,可以使用GBDT类算法进行训练。GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-...

PS-SMART二分类训练

如果特征值为类别型字符串,需要进行特征离散化等特征工程处理。虽然PS-SMART二分类训练组件支持数十万特征任务,但是消耗资源大且运行速度慢,可以使用GBDT类算法进行训练。GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行...

PS-SMART回归

如果特征值为类别型字符串,需要进行特征离散化等特征工程处理。虽然PS-SMART回归组件支持数十万特征任务,但是消耗资源大且运行速度慢,可以使用GBDT类算法进行训练。GBDT类算法适合直接使用连续特征进行训练,除需要对类别特征进行One-...

使用TensorFlow实现分布式DeepFM算法

背景信息 DeepFM算法对应 Wide&Deep 部分,且将LR替换为FM,从而避免人工特征工程。训练数据源为 pai_online_project.dwd_avazu_ctr_deepmodel_train,测试数据源为 pai_online_project.dwd_avazu_ctr_deepmodel_test,都是公开数据源,您...

如果不用EasyRec训练,只用EAS推理,如何对接

processor":"easyrec"fg_mode 是 用于指定特征工程模式,取值如下:tf:为TensorFlow模式,使用FG。通过将FG以TF算子嵌入TensorFlow计算图并进行图优化,从而获得更高性能。bypass:不使用FG,仅部署TensorFlow模型。适用于自定义特征处理...

FeatureStore Python SDK

特征视图定义了数据从哪里来(DataSource)、需要进行哪些预处理或转换操作(如特征工程/Transformation)、特征的数据结构(包含特征名称和类型在内的特征schema)、数据存储的位置(OnlineStore/OfflineStore),并提供特征元信息管理,...

使用EasyRec构建推荐模型

pai_online_project.easyrec_demo_taobao_ori_data,该数据集除大部分STRING类型的IdFeature类特征外,还有一列DOUBLE类型的Price特征(RawFeature类特征),需要使用 Designer 的 分箱 组件进行特征工程,您可以为已创建的机器学习节点...

定制排序模型

以ctr中使用的字段为例:结合system_internal表中的内置特征,以及上步中创建的字段特征,下面进行特征生成(特征工程):以目前CTR常用的特征生成为例:可以通过OpenApi(CreateFunctionResource-创建算法资源)批量注册:其中 ...

Responsible AI-错误分析

这可能涉及到数据质量的分析、模型设计的问题、特征工程或数据表示的问题等。采取改进措施:根据错误分析的结果,开发团队可以采取特定的措施来解决模型中的问题。这些措施可能包括数据清洗、重新平衡数据集、修改模型架构、引入新的特征或...

组件参考:所有组件汇总

特征工程 特征重要性过滤 特征重要性过滤组件为线性特征重要性、GBDT特征重要性和随机森林特征重要性等组件提供过滤功能,支持过滤TopN的特征。主成分分析 该组件是研究如何通过少数主成分揭示多个变量间的内部结构,考察多个变量间相关性...

使用FeatureStore Python SDK搭建推荐系统

特征视图定义了数据从哪里来(DataSource)、需要进行哪些预处理或转换操作(如特征工程/Transformation)、特征的数据结构(包含特征名称和类型在内的特征schema)、数据存储的位置(OnlineStore/OfflineStore),并提供特征元信息管理,...

一致性检查

功能说明 特征一致性是算法项目中常见的工程课题,指的是模型训练的特征和在线打分的特征逻辑要一致,如果特征不一致会导致产品或应用出现打分不一致、效果异常,所以建议定期执行特征一致性检查任务,避免因特征不一致导致的效果下跌问题...

价格说明

特征一致性校验(用于对入库的离线特征,以及在线打分阶段的输入特征进行比对检查,避免特征不一致导致的效果下跌);实验平台(用于场景的模型、在线参数等进行分层实验,优化方案效果)等。高级版:增加了数据诊断(用于对接初期、中期、...

Cost-based SQL诊断引擎

挑战主要体现在两个方面:足够完备性保证:影响SQL优化的因素很多,例如影响索引选择的因素有上百个,加之各因素之间形成组合,这就形成了庞大的案例特征集合,如何让这些特征一一映射到测试案例也是非常庞大的工程。测试案例设计需要专业...

工程架构

架构图 冷启动链路的整体框架如下图所示:冷启动链路流程 App请求推荐服务,获取推荐内容列表 推荐服务调用 冷启动召回模块,获取匹配上的候选物品 推荐服务调用 冷启动算法打分EAS服务,传递参数:待打分候选物品列表,用户/物品特征,...

管理合约工程

合约链提供联盟合约工程管理,管理员可以新建、复制、删除合约工程。合约工程创建完成后,可参考 Cloud IDE说明 对合约工程文件进行编辑、调试、部署。说明 目前仅支持基于 solidity 的智能合约。进入合约工程管理页面 在 BaaS 控制台首页...

API概览

本产品(人工智能平台 PAI-特征平台/2023-06-21)的OpenAPI采用 ROA 签名风格,签名细节参见 签名机制说明。我们已经为开发者封装了常见编程语言的SDK,开发者可通过 下载SDK 直接调用本产品OpenAPI而无需关心技术细节。如果现有SDK不能...

特征管理

特征管理介绍 OpenSearch推出了定制排序模型功能,特征管理可用于为定制排序模型添加所需的特征表,并支持创建、编辑特征名称、特征类型以及来源字段。添加特征表 创建 行业模板 之后,进入开放搜索 控制台 页面,左侧导航栏选择:...

本地运行

您可以在本地使用 IDE 工具、Maven 或 Java 命令行运行工程,本文将向您介绍如何实现 SOFABoot Web 工程和 Core 工程在本地的编译与运行。编译运行 Web 工程 下载示例 Demo 请单击下载示例工程:websofademo.7z。本地 IDE 运行 主要操作...

配置FeatureStore项目

Join Id Join Id是关联特征视图到特征实体的特征表字段,每个特征实体都会有一个Join Id,通过Join Id可以关联多个特征视图的特征。说明 每一个特征视图都有一个主键(索引键)来获取其下面的特征数据,但是特征视图的索引键可以和JoinId的...

查看特征组信息

本文介绍如何查看特征组的详细信息。前提条件 确保所需的特征样本已经完成了特征组的定义、发布和验证,且已授权到当前项目。操作步骤 登录多方安全建模控制台。在左侧导航栏,单击 模型部署>在线特征。在 在线特征 页面,单击特征组名称或...

发布特征

本文介绍在管理控制台中发布特征的方法。说明 已发布的特征不可以删除。前提条件 您已成功创建特征组...说明 如果您想在已发布特征特征组中新增特征,可单击该特征组右侧的 编辑,在 编辑特征组 面板中单击 新增特征,填写表单后单击 确定。

自定义特征

本文为您介绍自定义特征组件。功能说明 自定义特征组件可根据上传数据已有特征进行加减乘除处理后生成新的特征。在项目中,可以通过计算来生成优于原特征的新特征。应用场景:已有特征x1、x2,需要新生成特征y1和y2,其中y1由“x1”与“x2...

过滤式特征选择

根据您使用的不同特征选择方法,从所有稀疏或稠密格式的特征数据中选择并过滤出TopN的特征数据,同时保存为特征重要性表,实现了降低模型训练的难度和提高训练模型的精确度。本文为您介绍 Designer 提供的过滤式特征选择组件的参数配置和...

pom.xml配置

本文主要对 SOFABoot Web 工程和 Core 工程中的配置文件 pom.xml 进行说明。2 个工程在配置上的区别,主要是内容的不同。Web 工程的 pom.xml 配置说明 Web 工程完整版 pom.xml 配置,请参考 完整版 pom.xml。下文将就 SOFABoot Web 工程 ...

新建及管理识别特征

识别特征基于字段的数据内容、元数据属性,结合正则表达式、包含、不包含等运算条件对数据特征进行表达,从而智能推荐相关的数据分类分级或数据标准。Dataphin内置了多种识别特征表达式,如手机号、身份证号等。此外,您也可以自定义识别...

新建及管理识别特征

识别特征基于字段的数据内容、元数据属性,结合正则表达式、包含、不包含等运算条件对数据特征进行表达,从而智能推荐相关的数据分类分级或数据标准。Dataphin内置了多种识别特征表达式,如手机号、身份证号等。此外,您也可以自定义识别...
< 1 2 3 4 ... 130 >
共有130页 跳转至: GO
新人特惠 爆款特惠 最新活动 免费试用