聚类分析软件-聚类分析软件文档介绍内容-移动阿里云

无监督聚类函数

根据输出数据画图，如下右图显示，原本在聚类类别之外的点也被纳入到聚类类别之中，便于分析一些离散在聚类中心的用户数据对于整体画像刻画的影响。如果eps设置过大，会让两个类别之间的边界变得不够清晰，影响最终的聚类结果。配置min_...

文本SPL

函数列表函数名称说明 get_log_patterns函数主要用于日志模板提取，通过分析日志的文本特征并采用机器学习算法对日志数据进行聚类，从而识别典型日志模板。该函数常应用于日志模式识别和日志异常发现等场景。diff_log_patterns函数该...

分析预警

本文为您介绍辅助线、趋势线、预测、异常检测、波动原因、聚类六种分析方式。背景信息分析预警支持从多个角度对当前数据进行分析，通过该功能可以直观了解数据的变化趋势和异常点。分析预警目前支持辅助线、趋势线、预测、异常检测、波动...

K均值聚类

功能说明 K均值聚类是一种矢量量化方法，在数据挖掘的聚类分析中很流行。K均值聚类通过试图分离 n 个相等方差组的样本来聚集数据，用最小化或者簇内和平方的标准。该算法需要指定簇的数量，它可以很好地扩展到大量样本，并已经被广泛应用于...

K均值聚类算法（K-Means）

该算法原理为：先将数据分为K组，随机选取K个对象作为初始的聚类中心，然后计算每个对象与各个种子聚类中心之间的距离，将每一个对象分配给距离它最近的聚类中心，聚类中心以及分配给它们的对象就代表一个聚类。即K-Means算法将输入表的...

散点图

聚类分析 聚类分析会根据X轴和Y轴的度量分布对相似度量数量进行聚类显示，开启聚类分析后颜色字段会被替换为聚类。说明 聚类分析 功能目前处于Beta版本，且 X轴和Y轴都为度量并未配置播放轴时才能开启聚类分析。后续步骤当其他人需要查看...

散点图

聚类分析 聚类分析会根据X轴和Y轴的度量分布对相似度量数量进行聚类显示，开启聚类分析后颜色字段会被替换为聚类。说明 聚类分析 功能目前处于Beta版本，且X轴和Y轴都为度量并未配置播放轴时才能开启聚类分析。常见问题(FAQ)问：散点图主要...

气泡图

聚类分析 聚类分析会根据X轴和Y轴的度量分布对相似度量数量进行聚类显示，开启聚类分析后颜色字段会被替换为聚类。说明 聚类分析 功能目前处于Beta版本，且 X 轴和Y轴都为度量且未配置播放轴时才能开启聚类分析。后续步骤当其他人需要查看...

气泡图

聚类分析 聚类分析会根据X轴和Y轴的度量分布对相似度量数量进行聚类显示，开启聚类分析后颜色字段会被替换为聚类。说明 聚类分析 功能目前处于Beta版本，且X 轴和Y轴都为度量且未配置播放轴时才能开启聚类分析。后续步骤当其他人需要查看...

气泡图

聚类分析 聚类分析会根据X轴和Y轴的度量分布对相似度量数量进行聚类显示，开启聚类分析后颜色字段会被替换为聚类。说明 聚类分析 功能目前处于Beta版本，且 X轴和Y轴都为度量且未配置播放轴时才能开启聚类分析。常见问题(FAQ)问：气泡图和...

声纹检索

声纹聚合：单击声纹聚合，会对已上传的所有声音文件，做聚类分析，并返回声音聚合结果。应用案例：网约车司机行为安全监控与敏感内容检测背景某出行公司希望通过语音识别技术，对网约车内录制的音频进行分析，从多人对话中准确提取司机...

机器学习

聚类问题：提供K-Means算法实现聚类分析；关联分析：提供Apriori算法实现关联分析，解决如“啤酒与尿布”的关联问题；时序分析：提供ARIMA自回归移动平均模型预测时间序列数据的未来值；其他：数据降维如通过PCA主成分分析模型来提炼主因子...

产品特点

智能聚类分析：识别OOM、ANR等典型问题模式，通过统一特征提取算法优化聚类准确性，解决复杂堆栈的归类难题。多维根因定位：支持按设备型号、操作系统版本、地域、网络环境、用户属性等20+维度交叉分析，结合启动阶段耗时打点，快速定位...

原生页面分析

3.原生页面设置此项为可选设置项，我们建议您根据业务自身要求设置对原生页面的要求，如果您偏向使用默认的阈值或不需要对页面进行聚类分析，请忽略此章节。您可以在设置-原生页面设置中，配置慢加载的阈值、FPS流畅度的阈值、丢帧的阈值...

通过消费组读取文本日志进行模板匹配

哈希聚类算法不依赖日志模板库，基于日志聚类功能进行在线聚类匹配分析。参数说明相似度阈值如果日志内容与某一个日志类别模板的相似度大于相似度阈值，则日志属于该日志类别。相似度阈值越低，日志越容易被归为同一个日志类别。融合...

数据分析

一次配置即可实现可视组件高级过滤、高级控制、联动、钻取、分享等操作，帮助业务人员快速完成对比、地理分析、分布、趋势以及聚类等分析和决策。自动布局的仪表盘，适用于大多数通过快速配置即可查看和分享的可视化报表。自由布局的大屏，...

日志聚类

本文介绍日志聚类功能及其操作，包括开启日志聚类、查看聚类结果和原始日志、对比不同时间段的聚类日志数量等。前提条件已创建Standard Logstore。具体操作，请参见创建Logstore。已采集日志。具体操作，请参见数据采集。已配置索引。...

算法说明

哈希聚类算法哈希聚类算法基于日志聚类功能，日志聚类功能对日志数据进行在线聚类，哈希聚类算法在日志聚类结果的基础上进行二次聚类，同时持续分析、监控日志数据。哈希聚类算法不依赖外部日志模板库。相似度匹配算法相似度匹配算法...

聚类分片全链路测试

测试结论 Proxima CE在不同的数据集上，针对不同的采样率、聚类中心点个数以及索引分片个数，观察聚类分片方式的召回情况与耗时情况，经测试验证Proxima CE聚类分片的正确性测试符合预期。以下是几条经验准则：聚类中心点个数与召回呈正...

日志查询

查询与分析结果（即命中查询条件的WAF日志数据）将会显示在页面下方，包含日志分布直方图、原始日志、统计图表、日志聚类。您可以基于查询结果进行快速分析、生成统计图表、设置告警等，具体说明，请参见查询/分析页面说明。查询/分析 ...

查询与分析快速指引

日志聚类在日志聚类页签中，单击开启日志聚类，可实现在采集日志时聚合相似度高的日志。具体操作，请参见日志聚类。SQL增强单击右上角图标，可单次开启SQL独享版。当您在使用SQL分析时，如果数据量较大，日志服务无法在一次查询中...

查看审计日志（表格存储控制台）

日志聚类在日志聚类页签中，单击开启日志聚类，可实现在采集日志时聚合相似度高的日志。具体操作，请参见日志聚类。SQL增强单击图标后选择增强SQL 或完全精确，开启SQL独享版。当您在使用SQL分析时，如果数据量较大，日志服务无法...

操作指引

使用机器学习分析，进行数据的预测分析、分类、聚类等，自动化发现数据中的模式和趋势。使用AI智能报告，自动生成分析报告，提供数据洞察和建议，减少人工报告的时间和精力。当您完成报告的创作之后，您可得到市场分析报告、销售分析报告、...

DBSCAN聚类

本文为您介绍DBSCAN聚类组件。功能说明 DBSCAN（Density-Based Spatial Clustering of Applications with Noise，具有噪声的基于密度的聚类方法）是一种基于密度的空间聚类算法。DBSCAN 的核心概念是 core samples,是指位于高密度区域的...

index

2048 log_reduce_white_list array 日志聚类的聚类字段过滤白名单，仅当日志聚类开启时有效。string 白名单字段。name log_reduce_black_list array 日志聚类的聚类字段过滤黑名单，仅当日志聚类开启时有效。string 黑名单字段。time line ...

GMM聚类

本文为您介绍GMM聚类组件。功能说明 GMM（Gaussian Mixture Model）是一个将事物分解为若干的基于高斯概率密度函数（正态分布曲线）形成的模型，混合高斯分布（MoG）由多个混合成分组成，每一个混合成分对应一个高斯分布。当聚类问题中...

人脸聚类

使用人脸聚类功能，你可以将媒体集中存在相似人脸的多张图片进行分组，可用于网盘的人脸相册、家庭监控的陌生人检测、甚至新零售的顾客管理等场景。人脸聚类后，您可以根据人脸分组查询对应人员的所有图片信息。重要此文档已不再维护，...

CreateSimilarImageClusterTask-创建相似图片聚类任务

使用步骤：创建相似图片聚类任务通过 GetTaskStatus 接口查询相似图片聚类任务是否执行完成通过 SearchSimilarImageClusters 接口获取相似图片聚类结果同一 drive 同一时刻只能有一个相似图片聚类任务运行，若上一任务未结束，再次调用...

聚类模型评估

基于原始数据和聚类结果，评估聚类模型的优劣性，从而输出评估指标。使用限制仅原PAI-Studio平台支持查看该组件的可视化报告。背景信息评估指标Calinski-Harabasz又称VRC（Variance Ratio Criterion），其计算公式如下。参数描述 SS B ...

最佳实践：利用Hologres加速HDBSCAN聚类

HDBSCAN（Hierarchical Density-Based Spatial Clustering of Applications with Noise）是一种结合密度聚类和层次聚类思想的算法，由于其出色的自适应和去噪能力，它被广泛应用于 Embedding 聚类场景。然而，HDBSCAN 算法流程中需要计算...

Proxima Cluster参数

1.聚类 1.1 KmeansCluster/BatchKmeansCluster 参数名类型默认值备注 proxima.general.cluster.count UINT32 0 中心点数量 proxima.kmeans.cluster.count UINT32 0 中心点数量，优先级高于 general，低于 suggest 的 K 值 proxima....

聚类标注功能使用介绍

基本功能实现介绍功能入口进入智能对话机器人控制台，在左侧导航栏，选择运营中心问答标注聚类标注，进入聚类标注界面，具体界面如下：待标注内容查看进入聚类标注界面后，单击待标注标签，进入待标注界面。根据实际业务需求选择待...

点聚类系数

点聚类系数是网络分析中的一个指标，用于量化节点在其邻居中的聚集程度。具体而言，它表示一个节点的邻居中实际存在的连边数与所有可能连边数之间的比值。该系数的值介于0到1之间，数值越高表示节点的邻居间联系越紧密，反映了网络中的局部...

查看评估结果

语义分析按照语义信息进行聚类。聚类个数可在顶部下拉框选择聚类个数。查看聚类明细样例：查看每个聚类的三个样例主题，总结信息。查看聚类百分比分布：查看每个聚类的占比。查看数据的分布：不同颜色表示不同类别，展示所有数据的类别和...

GetDocClusterTask-获取内容聚合任务结果

成功,SUSPENDED:暂停,FAILED:失败,CANCELED:取消)PENDING Topics array object 聚类主题列表 Topic object 热点事件对象 DocIds array 聚类主题下的文档 ID 列表 DocId string 文档 ID xxxxx Summary string 聚类主题摘要聚类主题摘要 ...

K均值聚类

查看聚类结果表、聚类统计表及聚类中心表：聚类结果表idxTableName+-+-+-+-+|f0|f1|cluster_index|distance|+-+-+-+-+|1|2|0|0.0|1|3|1|0.5|1|4|2|0.5|0|3|1|0.5|0|4|2|0.5|+-+-+-+-+聚类统计表clusterCountTableName+-+-+|cluster_index|...

MaxCompute K均值聚类最佳实践

本文为您介绍如何通过提交一个使用MaxCompute计算资源的超参数调优实验，来运行K均值聚类和聚类模型评估组件，以获取K均值聚类组件算法的较优超参数组合。步骤一：准备数据您可以参考聚类模型评估中的示例来准备测试数据和评估数据。本...

QueryLocationDateClusters-查询时空聚类

查询时空聚类列表信息，支持多种条件，详情请参考请求参数。接口说明请确保在使用该接口前，已充分了解智能媒体管理产品的收费方式和价格。调用该接口前，请先通过 CreateLocationDateClusteringTask 接口进行时空聚类。调试您可以在...

聚类分片

Proxima CE支持使用聚类分片方式检索任务，本文为您介绍聚类分片检索功能的使用方法及示例。前提条件已安装Proxima CE包，详情请参见安装Proxima CE包。基本原理 Proxima CE在检索时有两种划分数据分片的方式：哈希分片与聚类分片。您...

人脸聚类相关问题

本文介绍了在使用人脸聚类过程中可能遇到的问题。重要此文档已不再维护，建议您使用新版智能媒体管理。关于智能媒体管理新版与旧版的对比，请参见新旧版本使用指引。关于新版智能媒体管理人脸聚类的常见问题，请参见图片管理常见问题。...