混合循环发电场输出电力预测

本文涉及的产品
交互式建模 PAI-DSW,5000CU*H 3个月
简介: 前言机器学习很多时候在工业场景下也会有非常好的应用。本次实验,我们就会以一个综合循环发电厂的发电数据来展示机器学习是如何应用到工业生产的实际场景中的。 本实验数据采集自 UCI 机器学习数据集中的 混合发电厂数据。

前言

机器学习很多时候在工业场景下也会有非常好的应用。本次实验,我们就会以一个综合循环发电厂的发电数据来展示机器学习是如何应用到工业生产的实际场景中的。

本实验数据采集自 UCI 机器学习数据集中的 混合发电厂数据。对于发电厂来说,风力发电的输出电力很大情况下决定了单位发电机能够生产的电能。因此,通过收集系统各个相关指标来预测最终的输出电力对于发电厂来说是非常有帮助的。有效的预测发电机的输出电力可以更好的评估安排电力生产计划,避免资源的浪费。

载入数据并进行数据探索

载入好数据集之后,里面是一个综合循环发电场的数据,一共有9568个样本数据。每个数据有5列,分别为:AT(温度), V(压力), AP(湿度), RH(压强), PE(输出电力)。下面是数据预览的截图:

_

然后为了找出对 PE 输出电力影响最大的因素,我们可以从左侧 组件-统计分析 拖入相关系数矩阵这个组件,来观察各个特征对于输出电力。

_

右键单击完成的组件,选择查看分析报告,就可以得到我们的相关性分析了。从这张相关性图中,我们不难看到和 输出电力最相关的因素就是 温度,其次是 压力,然后是湿度,再然后是压强。

对数据进行建模

观察完数据相关性之后,我们可以通过 组件-数据预处理 中的拆分组件 对数据做一次拆分,将数据分为训练集和测试集。然后再使用 组件-机器学习-回归 中的线性回归 来对我们的数据进行回归建模。这里我们需要选择我们的特征列(X)和我们的标签列(Y)

_

对回归模型进行预测和评估

建模完毕之后,我们可以通过 组件-机器学习 中的预测来预测该模型在测试数据集上的效果。只需要进行如下的配置即可 特征列我们选择 at,v,ap,rh 原样输出列我们全选即可。

_

我们在这一步完成之后可以右键模型,点击查看模型 即可看到不同的特征对于我们的结果量的权重

最后,再从左侧的 组件-机器学习-评估 中选择回归模型评估即可获得我们的模型效果。右键 回归模型评估-查看分析报告 即可发现我们的 RMSE 到达了 4.57。下面是整个实验完成后的截图

_

这样我们就通过线性回归模型建立了一个混合发电厂的发电电力预测模型。通过模型部署之后,我们就可以实时的为发电厂提供发电电力的预估,以便更好的安排电力的生产计划,避免资源浪费。

相关实践学习
使用PAI-EAS一键部署ChatGLM及LangChain应用
本场景中主要介绍如何使用模型在线服务(PAI-EAS)部署ChatGLM的AI-Web应用以及启动WebUI进行模型推理,并通过LangChain集成自己的业务数据。
机器学习概览及常见算法
机器学习(Machine Learning, ML)是人工智能的核心,专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能,它是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。 本课程将带你入门机器学习,掌握机器学习的概念和常用的算法。
目录
相关文章
|
5月前
|
存储 数据可视化 Serverless
使用蒙特卡罗模拟的投资组合优化
在金融市场中,优化投资组合对于实现风险与回报之间的预期平衡至关重要。蒙特卡罗模拟提供了一个强大的工具来评估不同的资产配置策略及其在不确定市场条件下的潜在结果。
70 1
|
8天前
|
数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(一)
22 0
|
8天前
|
移动开发 数据可视化
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
R语言两层2^k析因试验设计(因子设计)分析工厂产量数据和Lenth方法检验显著性可视化|数据分享(二)
18 0
|
8天前
|
数据可视化 算法 数据挖掘
用有限混合模型(FMM,FINITE MIXTURE MODEL)创建衰退指标对股市SPY、ETF收益聚类双坐标图可视化
用有限混合模型(FMM,FINITE MIXTURE MODEL)创建衰退指标对股市SPY、ETF收益聚类双坐标图可视化
17 2
|
9天前
|
运维 算法 数据可视化
电力消耗模型构建、分析和预测
电力消耗模型构建、分析和预测
25 1
|
8天前
|
人工智能
【视频】广义相加模型(GAM)在电力负荷预测中的应用(二)
【视频】广义相加模型(GAM)在电力负荷预测中的应用
14 0
|
8天前
|
算法 测试技术
Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES
Copula估计边缘分布模拟收益率计算投资组合风险价值VaR与期望损失ES
|
8月前
|
存储 传感器 数据可视化
嵌入式设计中对于只有两种状态的变量存储设计,如何高效的对循迹小车进行偏差量化
嵌入式设计中对于只有两种状态的变量存储设计,如何高效的对循迹小车进行偏差量化
57 0
|
8月前
|
编解码 算法 数据可视化
【多重信号分类】超分辨率测向方法——依赖于将观测空间分解为噪声子空间和源/信号子空间的方法具有高分辨率(HR)并产生准确的估计(Matlab代码实现)
【多重信号分类】超分辨率测向方法——依赖于将观测空间分解为噪声子空间和源/信号子空间的方法具有高分辨率(HR)并产生准确的估计(Matlab代码实现)
|
11月前
|
5G
带你读《5G大规模天线增强技术》——2.4.6 大尺度参数计算
带你读《5G大规模天线增强技术》——2.4.6 大尺度参数计算