首页 置换 选车 估价 问答 生活 经销商 车管所 汽车资讯 汽车销量 车牌查询 今日油价 天气预报
您的位置: 首页 > 生活 > 生活 > ai对元宇宙的重要性(用AI预测北京雾霾)
ai对元宇宙的重要性(用AI预测北京雾霾)
更新时间:2024-07-05 17:48:46

ai对元宇宙的重要性(用AI预测北京雾霾)1

图:pixabay

原文来源:machine learning mastery

作者:Jason Brownlee

「机器人圈」编译:多啦A亮

神经网络诸如长短期记忆(LSTM)循环神经网络(RNN)能够几乎无缝地模拟多个输入变量的问题。

这是时间序列预测中的一大优点,而经典线性方法难以适应多变量或多输入预测问题。

在本教程中,你将发现如何在Keras深度学习库中开发多变量时间序列预测的LSTM模型。

完成本教程后,你将知道:

•如何将原始数据集转换为可用于时间序列预测的内容。

•如何准备数据并适应多变量时间序列预测问题的LSTM。

•如何做出预测并将结果重新调整到原始单位。

第一步是将日期时间信息整合到一个单独的日期时间,以便我们可以将其用作Pandas的索引。

快速检查显示前24小时pm2.5的NA值。 因此,我们需要删除第一行数据,在数据集中还有几个分散的“NA”值; 我们现在可以用0值标记它们。

以下脚本加载原始数据集,并将日期时间信息解析为Pandas DataFrame索引。No列被删除,然后为每列指定更清晰的名称。最后,将NA值替换为“0”值,并删除前24小时。

ai对元宇宙的重要性(用AI预测北京雾霾)2

运行该示例打印转换后数据集的前5行,并将数据集保存到“pollution.csv”。

ai对元宇宙的重要性(用AI预测北京雾霾)3

现在我们以简单易用的形式提供数据,我们可以创建每个系列的快速图,来看看我们得到的。

下面的代码加载了“pollution.csv”文件,并将每个系列作为单独的子图绘制,除了风速是分类的。

ai对元宇宙的重要性(用AI预测北京雾霾)4

运行示例创建一个具有7个子图,显示每个变量的5年数据。

ai对元宇宙的重要性(用AI预测北京雾霾)5

空气污染时间序列线图

多变量LSTM预测模型

在本节中,我们将使用LSTM解决问题。

LSTM数据准备

第一步是为LSTM准备污染数据集。

这涉及将数据集视为监督学习问题并对输入变量进行归一化。

考虑到上一个时间段的污染测量和天气条件,我们将把监督学习问题作为预测当前时刻(t)的污染情况。

这个构想是直接的,只是为了这个演示。你可以探索的一些替代方法包括:

•根据过去24小时的天气和污染情况,预测下一个小时的污染。

•预测下一个小时的污染,并给予下一个小时的“预期”天气条件。

我们可以使用在下列文章中开发的series_to_supervised()函数来转换数据集:

•如何将时间序列转换为Python中的监督学习问题。

首先,加载“pollution.csv”数据集。风速特征是标签编码(整数编码)。如果你有兴趣探索,这可能会在将来进一步被热编码。

其次,所有功能都被归一化,然后将数据集转换为监督学习问题。然后删除要预测的小时的天气变量(t)。

完整的代码清单如下:

ai对元宇宙的重要性(用AI预测北京雾霾)6

运行示例打印转换后的数据集的前5行。我们可以看到8个输入变量(输入序列)和1个输出变量(当前小时的污染水平)。

ai对元宇宙的重要性(用AI预测北京雾霾)7

这个数据准备很简单,我们可以探索更多的东西。你可以看到的一些想法包括:

•独热编码风速。

•通过差分和季节性调整使所有系列固定。

•提供超过1小时的输入时间步长。

最后一点可能是最重要的,因为在学习序列预测问题时,LSTMs通过时间使用反向传播。

定义和拟合模型

在本节中,我们使用多变量输入数据的LSTM。

首先,我们必须将准备好的数据集分成训练集和测试集。为了加快对这次示范的训练速度,我们将仅适用于数据第一年的模型,然后对其余4年的数据进行评估。如果你有时间,请考虑浏览此测试工具的倒置版本。

下面的示例将数据集分成训练集和测试集,然后将训练集和测试集分成输入和输出变量。 最后,将输入(X)重构为LSTM预期的3D格式,即[样本,时间步长,特征。

ai对元宇宙的重要性(用AI预测北京雾霾)8

运行此示例打印训练集的形状,并测试输入和输出集合约9000小时的数据进行训练,约35000小时的数据进行测试。

ai对元宇宙的重要性(用AI预测北京雾霾)9

现在我们可以定义并配置LSTM模型

我们将在第一个隐藏层中定义具有50个神经元的LSTM以及输出层中用于预测污染的的1个神经元。输入形式将是一个时间具有8个特征的步长,。

我们将使用平均绝对误差(MAE)损失函数和随机梯度下降的高效Adam版本。

该模型将配置为适用于50个批量大小为72的训练周期。请记住,每个批处理结束时,Keras中的LSTM的内部状态都将重置,因此一个内部状态是一个有关大量天数的函数将会有所帮助。(不妨试一试)。

最后,我们通过在fit()函数中设置validation_data参数来跟踪训练过程中的训练和测试损失,然后在运行结束时,绘制训练和测试损失曲线图。

ai对元宇宙的重要性(用AI预测北京雾霾)10

评估模型

当模型配置好之后,我们可以对整个测试数据集进行预测。

我们将预测与测试数据集相结合,并进行反缩放,我们还用预期的污染数据对测试数据集进行反缩放。

以预测值和实际值为原始尺度,我们可以计算模型的误差值。在这种情况下,我们计算出在与变量本身相同的单位中产生误差的均方根误差(RMSE)。

ai对元宇宙的重要性(用AI预测北京雾霾)11

完整示例

完整的示例如下所示:

ai对元宇宙的重要性(用AI预测北京雾霾)12

想要运行示例的话,首先需要创建一个绘图,显示训练期间的训练和测试损失。

有趣的是,我们可以看到测试损失低于训练损失。该模型可能过度拟合训练数据。在训练过程中测量和绘制RMSE曲线可能会使这一点显现得更加明显。

ai对元宇宙的重要性(用AI预测北京雾霾)13

训练期间多元LSTM的训练集和测试线路图

训练和测试损失在每个训练时期结束时都会打印出来。在运行结束时,打印测试数据集上模型的最终RMSE。

我们可以看到,该模型实现了3.836的可观RMSE,这显著低于用持续模型发现的30 RMSE。

ai对元宇宙的重要性(用AI预测北京雾霾)14

进一步阅读

如果你想进一步深入了解,本部分将提供更多关于该主题的资源。

•在UCI机器学习库中的北京PM2.5数据集。

•Keras长短期记忆模型的5步生命周期。

•使用Python中的长短期记忆模型进行时间序列预测。

•用Python中的长短期记忆模型进行多步时间序列预测。

总结

在本教程中,你发现了如何将LSTM适用于多变量时间序列预测问题。

具体来说,通过本教程你将学到:

•如何将原始数据集转换为可用于时间序列预测的内容。

•如何准备数据并配置用于多变量时间序列预测问题的LSTM。

•如何做出预测并将结果重新调整到原始单元中。

,
相关推荐RECOMMEND
蓝色的象征意义和内涵(蓝色代表什么寓意)
蓝色的象征意义和内涵?蓝色是博大的色彩,提到蓝色,往往想到的都是天空和大海蓝色是永恒的象征,它是最冷的色彩,表现出一种美丽、文静、理智、安祥与洁净,我来为大家科普一下关于蓝色的象征意义和内涵?以下内容...
三毛的撒哈拉最感人的故事(三毛与撒哈拉的故事)
三毛,1943年3月出生于重庆,为浙江省舟山市定海人。1948年跟随父母移居台湾。1967年远赴西班牙留学,之后去了欧洲许多国家。1973年与荷西定居西属撒哈拉沙漠的首府拉庸,在这里她写下了一系列以沙...
卤水放什么调制(卤水要没过食材吗)
很多朋友喜欢卤水,所以他们十分关注于用于卤水的香料搭配,关于卤水的香料,人们总是投注了大量的目光,而有一些看似简单的问题,却往往被人们所忽略,其中小鸣觉得有这么两个问题,它们看寻常,却十分值得聊聊,因...
海鸭蛋的配方(爱吃赶紧学起来)
海鸭蛋的配方?海鸭蛋去壳,放到碗里,放少量水和酒,还有油,盐搅拌打匀,今天小编就来聊一聊关于海鸭蛋的配方?接下来我们就一起去研究一下吧!海鸭蛋的配方海鸭蛋去壳,放到碗里,放少量水和酒,还有油,盐搅拌打...
猪血可以和菠菜一起吃吗(猪血和菠菜能一起吃吗)
猪血可以和菠菜一起吃吗?猪血和菠菜是可以一起吃的我国传统的食物搭配,从营养学角度来看,有些恰恰是于人体健康无益,甚至是有害的但是菠菜与猪血一起做菜却可以起到相得益彰的作用,我来为大家科普一下关于猪血可...
女士穿西装有什么搭配(不仅要体现出时尚帅气的效果)
时尚让每一个人变得美丽起来,也自信起来,对于爱美的女性来说可以尝试不同的风格来摸索出属于自己的时尚路线来。而今秋非常的流行西装的穿搭,可以说西装是每位爱美女性都想尝试的一个款,带着中性的风格优雅又帅气...