时序预测算法在蔚来汽车的运行探求

蔚来汽车成立于2014年11月,是上流智能电动汽车市场的先驱及领跑者。蔚来的使命是发明愉悦的生存模式。蔚来旨在打造一个以智能电动汽车为终点的社区,与用户分享欢畅、独特生长。

围绕社区,蔚来汽车共有5大版块业务,区分是:

蔚来汽车旨在构建环球翻新的智能动力服务体系,本文将重点引见NIO Power这局部业务。NIO Power 是基于移动互联网的加电处置方案,领有宽泛规划的充换电设备网络,附丽蔚来云技术,搭建了“可充可换可更新”的动力服务体系,为车主提供全场景化的加电服务,关键包含家充桩2.0、家用快充桩、超充桩、换电站、一键加电等,用户可经过蔚来APP充电地图搜查加电资源。

蔚来领有丰盛的车型体系,包含六座智能电动旗舰SUV ES8、中大型五座智能电动SUV ES7(或EL7)、五座全场景智能电动SUV ES6、五座智能电动旗舰轿跑SUV EC7、五座智能电动轿跑SUV EC6、智能电动旗舰轿车ET7及中型智能电动轿车ET5。

关于时序预测,首先要回答的一个疑问是时序数据是什么。

时序数据,就是序列随期间变动的数据。期间序列剖析,普通有时域和频域两种剖析方法。时序预测的实质是在时域和频域层面探求期间序列变动的外在法令。

下图形容的是时域(temporal domain),横坐标是期间,纵坐标是某个测量信号的数值。时域能够最直观地反映序列随期间的变动。

时域剖析普通包含周期、节令和趋向这三类法令:

另一种时序的剖析方法是频域剖析,下图展现的就是某个期间序列的频域(frequency domain),反映的是序列频率的变动,横坐标是信号的频率,纵坐标是信号的振幅或能量等物理量。

频域剖析有个关键的概念叫做谱密度,其外围现实是:信号是由少数主频叠加而成的。

上述这一思想在其余畛域也会频繁被经常使用,例如将期间序列启动主成分合成等。

(1)经常出现义务

时序预测的经常出现义务可以依照输入变量数量、输入序列长度、输入序列期间跨度这3种维度启动划分:

①依照输入变量数量划分,包含:

②依照输入序列长度划分,包含:

③依照输入序列期间跨度划分,包含:

此外,输入变量也有单变量和多变量之分,这种模式可以拆解为多个不同的上述义务处置。

欢迎大家经过蔚来加电地图检查左近的补能资源,让加电比加油更繁难(链接如下):

如上图所示,要求对全国1000多个换电站启动预测,其预测的运行场景关键包含:

关于新建换电站,要求对不同地址的需求量启动预测,从而选出最佳换电站的建站地址。

换电站的目的是把低电量电池换出去,把满电电池换出去;

由于电网每天24时段存在峰谷平电价差,假设将电尽或许多的充在“谷”时,这样充电的电费老本也会降低;

由于电池是可分别的,因此电池要求依据换电站的实践需求启动调度以满足用户日常和节假日的出行换电需求。

(3)业务需求

基于上述运行场景,会发生以下的业务需求:

(4)算法义务

基于上述3类业务需求,转化成以下3类基于Seq-to-seq的算法义务:

(1)不同换电站的序列不同

如下图所示,不同换电站对应序列的周期性是不相反的。

显然,换电站A、换电站B和换电站C在每天的周期性变动不同。

(2)序列间的节令性不分歧

除了周期性,不同换电站序列的节令性是不相反的;

显然,换电站A、换电站B和换电站C在相反节假日的节令性不同。

(1)节假日期间不固定

不同年份的春节等大型节假日的期间是不固定的。

惯例的监视学习是基于X变量来预测y,是一个f(X)疑问;而关于时序预测,未来的时变变量t是已知的,因此会变成f(X,Xy)疑问。

正如刚才所言,节假日期间是不固定的,所以惯例的监视学习并不实用,而预测的期间先验就显得尤为关键。

电区房普通建在换电站周边3km范围内,其笼罩用户是继续增长的。

换电站的新建与废除,都会对用户形成影响,造成周边单量的突变。因此,增长和竞争都是十分关键的要素。

首先引见算法系统架构的大略状况:

关于期间序列预测模型,罕用的机器学习模型关键包含以下3类:ARIMA,Prophet,LGB。这3类模型的优缺陷如下:

③实用场景:名目初期冷启动

(2)Prophet

③实用场景:名目初期迭代

③实用场景:名目中期迭代

前文提到,机器学习的可操作性以及模型成果都是有限的,会遇到瓶颈,因此引入深度学习模型:

①深度学习模型架构

时序预测义务所触及到的CNNs、RNNs和Transformers等模型都属于生成模型,具有一致的架构(unified architecture),这样的架构有两个重点局部,一个是Embedding引擎局部,另一个是编码器-解码器局部,如下图所示:

②架构Embedding引擎

系统架构中的Embedding引擎关键包含Token Embedding、Value Embedding 、Positional Embedding、Temporal Embedding这4个局部;这4个局部针对的数据或特色是不同的,其中Token Embedding针对属性变量,Temporal Embedding针对期间相关变量,而Value Embedding和Positional Embedding则针对其余相关变量;最后将以上4类embedding启动叠加和融合,最终失掉一个浓密的特色向量。

上方对这4类embedding启动详细的引见:

Token Embedding关键用来处置多序列的疑问。

Token经常出现于自然言语处置,是“词”的数字化示意;此处经常使用token用来表白属性变量。

详细来说,关于监视学习的一组变量X和y,要求参与属性变量来表明是来自A换电站还是B换电站,因此要求经过token embedding来处置此类疑问。

咱们所用到的属性变量关键包含换电站自身表征、换电站所属区域(位于城区还是城际)、换电站所属位置(建在商场、服务区还是景点等)等这几类和业务相关的、固有的属性。

Value Embedding关键用来处置竞争与增长方面的疑问。

在某个换电站左近新建一个站,或许下线一个站,该换电站的订单往往会发生突变;而这样的竞争与增长又是容易被漠视的相关变量,因此不能仅思索单序列维度,而是要综合思索区域维度。从用户角度,依据用户车辆、电池的类型对用户启动区分(规范续航或长续航),并对区域范围内换电站的数量以及单量启动统计和聚合,构成Value Embedding。

Positional Embedding关键用来处置复杂节令性疑问。

例如,雷同是国庆节,不同换电站的序列变动差异很大。如何掌握不同的变动位置,要求经常使用相似transformer的Positional Embedding方法,来标志不同序列在不同节令性下的变动位置。

Temporal Embedding关键用来处置两个疑问,一个是节假日期间不固定疑问,另一个是期间先验疑问。

关于第一个节假日不固定疑问,咱们的节假日包含阳历节日和农历节日;依据序列的期间周期可以拆分红小时、天、周、月、年等惯例周期;关于节假日期间的对齐模式,包含硬对齐和软对齐两种模式。硬对齐关键指序列依照周、月、年等模式启动序列对齐,而软对齐关键是指将序列启动傅里叶变换,找到序列的主频,借助序列的频域消息启动对齐。

关于第二个期间先验疑问,如下图所示,预测的期间数据已知,然而其它相关输入变量未知,这就形成了输入数据的维度不分歧。

关于上述疑问,经过填充未知的其余变量令输入数据的维度分歧,并依据位置的标志区分已知变量和未知变量,最终可以失掉输入的预测变量。

③卷积模块设计

DCN局部中卷积层的设计,首先面临如下的思索:假定输入序列长度等于L,第i个卷积层的卷积核大小等于2i+1,步长等于1,要求多少卷积层?

确定了卷积层的层数,将卷积层经过残差层子模块,像搭积木一样衔接成全体的网络模块。

模型融合方面,有三个疑问值得思索:

模型成果评价,选用相对误差(MAE)和百分比误差(MAPE)来权衡。如下表所示,随着模型的迭代,MAPE的优化相对有限且不够现实(现实误差在5%以内,实践调优后的结果在23%左右)。

下图是对未来30个点的数据启动多步预测的结果,纵坐标是一切换电站叠加的总和,并启动了一个线性变换(不影响结果的趋向):

对比上图LGB结果、DCN结果和实践值,可以看出:

至于最终结果依然停滞在23%左右遇到瓶颈,这里就引入了一个对生成模型的思索。近期大火的GPT也是一种生成模型,然而实质上这类模型并没有规范答案,可以将其了解成一种“发明”;而时序预测也是一种生成模型,然而这个模型是有规范答案的,同时也会遭到外界环境如疫情、出行等诸多无法预测的要素所影响,而模型的训练也容易对过去的体现法令过拟合。

未来方案:

实时化:数据和结果的更新照应更快。消息差很大水平选择了模型的预测成果,之前在实时特色上做了很多任务,接上去会将更多离线特色转成实时特色,尽或许多地失掉实时化的数据,始终更新模型的预测结果。

高效化:开发效率更快。将一致的架构提炼构成算法库,成功算法的低代码开发和迭代。

纵向谋求算法出色。行业的开展很快,接上去会始终关注其余低劣前沿专家的相关任务。

横向谋求配置完善。时序除了预测还包含其余义务,接上去会尽或许经常使用一种架构笼罩全方面的业务需求。

组织内成功高效赋能。将现有的工具推行到更多有相似需求的其它部门,赋能其它业务的极速开展。

组织外成功开源共创。适当机遇或许会经过开源相关工程技术,源源始终地为预测算法注入新的思绪和方法

Q1:深度学习数据训练集要到达怎么的规模,其成果才会优于传统的机器学习模型?

A1:现有模型经常使用的数据大略是3年的历史数据。首先,换电站的树立是逐渐累积的,不同的换电站,会存在“冷启动”这样的疑问;而文中所展现的架构可以有效地成功这种“冷启动”疑问。至于深度学习训练集的规模,这个关键还是仰仗阅历,很难有明白的界限。关于新建换电站,深度学习模型的成果确实并不现实;关于已投产2-3年的换电站,其深度学习的成果要显著优于机器学习。

Q2:智能驾驶遍及之后,交通流的预测能否还无心义?

A2:预测的意义必需是有的,对节假日、早晚高峰以及关键路段等车流量突增状况的提早预知,对车联网的调度意义严重,而仅驳回智能驾驶的“暂时调整”战略则是低效且滞后的。

您可能还会对下面的文章感兴趣: