呆板进修可否预测加密钱币的价值?
这份实用指南提供了你预测加密钱币价值飞速上涨所需的基本常识。
十五年前,我开始摸索数字钱币的世界,并为一个只利用短信的点对点移动钱币平台做了原型。
最近,我的一位相助者问我,人工智能是否可以预测加密钱币的价值。她对区块链的炒作很好奇。
颠末研究,我发明预测加密钱币价值是一个可以办理的问题,但绝对不是针对所有市场条件。
加密资产的典范预测模子将操作时间序列预测(如ARIMA、Facebook Prophet)、呆板进修(如随机丛林算法、线性回归)或深度进修要领(如LSTM)。
在本文中,我研究了在预测给定日期的Litecoin平均价值时,片段插值的表示如何。
数据
我们将存眷2013年4月至2021年2月期间Litecoin的汗青价值。这些数据取自coinmarketcap,而且是可以免费利用的。我将数据分为80%的练习数据集和20%的测试数据集。后者用于评估我们预测收盘价的精确性。
加密钱币Litecoin的价值汗青 (Source: Kaggle)
短暂的摸索性数据阐明昭示,平均收盘价在年头和年尾是最高的。10月份最低。
多项式回归你大概传闻过多项式回归,这可以说是建设一个阶数为d的基本来近似一个非线性函数(在我们的例子中,加密钱币价值颠簸)的最简朴例子。
我对Litecoin的汗青价值举办了简朴的多项式回归,利用5、25和80的阶数。在每种环境下,R2值将提供一些关于模子在测试数据集上的拟合度优劣的信息。
从下面的蓝线与练习数据的拟合度来看,我们可以调查到跟着多项式阶数的增加,曲线越来越陡峭。这是由于模子巨大性增加,因为高阶多项式试图追逐练习会合的每一个单一数据点。
第0天代表2013年4月30日,第2800天代表2021年2月28日。
出格是在有离群值的区域(图的中间部门),高阶多项式往往会向这些离群值的偏向成长。因此,80阶多项式的模子具有最高的方差。
它在练习数据上的毛病也是最低的,这表此刻最高的R2值上,对比之下,低阶多项式的R2更低,意味着更高的毛病但更低的方差。低阶多项式对练习数据的敏感性较低。
分片插值我发明一个更机动的要领是利用片段多项式来预测加密钱币价值。
分片插值用低阶多项式拟合大量的数据点。由于我们只利用低阶多项式,我们消除了太过的振荡和非收敛性。
给定一组数据点,分片插值的事情道理是在每一部门数据中利用差异的多项式。
出格是,我们利用毗连的分片多项式,也称为样条。
样条的一个例子是下面的截断线性函数。它在4的左边是平的,称为函数的结。
给定几个结点,我们可以将多个线性基函数组合起来,并将其拟合到非线性数据中。
为了检测加密钱币价值中存在的高度曲线干系,我利用了一个截断的三次函数,也叫三次样条。
利用三次样条,我们将数据支解成块,并对每个块拟合一个三次样条。每个样条函数在结点处毗连到下一个函数。
三次样条是加密钱币价值变革的一个很是好的选择,因为毗连是滑腻的。三次样条的斜率和它们的第一和第二导数都是匹配的。三次样条是3阶的多项式函数,它仍然足够小,以制止差别性。
三次B-样条是三次样条的一个更容易的变体,用于高效计较,因为最多有5个基函数参加孝敬插值。下面我们可以看到三次B-样条在Litecoin价值上的表示,将结点放在四分位数上之后。
通过手动选择结点,即在我们有一堆数据点的环境下,与按照四分位数安排结点时的值对比,我们在测试数据集上实现了更好的R2。
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。