http://www.7klian.com

如何规复在实际陈设研究中面对挑战的呆板进修管道输出的可信度

呆板进修(ML)将颠覆所有规模。 这是已往几年中我们不绝听到的故事。 除了从业者和一些极客,大大都人都不相识ML的细微不同。 ML绝对与人工智能有关。 它是纯子集照旧细密相关的区域取决于您询问的人。 通用人工智能的空想是让呆板利用认知技术来办理所有规模以前不曾见到的问题,这酿成了AI的冬天,因为这些要领在40或50多年来没有发生功效。 ML的鼓起扭转了排场。 跟着计较机成果的加强,ML变得易于处理惩罚,而且有关差异规模的更大都据可用于练习模子。 ML将留意力从实验利用数据和标记逻辑举办预测的整个世界转移了。 取而代之的是,呆板进修依赖于统计要领并限制了预测范畴,如下所述。

呆板进修中有三种单独的要领: 一种称为监视进修,第二种称为半监视进修,第三种称为无监视进修。 深度进修的特点是多层此类要领。 呆板进修的乐成来自模子在特定规模(称为练习集)举办大量数据练习以举办预测的本领。 在任何ML管道中,都利用数据来练习很多候选模子。 练习竣事时,模子中将对必不行少的规模根基布局举办编码。 这使得ML模子可以泛化以在现实世界中建设预测。 譬喻,可以将大量的猫视频和非猫视频输入模子,以练习模子识别猫视频。 练习竣事时,在乐成的模子中会编码必然数量的猫视力。

ML已在很多熟悉的系统中利用。 包罗基于寓目数据的影戏推荐,基于购物车当前内容推荐新产物的市场阐明。 面部识别,从临床图像预测皮肤癌,从视网膜扫描识别视网膜精神病变,从MRI扫描预测癌症均属于ML规模。 虽然,用于影戏和预测皮肤癌或视网膜精神病和失明的开始的推荐系统在范畴和重要性上有很大的差异。

如何光复在实际摆设研究中面临挑战的机械学习管道输出的可信度

显示风行病学未明晰说明的传染轨迹的各类预测… [+] 在差异的起点初始化模子

从纸上:

培训之后的要害思想是利用独立的且均平漫衍的(iid)评估措施,该进程利用从培训漫衍中得到的尚未碰着的数据。 该评估用于选择在现实世界中陈设的候选工具。 尽量由于开始的假设,运行次数,他们所练习的数据等原因,尽量他们之间存在细微的差别,但很多候选人在此阶段的表示相似。

抱负环境下,iid评估可以预测模子的预期机能。 这有助于将小麦与谷壳疏散。 来自iid-optimal模子的哑巴。 很明明,练习集与现实世界之间会存在一些布局上的失调。 现实世界杂乱,杂乱,图像恍惚,操纵员未接管过捕获原始图像的练习,设备妨碍。 在评估阶段被认为等效的所有预测变量应该在现实世界中已显示出雷同的缺陷。 由三位主要认真人撰写并获得五十位研究人员支持的论文均来自google GOOG,他们对该理论举办了探讨,以表明现实世界中ML模子的很多重大失败。 该文件指出,在评估阶段所有表示相似的预测变量没有在现实世界中表示均等。 嗯,这意味着管道末端无法区分哑巴和优秀绩效者。 本文是对选择预测变量的进程和ML管道当前结构的大锤。

本文将这种行为的基础原因确定为ML管道中的规格不敷。 规格不敷是呆板进修中一个很好领略和充实记录的现象,它的呈现是由于存在比独立线性方程式更多的未知数。 规格不敷是一种有打算的计策,可以更快地告竣选择。 第一个主张是ML管道中的规格不敷是靠得住地练习行为如预期在陈设中的模子的主要障碍。 第二个主张是规格不敷在ML的现代应用中无处不在,而且具有实质性的实际意义。 无法轻松办理规格不敷的问题。 另外,所有利用旧管道的已陈设ML预测变量都是可疑的。

办理方案是要意识到规格不敷的风险,,并选择多个预测变量,然后对其举办压力测试并选择机能最佳的预测变量; 换句话说,扩大测试范畴。 所有这些都表白需要在培训和评估会合利用更好质量的数据,这使我们可以或许利用区块链和智能合约来实施医疗保健系统。 得到更高质量和多样化的培训数据可以淘汰规格不敷,从而为更快地成立更好的ML模子提供途径。

如何光复在实际摆设研究中面临挑战的机械学习管道输出的可信度

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。