http://www.7klian.com

谷歌又推出隐私掩护的计较框架——连系阐明

这样的功效使Google的工程师可以改进歌曲数据库,而无需任何电话透露任何歌曲,譬喻,通过确保数据库中包括真正风行的歌曲。Google声称,在其第一次改造迭代中,连系阐明使全球所有Pixel手机的总体歌曲识别率提高了5%。
譬喻,在一项用户研究中,Gboard工程师按照手机上生存的原始打字数据丈量了单词预测模子的整体质量。参加研究的电话下载了一个候选模子,在当地计较了该模子的预测与实际键入的单词匹配水平的怀抱,然后上传了该怀抱,而无需对模子自己举办任何调解或对Gboard的键入体验举办任何变动。通过平均很多手机上载的指标,工程师相识了模子机能的总体程度摘要。

当Google Play识别出一首歌曲时,,它会将曲目名称记录到设备上的汗青记录中;当手机处于空闲状态且正在通过Wi-Fi举办充电时,Google的连系进修和阐明处事器有时会邀请其插手用数百部手机举办计较。该回合中的每部电话城市计较其“正在播放”汗青记录中歌曲的识别率,并利用安详的聚合协议对功效举办加密。加密的费率被发送到连系阐明处事器,该处事器没有用于单独解密它们的密钥。与本轮其他手机的加密计数团结利用时,处事器可以解密所有歌曲计数的最终计数。
除了模子评估之外,Google还利用连系阐明在其Pixel手机上支持“正在播放”成果,该成果可显示四周大概正在播放的歌曲。在引擎盖下,“正在播放”可轻敲设备上的歌曲指纹数据库,无需移动网络即可识别手机四周的音乐。
“我们还在开拓技能,以答复分手数据集上甚至更多迷糊其词的问题,譬喻’我的模子难以识别哪些数据模式?”通过练习连系生成模子。我们正在摸索应用用户级差分私有模子练习的要领,以进一步确保这些模子差池任何一个用户独一的信息举办编码。” Ramage和Mazzocchi写道。“连系阐明要领仍处于早期阶段,需要以更高的精确性来答复很多常见的数据科学问题。但连系阐明使我们可以或许以差异的方法来思量数据科学,个中分手的数据和隐私掩护聚合发挥中心浸染。”

在另一项研究中,Gboard工程师但愿发明用户凡是键入的单词,并将其添加到辞书中以举办拼写查抄和键入发起。他们仅利用在全球辞书中还没有在这些电话上键入的单词来练习电话上的字符级轮回神经网络。从来没有打字过的单词分开电话,可是可以在数据中心中利用生成的模子来生成频繁键入的字符序列(即新单词)的样本。

近期谷歌牵头的连系计较连续有产出,继连系进修后,连系阐明也获得实践。以此成长偏向,与谷歌论文中描写的连系计较通用框架的方针又近了一步。
春连系阐明的第一个摸索是支持连系进修:当数据中心中没有可用的数据时,工程师如何按照实际数据权衡连系进修模子的质量?谜底是从头利用连系进修基本架构,但没有进修部门。”谷歌研究科学家丹尼尔·拉奇(Daniel Ramage)和软件工程师Stefano Mazzocchi在一份声明中说。“在连系进修中,模子界说不只可以包罗要优化的损失函数,还可以包罗代码以计较指示模子预测质量的指标。我们可以利用此代码直接评估手机数据上的模子质量。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。

相关文章阅读