科技推荐:研究人员在摆脱数据方面取得了有限的成功

2021-06-07 09:33:19

科技改变生活,也在一定的程度上科改善生活!那么现如今生活条件越来越好以后大家更多的关注点都不同,但是近来有很大一部分了却同时关注到了研究人员在摆脱数据方面取得了有限的成功的消息!

人工智能系统有着奇怪的记忆。机器拼命地依赖于他们已经训练过的数据,因此难以删除它的部分内容。实际上,它们通常必须使用较新的较小数据集从头开始重新训练。

在个人可以根据欧洲的GDPR规则等隐私措施要求将其个人数据从公司数据库中删除的时代,这并不好。如何从已经过培训的机器学习中删除一个人的敏感信息?一个2017年的研究论文通过法律和政策的学者暗示,甚至是不可能的。

“删除很困难,因为大多数机器学习模型都是复杂的黑盒子,因此不清晰数据点或数据点是如何被真正使用的,”斯坦福大学生物医学数据科学助理教授James Zou告诉The。注册。

为了省略特定数据,通常必须使用较新的较小数据集重新训练模型。这是一个痛苦,因为它花费金钱和时间。

由斯坦福大学博士生Antonio Ginart领导的这项研究研究了试图删除机器学习模型中数据的问题,并设法制作了两个“可证明删除有效的算法”来删除六个不同数据集中的数据,用于k均值聚类模型,一种开辟分类器的机器学习方法。结果已经发布,本周在一份文件中的arXiv。

诀窍是评估从训练模型中删除数据的影响。在某些情况下,它可能会导致系统性能下降。

“首先,快速检查删除数据点是否会对机器学习模型产生任何影响 - 有些设置没有效果,因此我们可以非常有效地执行此检查。其次,看看要删除的数据是否只影响学习系统的某些本地组件,只是在本地更新,“邹解释说。

在某些情况下,当数据可以更容易分离时,它似乎对于k-means聚类模型是可行的。但是,对于像现代深度学习模型那样不具有确定性的系统,删除数据非常困难。

邹说,这并非完全不可能。“我们还没有工具,但我们希翼在未来几个月内开辟这些删除工具。”

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。