大数据丑闻频发,人工智能怎么避开侵犯用户隐私的坑?谷歌这样说

发布时间:2019-12-27 13:06:07   来源:大数据   点击:
2019年度的谷歌开发者大会Google I/O 2019在美国加州山景城召开。与往年相比,大会似乎没有特别让人惊艳的亮

2019年度的谷歌开发者大会Google I/O 2019在美国加州山景城召开。与往年相比,大会似乎没有特别让人惊艳的亮点,但几处与人工智能相关的进展,还是体现了谷歌作为大公司的思考与责任感。

用新方法应对人工智能的偏见问题

谷歌CEO Sundar Pichai今年的演讲题目是“成为惠及每一个人的谷歌”。在演讲中,他特别介绍,谷歌正在用一种叫做“概念激活向量检测 (testing with concept activation vectors,以下简称TVAC)”的新研究方法,尝试解决机器学习中存在的偏见问题。

谷歌的担心并非杞人忧天。近两年,随着人工智能技术走向应用,学界和现实生活中都出现了涉及人工智能偏见的案例,比如人脸识别系统将肤色较深的女性错误识别为“大猩猩”,贷款工具向拉丁人和黑人贷款者收取更高的利息,招聘工具更偏好男性,等等。

麻烦的是,人工智能系统的学习和处理过程非常复杂,导致了“算法黑箱”的存在人工智能系统就像一个黑盒子,它很聪明,能够就某些问题给出结果,但人类并不知晓盒子内部的运作过程。因此,在很多情况下,人类甚至很难判断人工智能的偏见是怎样形成的,该从哪里着手进行改进。

谷歌的TVAC研究方法,正是为了提高“算法黑箱”的透明度。在演讲中,Pichai举例说,假设一个算法模型被用来检测“医生”,当训练数据中有更多的男性医生图像时,这个模型就可能错误地认为男性是医生的一项重要特征。TVAC可以测试模型的运作原理,发现类似的问题。

“我们已经将TCAV开源,因此每个人都可以使他们的AI系统更公平和更具可解释性。” Pichai说。

在保护用户隐私的基础上进行算法改进

大数据,被视为人工智能发展的基石。在过去很多年里,人们并没有意识到大数据使用中的隐私风险,企业对用户数据的收集使用达到了无节制的程度,结果是“数据丑闻”在近两年集中爆发。

比如今年刚被曝光的IBM,为了进行人脸识别训练,未经当事人许可,便从网络图库上获得了近100万张照片。亚马逊的智能音箱Alex,也屡次因隐私问题引发美国用户的质疑。虽然企业总会辩称匿名化处理后的数据无法对应到具体的用户,人们还是无法完全放下担忧。

面对棘手的现状,谷歌又能怎么做呢?Pichai介绍了“联盟学习(federated learning)”的新技术。他说,有了联盟学习的加持,谷歌可以在原始数据不离开用户设备的情况下训练AI模型并使产品更智能。

据了解,联盟学习诞生于 2016 年,是一种直接在用户的设备上训练算法的技术。算法的更新情况会被加密传送到云端,从而改进模型。用户的数据则不用被上传到云端。目前,联盟学习已经被应用在谷歌输入法上。Pichai说,谷歌的 Gboard可以在成千上万的人使用“zoodles”这种新单词之后学会它们,而谷歌并不知道用户在输入什么。

“展望未来,我们正在挑战产品需要更多数据以变得更有帮助的观念”,Pichai说,“人工智能的进步将提供更多的方法,在使用更少数据的情况下也能让产品更有帮助。”

“为每个人进行研发”,特别是弱势群体

在开发者大会上,谷歌强调了“为每个人进行研发”的理念,并推出了几款带有新工具和无障碍功能的产品。其中,谷歌和渐冻人治疗发展研究所、ALS Residence Initiative等非营利组织合作推出的Euphonia项目,尤为引人注目。

许多疾病会导致人们逐渐丧失说话能力,比如渐冻症。在已经展开的实验中,Euphonia项目记录了渐冻症患者的说话情况,研究人员希望通过算法的训练,让谷歌语音助手能够识别这些听上去模糊不清的语音。

不仅如此,谷歌还在研发能够识别手势和面部表情的算法。这意味着,完全失去说话能力的患者,也有机会与他人进行正常、方便的交流。

一些既有工具的功能则更强大了。去年大会上,谷歌手机助手中新增的Duplex技术亮相,它可以帮助用户打电话预订餐厅、理发店等,像真人一样与工作人员对话,让很多技术爱好者直呼“惊为天人”。如今,谷歌将这一技术扩展到语音之外,用户可以借助它预订租车和电影票。通过“网络上的Duplex”,Google Assistant助手会自动地输入信息,跟进预订流程,替用户完成购买。

2018 谷歌I/O大会展示了Duplex与理发店工作人员对话过程。

能进行图像识别和文本翻译的手机应用Google Lens 也有更新。假设你在一家餐厅里,把相机对准菜单,Google Lens 会突出显示哪些菜是受欢迎的,并展示相关图片和之前顾客的评论。同时,谷歌推出了GoogleGo应用,进入应用后,Google Lens 会大声念出用户看到的单词。Pichai说,这一应用旨在帮助世界各地数百万难以阅读日常文字的成人,比如街道标识或 ATM 指示。

家住印度的Urmila从小没上过学,完全不识字。Google Lens可以识别文字并读出来,这样一来,Urmila就不用再向他人求助了。

采写:南都记者冯群星

------分隔线----------------------------

相关文章

浏览排行

周排行
月排行