“暗黑版”AI现身引忧虑我们需要怎样的人工智能？

小大

用微信扫描二维码
分享至好友和朋友圈

扫描到手机×

2018-07-09 07:15:03 新华网参与评论()人

另外是算法本身的影响。“这可能是无法完全避免的，由深度学习算法本身的缺陷决定，它存在内在对抗性。”王金桥表示，目前最流行的神经网络不同于人脑的生物计算，模型由数据驱动，和人类的认知不具有一致性。基于深度学习的框架，必须通过当前训练数据拟合到目标函数。在这个框架之下，如果机器要识别狗，它会通过狗的眼睛、鼻子、耳朵等局部特征进行可视化识别，而这些可视化特征却能给想利用深度学习漏洞的人机会，后者可以通过伪造数据来欺骗机器。

除了人训练机器的数据本身有偏差以外，机器通过对抗性神经网络合成的数据也可能有问题。由于机器不可能“见过”所有东西(比如识别桌子，机器不可能学习所有长短宽窄各异的桌子)，人也不可能标记所有数据。如果研究者输入一个随机的噪音，机器可以向任何方向学习。这是一把双刃剑，机器也可能合成一些有问题的数据，学习时间长了，机器就“跑偏”了。

数据的均衡或可减少“跑偏”

不少科学家以“garbage in, garbage out”来形容“数据和人工智能的关系”。中科视拓(北京)科技有限公司CEO刘昕说：“对机器学习而言，进什么就出什么。监督学习就是让模型拟合标签，比如训练者把帅哥都标记成‘渣男’，那么机器看到刘德华，就会认为他是……”谈到诺曼引发的讨论，刘昕表示：“不需要担心，人类本身就有各种歧视和偏见，用人类生产的数据训练AI，再批判AI不够正直良善，这么说有点危言耸听。”

偏见、刻板印象、歧视都是人类社会的痼疾，有些流于表面，有些深入社会肌理，无法轻易剥离。在这样的语境中产生的数据，携带着大量复杂、难以界定、泥沙俱下的观点。如果研究者没有意识到或着手处理这一问题，机器学习的偏见几乎无解。真正的“公正算法”或许是不存在的。