机器人三定律与嵌入式的机器伦理调节器
其实,这一思路并不新鲜,早在70多年前,美国人阿西莫夫在对机器人三定律的科学幻想中,就提出了通过内置的“机器伦理调节器”使机器人成为服从道德律令的类似构想。在短篇科幻小说《转圈圈》(1942)中,阿西莫夫提出了按优先顺序排列的机器人三定律:第一定律,机器人不得伤害人类或坐视人类受到伤害;第二定律,在与第一定律不相冲突的情况下,机器人必须服从人类的命令;第三定律,在不违背第一与第二定律的前提下,机器人有自我保护的义务。此后,为了克服第一定律的局限性,他还提出了优先级更高的机器人第零定律:机器人不得危害人类整体或坐视人类整体受到危害。
从内涵上讲,机器人定律是一种康德式的道德律令,更确切地讲是人为机器人确立的普遍道德法则,以确保其成为遵守绝对道德律令的群体。而更耐人寻味的是,机器人三定律是通过技术实现的。在《转圈圈》中,三定律是根深蒂固地嵌入到机器人的“正电子”大脑中的运行指令:每个定律一旦在特定场景中得到触发,都会在机器人大脑中自动产生相应的电位,最为优先的第一定律产生的电位最高;若不同法则之间发生冲突,则由它们的大脑中自动产生的不同电位相互消长以达成均衡。这表明,机器人定律并不全然是道德律令,也符合其技术实现背后的自然律。换言之,机器人定律所采取的方法论是自然主义的,它们是人以技术为尺度给机器人确立的行为法则,既体现道德法则又合乎自然规律。
历史地看,这些富有电气化时代色彩的机器人伦理设计实际上是一种科技文化创新。自英国作家雪莱夫人创作《弗兰肯斯坦》(1818)到捷克的恰佩克发表《罗素姆万能机器人》(1921),不论是前者呈现的科学怪人的形象,还是后者昭示的机器人造反,都体现了人对其创造物可能招致毁灭性风险与失控的疑惧。机器人定律则为摆脱这种情结提供了可操作性的方案——通过工程上的伦理设计调节机器人的行为,使其成为可教化的道德的机器人——合伦理的创造物。但从自然主义的方法论来看,这一构想又似乎明显超前。在提出第零定律时,阿西莫夫也意识到,机器人可能无法理解人类整体及人性等抽象概念。或许是这些困难令他转而畅想,一旦机器人灵活自主到可以选择其行为,机器人定律将是人类理性地对待机器人或其他智能体的唯一方式。这似乎是在暗示,使人工智能体成为可以自主作出伦理抉择的人工伦理智能体的前提是其可与人的智能媲美。