现阶段,真的很难看出超级人工智能的故事。但是我们确实知道我们需要在今天解决控制问题,而不是在人工智能已经超出我们的控制范围时。但一个好的起点是重新思考我们定义和创造人工智能的方法。Russell 在Human Compatible一开始就解决了这个问题。
“我们说机器的智能程度可以预期它们的行为可以实现其目标,但我们没有可靠的方法来确保它们的目标与我们的目标相同。”
相反,Russell 建议,我们应该坚持专注于理解和实现人类目标的人工智能。罗素写道:“这样的机器,如果能被设计出来,不仅具有智能,而且对人类有益。”
在本书的最后,罗素勾勒出一个人工智能系统的粗略轮廓,该系统将致力于造福人类并且永远不会失控。
理想的智能系统应该是其唯一目标是实现人类偏好而不是其自身目标的系统。实现这一目标的关键是让人工智能承认它不知道这些偏好是什么。“假设它完全了解真正目标的机器将一心一意地追求它。它永远不会询问某些行动方案是否可行,因为它已经知道这是实现目标的最佳解决方案,”Russell 写道。
最后一点非常重要,因为这正是当前人工智能系统所缺乏的。人工智能驱动的推荐系统并非旨在理解和满足人类偏好;它们被编程为最大化自己的目标,即获得更多的广告点击、更多的屏幕时间、更多的购买等,而不管它们的功能给人类带来什么危害。当前的人工智能系统已经成为许多问题的根源,包括过滤气泡、在线分心、算法偏差等等。
随着人工智能算法在执行任务时变得更加高效,这些问题可能会增加。一个专注于实现单一目标的超级智能 AI 系统最终将牺牲整个人类来实现这个目标。
最后,罗素提出关于人类偏好的信息来源是人类的行为和选择。随着人类选择的发展,人工智能将继续学习和发展。
罗素承认,这不是一个完美的配方,他列出了摆在我们面前的许多挑战,例如处理不同人类相互冲突的偏好和他们主人的邪恶欲望。
“简而言之,如果我们想保持对越来越智能的机器的控制,我建议我们需要将人工智能引导到一个全新的方向,”罗素写道。“到目前为止,人工智能系统的愚蠢和有限的范围保护我们免受这些后果的影响,但这种情况将会改变。”