“人机对齐问题”对DeepSeek提出的哲学挑战——以“前见—偏见”关系为切入点_徐英瑾 (1).pdf
摘要:目前困扰人工智能学界的“人机对齐问题”不仅是一个工程学问题,而且有着深刻的哲学面向。具体而言,有待被“机器的行为”对齐的“人的行为”本身就涉及不同人群价值观之间的分歧,而这些分析又涉及“前见”与“偏见”之间的微妙关系。因此,一种完成“人机对齐”的人工智能系统就应当能做到一方面既能保护那些反映人类文化多样性的“前见”,另一方面又能筛除那些明显有害的“偏见”。但人工智能又该如何在“保护无害前见”与“筛除有害偏见”之间保持合适的亚里士多德式中道呢?目前以DeepSeek为代表的大语言模型在其自身行为主义预设的误导下,是无法找到这条中道的。而在与行为主义对抗的功能主义预设的引导下,我们需要对“偏见”进行一种基于信息加工过程(而不是基于其表达内容)的定义,即:“偏见”也就是智能体在面对显著的反例时依然固执坚持的“前见”。对于这种定义的工程化实现将诉诸对于诸认知模块之间协同关系的功能主义构建,而这也是一条迥异于大语言模型的“新质”人工智能道路。
关键词:人机对齐问题;大语言模型;前见;偏见;行为主义;功能主义;



