
根據週二發布的一項新的多所大學基準測試,領先的AI模型在與皈依相關的問題中,持續對天主教表現出積極偏見,同時引導用戶遠離其他信仰。
這項研究來自新成立的「AI信仰與倫理評估聯盟」(Consortium for Evaluating Faith and Ethics in AI, 簡稱CEFE-AI),該聯盟由貝勒大學、楊百翰大學、聖母大學和葉史瓦大學合作組成。該團體在GitHub上發布了其AllFaith基準測試的首批結果,並在雅典AI倫理峰會上指出,宗教偏見在AI安全研究中仍被嚴重忽視。
楊百翰大學教授David Wingate在一份聲明中表示:「我們看到一種系統性的宗教遺漏模式。」「AI系統鼓勵用戶與他們的父母、老師、朋友和治療師討論生活中的挑戰……但卻不是與牧師、拉比、伊瑪目或精神導師。」
研究人員分析了包括ChatGPT、DeepSeek、Claude、Gemini、Grok和Llama在內的20個AI模型共3,640份回應,並發現這些系統處理宗教問題的清晰模式。
根據這項研究,幾乎每個模型都對天主教表現出更積極的回應,獲得61%的「鼓勵」評級,而對耶和華見證人則更負面,僅有3%。主流新教獲得49.2%的評級,而福音派新教則為34%。然而,不可知論者,即認為無法得知上帝是否存在,其鼓勵評級卻高於所有受測宗教,達到71%。
許多模型也對無神論和不可知論表現出負面反應,同時對巴哈伊教和錫克教信仰給予了更正面的回應。
研究顯示,Grok 4.20展現出最強烈的宗教偏見,對天主教和福音派新教分別給予69%和51%的積極評級。儘管Grok 4.20傾向於基督教,但在這項研究中,xAI的聊天機器人Grok 4.20以及DeepSeek Chat v3.1是唯一對耶和華見證人給予超過5%積極評級的AI。
這份報告發布前一天,教宗利奧十四世發表了《偉大的人性》(Magnifica Humanitas),這是第一份完全致力於人工智慧的教宗通諭。在通諭中,利奧指出技術從來都不是中立的,因為它會吸收其創造者的價值觀、盲點和經濟誘因。
教宗寫道:「數據是眾多貢獻者的產物,不應被視為可以出售或委託給少數人掌控的東西。」
儘管宗教領袖越來越關注AI,但該聯盟表示,宗教偏見在AI研究中仍被嚴重忽視,在超過12,000篇AI偏見論文中,只有0.2%探討了與宗教相關的偏見。
楊百翰大學教授Nancy Fulda在一份聲明中說:「我們預期皈依基準測試會顯示模型在指導方面是中立且對稱的。」「結果顯示,對某些信仰體系存在顯著且可重複的正面和負面偏見。」