近日,外國語學院文旭教授與其博士研究生田亞靈撰寫的論文《理解反諷話語:對ChatGPT-4o的全面考察》(Understanding ironic utterances: A comprehensive examination of ChatGPT-4o)在國際著名語言學期刊《跨文化語用學》(Intercultural Pragmatics)上公開發表。
隨著大語言模型(LLMs)日益滲透到人類生活的各個領域,模型能否準確理解涉及人類認知的復雜話語逐漸成為了一項關鍵挑戰。反諷作為一種語言現象,極度依賴語境、文化和認知因素,對LLMs的理解能力提出了更高的要求。
研究以認知語用視角下的反諷理論為指導,結合定性與定量方法,構建了一個系統的測試集,并設立人類實驗對照組,全面考察了ChatGPT-4o在理解和處理包括言語反諷、情境反諷、視覺反諷和多模態反諷在內的多種反諷類型時所展現的優勢與局限,同時也分析了影響其表現的關鍵因素,并進一步考察了模型在理解反諷話語時所傾向于依賴的機制。
研究結果顯示,在涉及情境反諷、視覺反諷以及多模態反諷的理解任務中,人類被試與ChatGPT-4o均能達到完美的準確率。然而,當面對需要更復雜的情感語調把握和高級認知能力參與理解的言語反諷時,ChatGPT-4o表現出顯著的局限性。此外,研究還探討了影響ChatGPT-4o理解和處理反諷話語時的關鍵因素,并識別了模型在處理反諷話語時傾向依賴的主要機制。
研究的發現為提升人工智能系統處理復雜語用現象的能力提供了實證支持和發展路徑。同時,研究也為語言學理論與人工智能的融合提供了啟示。未來研究應繼續探索如何將更復雜的認知與社會推理能力融入人工智能模型中,以提升其在理解復雜語言現象方面的表現。
論文鏈接:https://www.degruyterbrill.com/document/doi/10.1515/ip-2025-2004/html