【編者按】暑假是科研工作攻堅克難、實現躍升的黃金時期,學校各研究團隊正搶抓時間機遇,聚焦科技前沿,鉚足干勁潛心研究,力求取得更多創新突破,奮力跑出科研攻關暑期“加速度”,為學校高質量發展注入強勁動力。學校推出“暑期科研‘加速度’”系列報道,將實時呈現學校師生暑期聚力科技創新、推進科研攀登躍升的昂揚風貌和豐碩成果,彰顯學校持續深化有組織科研,以科技創新支撐高質量發展的新姿態、新進展、新成效。敬請關注!
近日,電子信息工程學院教授、心理學部認知與人格教育部重點實驗室研究員陳通團隊攜手連信科技有限責任公司,以絕對優勢榮獲“ACM Multimedia 2025”第八屆國際面部微表情挑戰大賽(8th Facial Micro-Expression Grand Challenge,MEGC)微表情視覺問答(ME-VQA)賽道全球冠軍。
ACM Multimedia是計算機圖形學與多媒體領域的頂級國際會議,也是中國計算機學會 (CCF)推薦的A類國際學術會議。隨著大模型技術在各行各業的廣泛應用并取得顯著成效,MEGC在2025年首次增設微表情視覺問答(ME-VQA)賽道。該賽道要求參賽系統不僅要精準識別微表情,還需基于視頻內容進行自然語言問答,從而完成對微表情的可解釋性推理與交互式理解。這對模型的動態時序建模能力、跨模態語義表達能力和多模態特征融合能力提出了新的挑戰。
在這一全新賽道中,參賽團隊提出了“Emotion-Qwen-VL”——首個基于國產Qwen大模型的全參數微調多模態框架,針對微表情視覺問答(ME-VQA)任務進行專門優化,使國產大模型在微表情理解方面實現全球領跑。該方案在技術上實現了多項突破,如全參數微調、結構化問答數據構建、規則驅動與數據驅動的融合學習等。
陳通教授和電子信息工程學院青年教師單禹皓為參賽論文通信作者。據悉,早在2018年首屆微表情識別挑戰大賽中,陳通教授團隊就率先在微表情識別領域引入“深度學習+遷移學習”方案,并以絕對優勢奪冠。時隔七年,他們又成為首個用國產大模型完成微表情視覺問答全模型訓練的團隊,并再次以顯著優勢領跑賽場。