多模态模型 · The University of Tokyo
感知还是偏见:多模态大模型能看穿性格的第一印象吗?
MM-OCEAN 检验多模态大模型是否真用视频证据支撑性格评分。27 个模型里,51.3% 的「答对」评分依据的却是错误线索,最强模型也只有 33.5% 的判断真正落地到证据。
机构
日本顶尖研究型大学,其计算机视觉与人工智能团队研究多模态感知、视频理解与人类行为分析。
多模态模型 · The University of Tokyo
MM-OCEAN 检验多模态大模型是否真用视频证据支撑性格评分。27 个模型里,51.3% 的「答对」评分依据的却是错误线索,最强模型也只有 33.5% 的判断真正落地到证据。