机构

The University of Tokyo

日本顶尖研究型大学,其计算机视觉与人工智能团队研究多模态感知、视频理解与人类行为分析。

MM-OCEAN 检验多模态大模型是否真用视频证据支撑性格评分。27 个模型里,51.3% 的「答对」评分依据的却是错误线索,最强模型也只有 33.5% 的判断真正落地到证据。