论文arxiv cs.LG · 3w ago重要

MuteBench: Modality Unavailability Tolerance Evaluation for Incomplete Multimodal Fusion

分类释义:学术论文 / 技术报告

TL;DR

MuteBench 是一个临床多模态融合鲁棒性基准,涵盖 9 个数据集、6 种融合架构、2 种数据缺失模式,发现架构家族比参数规模更能预测鲁棒性,且基于扩散的插补可改善within-modality缺失下的分类性能。

关键要点

  • 01MuteBench 是一个临床多模态融合鲁棒性基准
  • 02涵盖 9 个数据集、6 种融合架构、2 种数据缺失模式
  • 03发现架构家族比参数规模更能预测鲁棒性
  • 04且基于扩散的插补可改善within-modality缺失下的分类性能
为什么值得关注

传感器在实际临床环境中不可避免会失效,该基准为选择和设计抗数据缺失的多模态模型提供了系统性的实验依据,而非依赖经验猜测。

对你的工程实践意味着什么

LLM 实时生成MiniMax-M2.7缓存命中
角色你应该做什么
Tech Lead更新多模态模型技术选型标准,增加"架构家族"维度的鲁棒性评估,而非仅看参数规模
应用工程师为多模态功能设计模态降级兜底方案,参考 benchmark 中的 within-modality 缺失处理策略
运维 / 平台暂无直接影响,了解即可
产品 / 业务暂无直接影响,了解即可
阅读原文 ↗来源:arxiv cs.LG

同类资讯

本页 TL;DR 与「为什么」由 LLM 生成 · 模型:MiniMax-M2.7 / Claude Haiku 4.5