[2603.02200] Adaptive Confidence Regularization for Multimodal Failure

[2603.02200] Adaptive Confidence Regularization for Multimodal Failure Detection

arXiv - Machine Learning March 03, 2026 3 min read

About this article

Abstract page for arXiv paper 2603.02200: Adaptive Confidence Regularization for Multimodal Failure Detection

Computer Science > Computer Vision and Pattern Recognition arXiv:2603.02200 (cs) [Submitted on 2 Mar 2026] Title:Adaptive Confidence Regularization for Multimodal Failure Detection Authors:Moru Liu, Hao Dong, Olga Fink, Mario Trapp View a PDF of the paper titled Adaptive Confidence Regularization for Multimodal Failure Detection, by Moru Liu and 3 other authors View PDF HTML (experimental) Abstract:The deployment of multimodal models in high-stakes domains, such as self-driving vehicles and medical diagnostics, demands not only strong predictive performance but also reliable mechanisms for detecting failures. In this work, we address the largely unexplored problem of failure detection in multimodal contexts. We propose Adaptive Confidence Regularization (ACR), a novel framework specifically designed to detect multimodal failures. Our approach is driven by a key observation: in most failure cases, the confidence of the multimodal prediction is significantly lower than that of at least one unimodal branch, a phenomenon we term confidence degradation. To mitigate this, we introduce an Adaptive Confidence Loss that penalizes such degradations during training. In addition, we propose Multimodal Feature Swapping, a novel outlier synthesis technique that generates challenging, failure-aware training examples. By training with these synthetic failures, ACR learns to more effectively recognize and reject uncertain predictions, thereby improving overall reliability. Extensive experi...

Originally published on March 03, 2026. Curated by AI News.

Machine Learning

[2603.23899] SM-Net: Learning a Continuous Spectral Manifold from Multiple Stellar Libraries

Abstract page for arXiv paper 2603.23899: SM-Net: Learning a Continuous Spectral Manifold from Multiple Stellar Libraries

arXiv - AI · 4 min · 5 minutes ago

Llms

[2603.16629] MLLM-based Textual Explanations for Face Comparison

Abstract page for arXiv paper 2603.16629: MLLM-based Textual Explanations for Face Comparison

arXiv - AI · 4 min · 5 minutes ago

Llms

[2603.15159] To See is Not to Master: Teaching LLMs to Use Private Libraries for Code Generation

Abstract page for arXiv paper 2603.15159: To See is Not to Master: Teaching LLMs to Use Private Libraries for Code Generation

arXiv - AI · 4 min · 5 minutes ago

Machine Learning

[2603.14375] The Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics

Abstract page for arXiv paper 2603.14375: The Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics

arXiv - AI · 4 min · 5 minutes ago

[2603.02200] Adaptive Confidence Regularization for Multimodal Failure Detection

About this article

Related Articles

[2603.23899] SM-Net: Learning a Continuous Spectral Manifold from Multiple Stellar Libraries

[2603.16629] MLLM-based Textual Explanations for Face Comparison

[2603.15159] To See is Not to Master: Teaching LLMs to Use Private Libraries for Code Generation

[2603.14375] The Pulse of Motion: Measuring Physical Frame Rate from Visual Dynamics

No comments

Stay updated with AI News