多模態大模型的不確定性量化：基於非一致性調整語義體積

儘管多模態大型語言模型（MLLM）能力出衆，但它們可能生成看似合理卻實際錯誤的輸出，即所謂「幻覺」問題。當前缺乏有效工具來量化MLLM的輸出不確定性，導致系統無法區分哪些回答可信、哪些需要人工複覈。

本研究提出「非一致性調整語義體積」（Incoherence-adjusted Semantic Volume）方法，通過度量模型多次採樣輸出之間的語義一致性來估計不確定性。當輸出之間語義分歧較大時，系統自動將該查詢升級給人類專家或更大規模的模型處理。

實驗驗證了該方法在多個多模態任務上的有效性，爲構建可靠的MLLM應用提供了重要的質量保障機制，在醫療影像分析、自動駕駛等高風險領域具有重要應用價值。

多模態AI正快速滲透醫療、法律、自動駕駛等高風險領域。但MLLM的「幻覺」問題——輸出聽起來有理有據實則錯誤——構成了嚴峻的安全隱患。核心困境在於：我們如何讓AI系統主動識別自己不確定的情況？

語義體積（Semantic Volume）

非一致性調整（Incoherence Adjustment）

隨着多模態AI和Agentic AI系統大規模落地，AI可靠性和LLM Safety正成爲行業焦點。不確定性量化是構建「人機協作」系統的關鍵技術：讓AI處理確定性高的任務，將不確定查詢交還給人類專家，從而在保持效率的同時最大化系統可靠性。這也是AI監管合規框架中的核心能力要求。