ChronoMedKG:面向臨床推理的時態生物醫學知識圖譜與基準測試

現有生物醫學知識圖譜將疾病關聯視為靜態事實,忽略了時間維度在臨床推理中的關鍵作用——例如同一症狀在不同年齡段可能指向不同疾病。本文提出ChronoMedKG,一個包含460,497條證據連結三元組的時態知識圖譜,覆蓋13,431種疾病。該圖譜通過多智能體LLM流水線構建,經多模型共識與可信度過濾,併為6,250種疾病添加了時態錨定。同時引入包含3,341道題的ChronoTQA基準測試。實驗表明,前沿大模型在時態問題上的表現急劇下降,而ChronoMedKG的檢索能顯著改善其長尾失敗,效果優於傳統靜態方法,為檢索增強臨床決策系統提供了關鍵的時間維度。