APWA:面向高並行智能體工作流的分散式架構設計

本文針對基於大語言模型的多智能體系統在任務規模擴大時面臨的推理、協調及計算擴展瓶頸,提出了智能體並行工作負載架構(APWA)。現有系統難以充分利用底層模型的並行計算能力,導致高吞吐量處理受限。APWA將工作流分解為互不干預的子問題,利用獨立資源並行處理且無需跨通信,從而支援異構資料與多種並行模式。實驗表明,APWA能夠動態分解複雜查詢,並在其它系統完全失效的大規模任務場景中展現出卓越的擴展能力,有效解決了高並行智能體工作流的效率問題。