面向可穿戴健康數據的通用智慧:萬億分鐘預訓練與LLM智能體代理
可穿戴設備雖能採集海量生理與行為信號,但受限於個體差異大及高品質標註數據稀缺,難以轉化為個人化健康洞察。為此,本文提出一種面向可穿戴健康的基本模型,在來自五百萬參與者的超一萬億分鐘無標籤感測器數據上進行預訓練。研究表明,模型容量與數據量的聯合擴展在35項涵蓋心血管、代謝、睡眠及心理健康等任務中帶來系統性性能提升。該模型解鎖了標籤高效的少樣本學習與生成能力,並部署大型語言模型智能體自動搜索下游預測頭,進一步顯著增強性能。最終構建的個人健康智能體經1860名臨床醫生評估,展現出更高的相關性、情境感知力與安全性。