微軟推出新工具:開發者可用文字描述生成 AI 行為測試

微軟於周二開源了 ASSESS(Adaptive Spec-driven Scoring for Evaluation and Regression Testing),這是一個用於快速搭建 AI 評估流程的開源框架。開發者只需透過文字描述即可自動生成 AI 行為測試,大幅降低了 AI 模型評估的門檻,讓回歸測試更加高效和可操作。