AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 1 篇
Aviro 推出了 Ebla-1,一個用於企業環境的接地推理模型,並同時發佈了 C⁴ 基準測試。C⁴ 是與 HUD 合作開發的長期任務評估工具,針對企業文件集合設計,評估四個維度:正確性、完整性、組合能力和引用準確度。 基準測試成績 在現有...