策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 1 篇

Vero

熱度

排序

Vero：用於視覺推理的開源強化學習配方。 Vero 是一套針對視覺語言模型 (VLM) 的全開源強化學習 (RL) 訓練配方，旨在解決跨領域視覺推理任務，並透過大規模資料與任務路由獎勵機制，實現了超越現有模型的效能。核心挑戰...

@GabrielSarch

♥290🔁 58