策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。56

研究論文
熱度
排序
𝕏🔥

Apple 發布 Simple Self-Distillation 技術,透過模型自我訓練提升程式碼生成能力。 Apple 近期於 GitHub 發布「ml-ssd」專案,提出一種無需外部強化學習或驗證器的模型優化方法,旨在透過模型自...

Dan Woods@danveloper
1.1k🔁 92
𝕏🔥

LongCat-Next 是美團開源的原生多模態離散自迴歸模型,將文本、視覺和音訊統一在單一框架中處理,突破了傳統多模態建模的架構分割,在理解、生成和語音交互上實現工業級性能。 核心架構與設計理念 LongCat-Next 建立在「離散原生...

Meituan LongCat@Meituan_LongCat
469🔁 66
𝕏🔥

系統架構與運作流程 The AI Scientist 以 foundation models(基礎模型)為核心,透過四個主要階段完成End to End的科學研究流程: 想法生成階段:系統在使用者指定的機器學習研究子領域中,迭代地生成高層次...

Sakana AI@SakanaAILabs
1.9k🔁 399
𝕏🔥🔥

Meta 推出 TRIBE v2(三模態腦編碼器),一款基礎模型能預測人類大腦對幾乎任何視覺或聲音刺激的反應。相較於前代的 Algonauts 2025 獲獎架構,TRIBE v2 在訓練資料規模上有質的跳躍,從僅四個人的低解析度 fMRI...

AI at Meta@AIatMeta
16.0k🔁 2.5k
𝕏🔥

文件搜尋與回答(RAG)系統在處理 PDF 時面臨方法選擇問題,Weaviate 最新研究表明,文字提取、影像嵌入與混合方法各有優勢,沒有單一答案,而是需要視應用場景而定。 研究背景與核心問題 在構建 PDF RAG 管線時,開發者面臨兩條...

Victoria Slocum@victorialslocum
739🔁 100
𝕏🔥

Google Research 推出 TurboQuant,一種新型向量量化壓縮演算法,可將大型語言模型的 Key-Value cache 記憶縮減至少 6 倍,同時實現高達 8 倍的速度提升,且不損失任何精度。這項技術將於 ICLR 20...

Google Research@GoogleResearch
39.0k🔁 5.8k
𝕏🔥

Anthropic 透過多 Agent 架構提升 Claude 的前端設計與長期自主開發能力。 Anthropic 工程團隊透過引入「生成者-評估者」(Generator-Evaluator) 的多 Agent 架構,成功突破了 Cl...

Anthropic@AnthropicAI
6.7k🔁 904
𝕏🔥

Aviro 推出了 Ebla-1,一個用於企業環境的接地推理模型,並同時發佈了 C⁴ 基準測試。C⁴ 是與 HUD 合作開發的長期任務評估工具,針對企業文件集合設計,評估四個維度:正確性、完整性、組合能力和引用準確度。 基準測試成績 在現有...

hud@hud_evals
299🔁 29