策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 56 篇

研究論文

熱度

排序

Apple 發布 Simple Self-Distillation 技術，透過模型自我訓練提升程式碼生成能力。 Apple 近期於 GitHub 發布「ml-ssd」專案，提出一種無需外部強化學習或驗證器的模型優化方法，旨在透過模型自...

@danveloper

♥1.1k🔁 92

LongCat-Next 是美團開源的原生多模態離散自迴歸模型，將文本、視覺和音訊統一在單一框架中處理，突破了傳統多模態建模的架構分割，在理解、生成和語音交互上實現工業級性能。核心架構與設計理念 LongCat-Next 建立在「離散原生...

@Meituan_LongCat

♥469🔁 66

系統架構與運作流程 The AI Scientist 以 foundation models（基礎模型）為核心，透過四個主要階段完成End to End的科學研究流程：想法生成階段：系統在使用者指定的機器學習研究子領域中，迭代地生成高層次...

@SakanaAILabs

♥1.9k🔁 399

Meta 推出 TRIBE v2（三模態腦編碼器），一款基礎模型能預測人類大腦對幾乎任何視覺或聲音刺激的反應。相較於前代的 Algonauts 2025 獲獎架構，TRIBE v2 在訓練資料規模上有質的跳躍，從僅四個人的低解析度 fMRI...

@AIatMeta

♥16.0k🔁 2.5k

文件搜尋與回答（RAG）系統在處理 PDF 時面臨方法選擇問題，Weaviate 最新研究表明，文字提取、影像嵌入與混合方法各有優勢，沒有單一答案，而是需要視應用場景而定。研究背景與核心問題在構建 PDF RAG 管線時，開發者面臨兩條...

@victorialslocum

♥739🔁 100

Google Research 推出 TurboQuant，一種新型向量量化壓縮演算法，可將大型語言模型的 Key-Value cache 記憶縮減至少 6 倍，同時實現高達 8 倍的速度提升，且不損失任何精度。這項技術將於 ICLR 20...

@GoogleResearch

♥39.0k🔁 5.8k

Anthropic 透過多 Agent 架構提升 Claude 的前端設計與長期自主開發能力。 Anthropic 工程團隊透過引入「生成者-評估者」(Generator-Evaluator) 的多 Agent 架構，成功突破了 Cl...

@AnthropicAI

♥6.7k🔁 904

Aviro 推出了 Ebla-1，一個用於企業環境的接地推理模型，並同時發佈了 C⁴ 基準測試。C⁴ 是與 HUD 合作開發的長期任務評估工具，針對企業文件集合設計，評估四個維度：正確性、完整性、組合能力和引用準確度。基準測試成績在現有...

@hud_evals

♥299🔁 29