策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 56 篇
Google 推出 PaperOrchestra 多 Agent 框架,實現端到端自動化學術論文寫作。 Google 研究團隊發表了 PaperOrchestra,這是一個專為自動化 AI 研究論文寫作設計的多 Agent 框架,旨在...
@dair_ai遺忘的幾何學:為什麼大腦與 LLM 會以「完全相同」的方式失效 TL;DR (總結) LLM 的記憶系統遺忘的方式與人類「完全相同」,重現了臨床心理學中一些最常被複製的實驗數據。 在過去幾個月裡,我們一直在探索一個單一觀察結果...
@ashwingopOpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文,展示其內部模型成功解決了五項數學界的「Erdős 問題」,證明 AI 在處理複雜數學推論上的進展。 研究成果與亮點 這篇論文(編號...
@mehtaab_sawhneyMemento:教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍,吞吐量幾乎翻倍,且被抹除的推理區塊會在 KV...
@DimitrisPapailVero:用於視覺推理的開源強化學習配方。 Vero 是一套針對視覺語言模型 (VLM) 的全開源強化學習 (RL) 訓練配方,旨在解決跨領域視覺推理任務,並透過大規模資料與任務路由獎勵機制,實現了超越現有模型的效能。 核心挑戰...
@GabrielSarch「Group-Evolving Agents (GEA)」透過群體演化取代個體演化,實現 AI 代理的累積式自我優化。 這項研究指出,現有 AI 代理的自我演化機制存在根本缺陷:過度模仿生物個體演化,導致演化路徑孤立,發現的創新無法累...
@xwang_lkAnthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前,利用可解釋性技術深入剖析模型內部運作,發現該模型展現出複...
@Jack_W_LindseyCORAL 框架實現自主多 Agent 演化以推動開放式科學發現。 CORAL 是一個針對開放式發現問題的自主多 Agent 演化框架,它打破了傳統基於 LLM 的演化方法中依賴固定啟發式規則的限制,透過賦予 Agent 更高的自主權...
@ao_qu18465OSGym 透過基礎架構優化,實現大規模電腦操作 Agent 訓練。 OSGym 是一套專為電腦操作 Agent 設計的可擴展基礎架構,透過系統級優化解決了大規模訓練時的資源瓶頸與穩定性問題。該系統讓研究人員能在有限的學術資源下,高效...
@qinzytechSimpleStream 證明僅靠近期影格即可超越複雜的串流影片理解模型。 SimpleStream 研究指出,現有串流影片理解模型過度依賴複雜的記憶機制,透過僅輸入最近 N 個影格的簡單滑動視窗基準,即可達到甚至超越現有 SOTA ...
@liuziwei7Anthropic 推出 AI 模型「diff」工具,透過跨架構比對揭示模型獨有行為特徵。 Anthropic 研究團隊開發了一種名為「模型 diffing」的技術,透過類比軟體開發中的「diff」概念,自動識別不同人工智慧模型架構間...
@AnthropicAIAnthropic 研究發現 Claude 模型內部存在影響行為的「功能性情緒」機制。 Anthropic 的最新研究指出,大型語言模型(LLM)內部存在與情緒概念對應的「情緒向量」,這些向量並非單純的文字生成模式,而是能實際驅動模型...
@AnthropicAI