策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。56

研究論文
熱度
排序
𝕏🔥

Google 推出 PaperOrchestra 多 Agent 框架,實現端到端自動化學術論文寫作。 Google 研究團隊發表了 PaperOrchestra,這是一個專為自動化 AI 研究論文寫作設計的多 Agent 框架,旨在...

DAIR.AI@dair_ai
453🔁 79
𝕏🔥

遺忘的幾何學:為什麼大腦與 LLM 會以「完全相同」的方式失效 TL;DR (總結) LLM 的記憶系統遺忘的方式與人類「完全相同」,重現了臨床心理學中一些最常被複製的實驗數據。 在過去幾個月裡,我們一直在探索一個單一觀察結果...

Ashwin Gopinath@ashwingop
661🔁 86
𝕏🔥

OpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文,展示其內部模型成功解決了五項數學界的「Erdős 問題」,證明 AI 在處理複雜數學推論上的進展。 研究成果與亮點 這篇論文(編號...

Mehtaab Sawhney@mehtaab_sawhney
893🔁 151
𝕏🔥

Memento:教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍,吞吐量幾乎翻倍,且被抹除的推理區塊會在 KV...

Dimitris Papailiopoulos@DimitrisPapail
886🔁 134
𝕏🔥

Vero:用於視覺推理的開源強化學習配方。 Vero 是一套針對視覺語言模型 (VLM) 的全開源強化學習 (RL) 訓練配方,旨在解決跨領域視覺推理任務,並透過大規模資料與任務路由獎勵機制,實現了超越現有模型的效能。 核心挑戰...

Gabriel Sarch@GabrielSarch
290🔁 58
𝕏🔥

「Group-Evolving Agents (GEA)」透過群體演化取代個體演化,實現 AI 代理的累積式自我優化。 這項研究指出,現有 AI 代理的自我演化機制存在根本缺陷:過度模仿生物個體演化,導致演化路徑孤立,發現的創新無法累...

Xin Eric Wang@xwang_lk
503🔁 111
𝕏🔥

Anthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前,利用可解釋性技術深入剖析模型內部運作,發現該模型展現出複...

Jack Lindsey@Jack_W_Lindsey
6.8k🔁 772
𝕏🔥

CORAL 框架實現自主多 Agent 演化以推動開放式科學發現。 CORAL 是一個針對開放式發現問題的自主多 Agent 演化框架,它打破了傳統基於 LLM 的演化方法中依賴固定啟發式規則的限制,透過賦予 Agent 更高的自主權...

Ao Qu@ao_qu18465
455🔁 75
𝕏🔥

OSGym 透過基礎架構優化,實現大規模電腦操作 Agent 訓練。 OSGym 是一套專為電腦操作 Agent 設計的可擴展基礎架構,透過系統級優化解決了大規模訓練時的資源瓶頸與穩定性問題。該系統讓研究人員能在有限的學術資源下,高效...

Zengyi Qin@qinzytech
493🔁 146
𝕏🔥

SimpleStream 證明僅靠近期影格即可超越複雜的串流影片理解模型。 SimpleStream 研究指出,現有串流影片理解模型過度依賴複雜的記憶機制,透過僅輸入最近 N 個影格的簡單滑動視窗基準,即可達到甚至超越現有 SOTA ...

Ziwei Liu@liuziwei7
284🔁 38
𝕏🔥

Anthropic 推出 AI 模型「diff」工具,透過跨架構比對揭示模型獨有行為特徵。 Anthropic 研究團隊開發了一種名為「模型 diffing」的技術,透過類比軟體開發中的「diff」概念,自動識別不同人工智慧模型架構間...

Anthropic@AnthropicAI
2.7k🔁 346
𝕏🔥

Anthropic 研究發現 Claude 模型內部存在影響行為的「功能性情緒」機制。 Anthropic 的最新研究指出,大型語言模型(LLM)內部存在與情緒概念對應的「情緒向量」,這些向量並非單純的文字生成模式,而是能實際驅動模型...

Anthropic@AnthropicAI
17.6k🔁 2.7k