策展精選

AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。83

LLM
熱度
排序
𝕏🔥

Memento:教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍,吞吐量幾乎翻倍,且被抹除的推理區塊會在 KV...

Dimitris Papailiopoulos@DimitrisPapail
886🔁 134
𝕏🔥🔥

Anthropic 推出 Managed Agents,透過解耦大腦與手部操作解決代理程式架構難題。 Anthropic 近期推出 Managed Agents 託管服務,旨在解決長期運行 Agent 的架構挑戰。透過將「大腦」(Cl...

Anthropic@AnthropicAI
3.6k🔁 458
𝕏🔥

Meta 發布 Muse Spark 多模態推理模型。 Meta Superintelligence Labs 推出 Muse Spark,這是其「個人超級智慧」願景下的首款原生多模態推理模型,具備工具使用、視覺思維鏈及多 Agent...

AI at Meta@AIatMeta
9.0k🔁 1.1k
𝕏🔥

Anthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前,利用可解釋性技術深入剖析模型內部運作,發現該模型展現出複...

Jack Lindsey@Jack_W_Lindsey
6.8k🔁 772
𝕏🔥🔥🔥🔥

Anthropic 發布了最強大的前沿模型「Claude Mythos Preview」,因其具備自主發現並利用零日漏洞的強大網路安全能力,為避免潛在風險而決定不向公眾開放。 概述與發布決策 「Claude Mythos Previ...

Boris Cherny@bcherny
9.9k🔁 613
𝕏🔥

Anthropic 推出 Project Glasswing,利用 Claude Mythos 新模型強化全球軟體安全。 Anthropic 正式發布 Project Glasswing 專案,旨在透過其最新且未公開的 前沿模型「Cl...

Anthropic@AnthropicAI
43.9k🔁 6.7k
𝕏🔥

真正能學習的 Web Agent 每一個造訪網站的 Agent 都是從零開始。我們讓它們學會了記憶。 當你造訪 Google Flights,輸入城市名稱並按下 Enter,結果什麼都沒發生。你必須等待下拉選單出現,然後點擊建議...

Gregor Zunic@gregpr07
101🔁 11
𝕏🔥

Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台。 Cloudflare 與 Google 合作,將 Gemma 4 26B A4B 模型引入 Workers AI,這是一款基於 Gemini 3...

Cloudflare Developers@CloudflareDev
773🔁 62
𝕏🔥

Anthropic 推出 AI 模型「diff」工具,透過跨架構比對揭示模型獨有行為特徵。 Anthropic 研究團隊開發了一種名為「模型 diffing」的技術,透過類比軟體開發中的「diff」概念,自動識別不同人工智慧模型架構間...

Anthropic@AnthropicAI
2.7k🔁 346
𝕏🔥

Anthropic 研究發現 Claude 模型內部存在影響行為的「功能性情緒」機制。 Anthropic 的最新研究指出,大型語言模型(LLM)內部存在與情緒概念對應的「情緒向量」,這些向量並非單純的文字生成模式,而是能實際驅動模型...

Anthropic@AnthropicAI
17.6k🔁 2.7k
𝕏🔥

Andrej Karpathy 分享利用 LLM 自動構建個人知識庫的實踐方法。 Andrej Karpathy 近期提出了一種利用 LLM 構建個人知識庫的新方法,他將大量 token 運算資源從單純的程式撰寫轉移至知識管理,透過自...

Andrej Karpathy@karpathy
54.3k🔁 6.4k
𝕏🔥

Google 發布 Gemma 4 開放模型系列,支援多模態與邊緣運算。 Google DeepMind 推出 Gemma 4 多模態模型系列,具備 Apache 2.0 開源授權,並針對從邊緣裝置到高效能伺服器等各種場景進行了全面優...

Jeff Boudier 🤗@jeffboudier
17🔁 1