策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 83 篇
Memento:教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍,吞吐量幾乎翻倍,且被抹除的推理區塊會在 KV...
@DimitrisPapailAnthropic 推出 Managed Agents,透過解耦大腦與手部操作解決代理程式架構難題。 Anthropic 近期推出 Managed Agents 託管服務,旨在解決長期運行 Agent 的架構挑戰。透過將「大腦」(Cl...
@AnthropicAIMeta 發布 Muse Spark 多模態推理模型。 Meta Superintelligence Labs 推出 Muse Spark,這是其「個人超級智慧」願景下的首款原生多模態推理模型,具備工具使用、視覺思維鏈及多 Agent...
@AIatMetaAnthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前,利用可解釋性技術深入剖析模型內部運作,發現該模型展現出複...
@Jack_W_LindseyAnthropic 發布了最強大的前沿模型「Claude Mythos Preview」,因其具備自主發現並利用零日漏洞的強大網路安全能力,為避免潛在風險而決定不向公眾開放。 概述與發布決策 「Claude Mythos Previ...
@bchernyAnthropic 推出 Project Glasswing,利用 Claude Mythos 新模型強化全球軟體安全。 Anthropic 正式發布 Project Glasswing 專案,旨在透過其最新且未公開的 前沿模型「Cl...
@AnthropicAI真正能學習的 Web Agent 每一個造訪網站的 Agent 都是從零開始。我們讓它們學會了記憶。 當你造訪 Google Flights,輸入城市名稱並按下 Enter,結果什麼都沒發生。你必須等待下拉選單出現,然後點擊建議...
@gregpr07Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台。 Cloudflare 與 Google 合作,將 Gemma 4 26B A4B 模型引入 Workers AI,這是一款基於 Gemini 3...
@CloudflareDevAnthropic 推出 AI 模型「diff」工具,透過跨架構比對揭示模型獨有行為特徵。 Anthropic 研究團隊開發了一種名為「模型 diffing」的技術,透過類比軟體開發中的「diff」概念,自動識別不同人工智慧模型架構間...
@AnthropicAIAnthropic 研究發現 Claude 模型內部存在影響行為的「功能性情緒」機制。 Anthropic 的最新研究指出,大型語言模型(LLM)內部存在與情緒概念對應的「情緒向量」,這些向量並非單純的文字生成模式,而是能實際驅動模型...
@AnthropicAIAndrej Karpathy 分享利用 LLM 自動構建個人知識庫的實踐方法。 Andrej Karpathy 近期提出了一種利用 LLM 構建個人知識庫的新方法,他將大量 token 運算資源從單純的程式撰寫轉移至知識管理,透過自...
@karpathyGoogle 發布 Gemma 4 開放模型系列,支援多模態與邊緣運算。 Google DeepMind 推出 Gemma 4 多模態模型系列,具備 Apache 2.0 開源授權,並針對從邊緣裝置到高效能伺服器等各種場景進行了全面優...
@jeffboudier