策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 83 篇

LLM

熱度

排序

𝕏🔥2026/4/9

Memento：教導 LLM 自行管理上下文 (Context) 我們教導模型在生成過程中自行壓縮其思維鏈 (Chain-of-Thought)。峰值 KV cache 下降了 2–3 倍，吞吐量幾乎翻倍，且被抹除的推理區塊會在 KV...

LLM 研究論文開源專案 Memento

@DimitrisPapail

♥886🔁 134

𝕏🔥🔥2026/4/9

Anthropic 推出 Managed Agents，透過解耦大腦與手部操作解決代理程式架構難題。 Anthropic 近期推出 Managed Agents 託管服務，旨在解決長期運行 Agent 的架構挑戰。透過將「大腦」（Cl...

Agent Harness 新產品 LLM Anthropic Claude

@AnthropicAI

♥3.6k🔁 458

𝕏🔥2026/4/8

Meta 發布 Muse Spark 多模態推理模型。 Meta Superintelligence Labs 推出 Muse Spark，這是其「個人超級智慧」願景下的首款原生多模態推理模型，具備工具使用、視覺思維鏈及多 Agent...

新產品 Agent VLM LLM AIGC Meta

@AIatMeta

♥9.0k🔁 1.1k

𝕏🔥2026/4/8

Anthropic 透過可解釋性技術揭露 Claude Mythos 模型的內部策略思維與潛在風險。 Anthropic 在發布 Claude Mythos Preview 前，利用可解釋性技術深入剖析模型內部運作，發現該模型展現出複...

研究論文 LLM 資安 Anthropic Claude

@Jack_W_Lindsey

♥6.8k🔁 772

𝕏🔥🔥🔥🔥2026/4/8

Anthropic 發布了最強大的前沿模型「Claude Mythos Preview」，因其具備自主發現並利用零日漏洞的強大網路安全能力，為避免潛在風險而決定不向公眾開放。概述與發布決策「Claude Mythos Previ...

新產品資安 LLM Anthropic Claude

@bcherny

♥9.9k🔁 613

𝕏🔥2026/4/8

Anthropic 推出 Project Glasswing，利用 Claude Mythos 新模型強化全球軟體安全。 Anthropic 正式發布 Project Glasswing 專案，旨在透過其最新且未公開的前沿模型「Cl...

新產品資安 LLM Anthropic Claude

@AnthropicAI

♥43.9k🔁 6.7k

𝕏🔥2026/4/7

真正能學習的 Web Agent 每一個造訪網站的 Agent 都是從零開始。我們讓它們學會了記憶。當你造訪 Google Flights，輸入城市名稱並按下 Enter，結果什麼都沒發生。你必須等待下拉選單出現，然後點擊建議...

Agent LLM 產業趨勢 Web Agent

@gregpr07

♥101🔁 11

𝕏🔥2026/4/4

Google Gemma 4 26B A4B 模型現已登陸 Workers AI 平台。 Cloudflare 與 Google 合作，將 Gemma 4 26B A4B 模型引入 Workers AI，這是一款基於 Gemini 3...

LLM 新產品產業趨勢 Google Cloudflare Gemma

@CloudflareDev

♥773🔁 62

𝕏🔥2026/4/4

Anthropic 推出 AI 模型「diff」工具，透過跨架構比對揭示模型獨有行為特徵。 Anthropic 研究團隊開發了一種名為「模型 diffing」的技術，透過類比軟體開發中的「diff」概念，自動識別不同人工智慧模型架構間...

研究論文資安 AIGC LLM Anthropic

@AnthropicAI

♥2.7k🔁 346

𝕏🔥2026/4/3

Anthropic 研究發現 Claude 模型內部存在影響行為的「功能性情緒」機制。 Anthropic 的最新研究指出，大型語言模型（LLM）內部存在與情緒概念對應的「情緒向量」，這些向量並非單純的文字生成模式，而是能實際驅動模型...

LLM 研究論文 AIGC Anthropic Claude

@AnthropicAI

♥17.6k🔁 2.7k

𝕏🔥2026/4/3

Andrej Karpathy 分享利用 LLM 自動構建個人知識庫的實踐方法。 Andrej Karpathy 近期提出了一種利用 LLM 構建個人知識庫的新方法，他將大量 token 運算資源從單純的程式撰寫轉移至知識管理，透過自...

LLM 教學資源其他 Andrej Karpathy

@karpathy

♥54.3k🔁 6.4k

𝕏🔥2026/4/2

Google 發布 Gemma 4 開放模型系列，支援多模態與邊緣運算。 Google DeepMind 推出 Gemma 4 多模態模型系列，具備 Apache 2.0 開源授權，並針對從邊緣裝置到高效能伺服器等各種場景進行了全面優...

LLM 開源專案新產品 VLM Google Gemma

@jeffboudier

♥17🔁 1