策展精選

AI 技術社群精選內容，按時間排序瀏覽所有策展貼文。共 83 篇

LLM

熱度

排序

𝕏🔥🔥2026/4/18

LLM 中的 Prompt Caching：清晰解析這是一份關於 Claude 如何達成 92% 快取命中率的案例研究 --- 每當 AI Agent 採取一個步驟時，它都會將整個對話歷史紀錄傳送回 LLM。這包...

LLM 教學資源 Agent Anthropic Claude

@_avichawla

♥1.0k🔁 162

𝕏🔥2026/4/18

Agent Harness 的解剖學深入探討 Anthropic、OpenAI、Perplexity 和 LangChain 實際上在建構什麼。本文將涵蓋編排迴圈 (orchestration loop)、工具 (tools)、記憶...

Agent 教學資源 LLM Anthropic OpenAI LangChain

@akshay_pachaar

♥1.8k🔁 251

𝕏🔥🔥2026/4/18

Cloudflare推出Unweight無損壓縮系統，將LLM模型大小壓縮15-22%，解決H100 GPU記憶體頻寬瓶頸。 Cloudflare開發「Unweight」，這是無損推論時壓縮系統，針對模型權重進行壓縮，實現最高22%模...

LLM 新產品產業趨勢 Cloudflare NVIDIA

@Cloudflare

♥151🔁 16

𝕏🔥🔥2026/4/18

Newton-Muon優化器揭示Muon隱含牛頓法本質，並透過修正輸入資料幾何實現更高效LLM訓練。 Weijie Su團隊發布論文「The Newton-Muon Optimizer」（arXiv:2604.01472），證明熱門的...

研究論文 LLM 開源專案 NanoGPT Muon

@weijie444

♥890🔁 110

𝕏🔥🔥🔥🔥2026/4/18

Anthropic「Project Glasswing」強調模型危險，Lazarus AI推出開源「Clearwing」重現成果。 Anthropic上週公布「Project Glasswing」與「Claude Mythos Pre...

LLM 開源專案資安 Anthropic Lazarus AI Claude

@QuixiAI

♥1.5k🔁 242

𝕏🔥🔥🔥🔥2026/4/17

Claude Opus 4.7在程式碼任務與Agentic工作上更智能精準。相較4.6版，它處理歧義更佳、bug偵測更強，並需調整提示與harness以達最佳效能。 Opus 4.7是目前最強一般可用模型，專精程式碼撰寫、企業工作流程...

Claude Code 功能更新 Agent LLM Anthropic Claude

@bcherny

♥6.8k🔁 616

𝕏🔥🔥🔥🔥2026/4/17

OpenAI推出「GPT-Rosalind」，專為生物學、藥物發現與轉譯醫學優化的前沿推理模型。 OpenAI於2026年4月16日發布「GPT-Rosalind」，這是其生命科學模型系列首發，針對科學工作流程優化，強化化學、蛋白質工...

LLM 新產品 AIGC OpenAI GPT

@OpenAI

♥12.8k🔁 1.3k

𝕏🔥🔥🔥2026/4/16

Qwen3.6-35B-A3B開源MoE模型以3B活性參數匹敵10倍大小模型。 Qwen3.6-35B-A3B是稀疏MoE模型，總參數35B、活性參數僅3B，Apache 2.0授權完全開源，於2026/04/15發布，展現高效能Ag...

LLM 開源專案新產品 Qwen Alibaba

@Alibaba_Qwen

♥11.6k🔁 1.7k

𝕏🔥🔥2026/4/16

Claude Opus 4.7全面上線，編碼與專業任務大幅躍進。 Anthropic推出「Opus 4.7」模型，已於所有產品上線，相較「Opus 4.6」在編碼、電腦使用、金融及一般知識工作表現顯著提升。開發者Felix Riese...

功能更新 LLM Claude Anthropic Claude

@felixrieseberg

♥527🔁 32

𝕏🔥🔥🔥🔥🔥2026/4/16

Claude Opus 4.7發布，強化長任務處理與視覺能力。 Anthropic於2026年4月16日推出Claude Opus 4.7，這是相較Opus 4.6在進階軟體工程領域的顯著升級，尤其在最艱難任務上表現突出，使用者能自信...

Claude 功能更新 LLM Anthropic Claude

@claudeai

♥81.1k🔁 10.3k

𝕏🔥🔥2026/4/16

「潛意識學習」論文登上Nature，大型語言模型透過無關資料隱藏傳遞行為特徵。 Owain Evans團隊的論文《Language models transmit behavioural traits through hidden s...

LLM 研究論文 Nature AI Safety

@OwainEvans_UK

♥875🔁 139

𝕏🔥2026/4/15

為什麼 dLLM 在 RL 中容易崩潰在先前關於 dLLM 的討論中，重點通常在於它們與自回歸（autoregressive）模型的區別：前者從左到右生成 token，而後者透過去噪（denoising）逐漸逼近完整的序列。前者的機...

LLM 研究論文其他 dLLM

@sheriyuo

♥207🔁 24