策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 83 篇
LLM 中的 Prompt Caching:清晰解析 這是一份關於 Claude 如何達成 92% 快取命中率的案例研究 --- 每當 AI Agent 採取一個步驟時,它都會將整個對話歷史紀錄傳送回 LLM。 這包...
@_avichawlaAgent Harness 的解剖學 深入探討 Anthropic、OpenAI、Perplexity 和 LangChain 實際上在建構什麼。本文將涵蓋編排迴圈 (orchestration loop)、工具 (tools)、記憶...
@akshay_pachaarCloudflare推出Unweight無損壓縮系統,將LLM模型大小壓縮15-22%,解決H100 GPU記憶體頻寬瓶頸。 Cloudflare開發「Unweight」,這是無損推論時壓縮系統,針對模型權重進行壓縮,實現最高22%模...
@CloudflareNewton-Muon優化器揭示Muon隱含牛頓法本質,並透過修正輸入資料幾何實現更高效LLM訓練。 Weijie Su團隊發布論文「The Newton-Muon Optimizer」(arXiv:2604.01472),證明熱門的...
@weijie444Anthropic「Project Glasswing」強調模型危險,Lazarus AI推出開源「Clearwing」重現成果。 Anthropic上週公布「Project Glasswing」與「Claude Mythos Pre...
@QuixiAIClaude Opus 4.7在程式碼任務與Agentic工作上更智能精準。相較4.6版,它處理歧義更佳、bug偵測更強,並需調整提示與harness以達最佳效能。 Opus 4.7是目前最強一般可用模型,專精程式碼撰寫、企業工作流程...
@bchernyOpenAI推出「GPT-Rosalind」,專為生物學、藥物發現與轉譯醫學優化的前沿推理模型。 OpenAI於2026年4月16日發布「GPT-Rosalind」,這是其生命科學模型系列首發,針對科學工作流程優化,強化化學、蛋白質工...
@OpenAIQwen3.6-35B-A3B開源MoE模型以3B活性參數匹敵10倍大小模型。 Qwen3.6-35B-A3B是稀疏MoE模型,總參數35B、活性參數僅3B,Apache 2.0授權完全開源,於2026/04/15發布,展現高效能Ag...
@Alibaba_QwenClaude Opus 4.7全面上線,編碼與專業任務大幅躍進。 Anthropic推出「Opus 4.7」模型,已於所有產品上線,相較「Opus 4.6」在編碼、電腦使用、金融及一般知識工作表現顯著提升。開發者Felix Riese...
@felixriesebergClaude Opus 4.7發布,強化長任務處理與視覺能力。 Anthropic於2026年4月16日推出Claude Opus 4.7,這是相較Opus 4.6在進階軟體工程領域的顯著升級,尤其在最艱難任務上表現突出,使用者能自信...
@claudeai「潛意識學習」論文登上Nature,大型語言模型透過無關資料隱藏傳遞行為特徵。 Owain Evans團隊的論文《Language models transmit behavioural traits through hidden s...
@OwainEvans_UK為什麼 dLLM 在 RL 中容易崩潰 在先前關於 dLLM 的討論中,重點通常在於它們與自回歸(autoregressive)模型的區別:前者從左到右生成 token,而後者透過去噪(denoising)逐漸逼近完整的序列。前者的機...
@sheriyuo