策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 700 篇
OpenAI Agents SDK升級,提供沙盒執行與自訂harness,助開發者建構長時程Agent。 OpenAI於2026年4月15日發布Agents SDK更新版,針對現有框架從原型到生產的權衡(如模型無關框架未充分利用前沿模...
@OpenAIDevsAnthropic開發「Automated Alignment Researchers (AARs)」,Claude Opus 4.6在7天內將weak-to-strong監督PGR從人類23%提升至97%。 Anthropic於20...
@AnthropicAIGemini CLI 推出 Subagents 功能,實現專家代理分工與平行執行。 Gemini CLI 於 2026 年 4 月 15 日正式推出 Subagents,讓主代理能將複雜、重複或高量任務委派給專門的專家子代理,每個子代...
@geminicli分片是擴展資料庫的最佳方式。 PlanetScale於2025年1月9日發布互動式文章,詳細解釋資料庫分片(sharding)的運作原理與設計考量,強調這是處理PB等級資料與每秒數百萬查詢的首選方案,Uber、Shopify、Slac...
@PlanetScaleEvoForge:擴展演化式 Harness 優化 為什麼只優化一個 harness,而不試著同時優化多個呢?這就是 EvoForge:一個演化式 harness 優化器。 在 TerminalBench 2.0 測試中...
@leonardtang_使用 Claude Code:Session 管理與 1M Context 今天我們針對 /usage 推出了全新的更新,旨在幫助您了解自己在 Claude Code 上的使用情況;這項更新是基於我們與客戶進行的多場對談後所做出的調整...
@trq212Claude強制身分驗證政策升級,針對高頻使用者與中轉站下重手。 Claude官方推出「Identity verification on Claude」新政策,逐步推送給高頻使用者、Claude Max訂閱者、使用進階功能者,或被風控...
@Zh_Crypto517Google工程師AI採用率僅達產業平均水準,落後於領先者逾18個月。 Steve Yegge與Google資深技術總監的對話揭露,Google的AI採用曲線與拖拉機公司John Deere相同:20% Agentic(代理式)權威使...
@Steve_Yegge為什麼 dLLM 在 RL 中容易崩潰 在先前關於 dLLM 的討論中,重點通常在於它們與自回歸(autoregressive)模型的區別:前者從左到右生成 token,而後者透過去噪(denoising)逐漸逼近完整的序列。前者的機...
@sheriyuoOpenAI擴大「Trusted Access for Cyber (TAC)」計畫至數千名驗證防禦者與數百團隊,並推出專為網路防禦微調的GPT-5.4-Cyber模型。 OpenAI於2026年4月14日宣布擴大「Trusted A...
@thsottiauxClaude Mythos Preview首度完成AISI 32步網路攻擊模擬端到端測試。 AISI對Anthropic「Claude Mythos Preview」(4月7日發布)進行網路安全評估,發現它是首個模型在「The Las...
@AISecurityInstClaude Code推出routines研究預覽版,實現自動化排程、API呼叫與GitHub事件觸發。 Claude Code的routines功能現進入研究預覽階段,讓使用者一次設定提示詞、程式庫與連接器,即可在Anthropic...
@claudeai