策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 246 篇
AI Agent 在瀏覽器自動化上表現不佳,根本原因在於現有工具設計不當。Playwright 原本就不是為 Agent 打造的,而 Browser MCP Server 則只是半成品的封裝。開發者指出,既有工具要麼需要完整的 Node.j...
@gsd_foundationHermes Agent v0.6.0(發布於 2026 年 3 月 30 日)在 2 天內整合了 95 個 PR 和 16 項已解決的問題,最核心的突破是引入了 Profiles 系統,允許使用者從同一安裝環境執行多個完全隔離的 Herm...
@NousResearchOpenPencil 0.11 版本標誌著專案走向重大轉變,從單純的設計編輯應用演進成完整的開發工具包。新版本引入了一個可重用的編輯器核心,並以此為基礎推出了 headless Vue SDK,允許開發者將 OpenPencil 的編輯能力...
@dan_noteOpenAgents Workspace 是一個統一的工作環境,讓多個 AI Agent 能在同一個空間協作,共享對話、檔案和瀏覽器。該專案已於推出期間正式上線,採開源架構,無需帳戶即可使用。 核心問題與解決方案 現實中的 AI Agent...
@OpenAgentsAI開發者對現有Android螢幕鏡像工具的商業模式感到不滿,決定開發「Another」——一款完全免費且開源的替代方案,強調其在低延遲和無廣告的優勢。 創作動機與核心訴求 開發者因為Vysor頻繁展示廣告和設置付費牆而感到困擾,決定自行開發一...
@chiziaruhomaTransformers.js v4 經過一年開發(自 2025 年 3 月起)正式上線,帶來全新的 C++ WebGPU 後端、超過 200 種架構支援,以及整個程式碼庫的完全重構。這次更新將瀏覽器端人工智慧的效能提升到新的高度,同時實現...
@xenovacomLongCat-Next 是美團開源的原生多模態離散自迴歸模型,將文本、視覺和音訊統一在單一框架中處理,突破了傳統多模態建模的架構分割,在理解、生成和語音交互上實現工業級性能。 核心架構與設計理念 LongCat-Next 建立在「離散原生...
@Meituan_LongCat開發者公開了一個 macOS 語音輸入應用的完整源碼及構建過程,並明確強調可重現性,反駁了外界對該專案「玩抽象」的質疑。 應用功能概述 「VoiceInput」是一款 macOS 選單列應用程式,運用 Apple 內建的語音識別框架實現即時...
@yetone開發者今日遇到了在 Cloudflare Workers 上找不到合適的 Node.js 轉向代理 (rotating proxy) 解決方案,因此自行開發了 flaregun——一個能將 Cloudflare 免費方案轉化為轉向代理網路的...
一位開發者在公開的「Codex skills」上線了 Review Swarm,這個 plugin 能生成 4 個子 Agent 並行審查程式碼變更,分別檢查行為迴歸、安全風險、效能問題和測試覆蓋缺口,最後由主 Agent 篩選、排序並彙總...
@Dimillianlitesearch 是一款完全本地化的語意搜尋 CLI 和 TUI 應用,整合了 LiteParse 解析引擎、Chonkie 分塊工具和 Qdrant Edge 向量儲存,無需外部服務即可實現文件攝取、嵌入和檢索的完整流程。 核心工作流...
@itscleliacx 是一款輕量化的命令列工具,用於幫助 AI Agent 更高效地導航程式庫,同時大幅節省 token 消耗。作者稱其為「10 倍更有效率的 LSP,為 AI 編程而生」,並以實際數據支撐其效能聲稱。 問題診斷與效率數據 作者分析了 10...
@_ndigo