← 返回首頁

Chrome 146 的推出標誌著一個重要的轉折點

Petr Baudis
Petr Baudis
@xpasky
272🔁 12
𝕏 (Twitter)🔥
AI 中文摘要Claude 生成

Chrome 146 的推出標誌著一個重要的轉折點。透過簡單的單一切換,使用者現在可以將自己當前的實時瀏覽工作階段透過 MCP 暴露給 CLI Agent,讓 Agent 能直接在該工作階段中執行操作。這對於許多待辦事項(例如處理 LinkedIn 連結申請)提供了全新的工作流程方式。

開箱即用的改變 過去確實可以實現類似功能,但前提是必須在既有的工作階段中進行——也就是保留所有已登入的帳號等狀態——這通常需要安裝自訂延伸功能或進行額外設定。現在則「開箱即用」。儘管如此,該功能在官方 MCP 客戶端上存在實際限制:當標籤頁數量達到數百個時,效能會出現問題。

chrome-cdp 核心價值 為了解決這些問題,「chrome-cdp」方案應運而生。它的核心價值在於讓 AI Agent 能看到並互動你的實時 Chrome 工作階段——也就是你已開啟的標籤、已登入的帳號,以及目前的頁面狀態。這些都無需瀏覽器自動化框架、無需獨立的瀏覽器實例,也不必重新登入。

連接實時工作階段 該工具對任何 Chrome 安裝都開箱即用,只需一個切換開關啟用,無需安裝其他組件。大多數瀏覽器自動化工具會啟動全新的隔離瀏覽器,但 chrome-cdp 連接到你正在執行的 Chrome,讓 Agent 能:

  • 讀取已登入的頁面(Gmail、GitHub、內部工具等)
  • 與你正在積極使用的標籤互動
  • 看到工作流程中間的實際頁面狀態,而非全新重新載入後的狀態

安裝方式 安裝流程同樣簡單。作為 pi skill,可以執行 pi install git:github.com/pasky/[email protected]。對於其他 Agent(Amp、Claude Code、Cursor 等),只需複製 skills/chrome-cdp/ 目錄到 Agent 載入技能的位置。唯一的執行時間依賴是 Node.js 22 以上版本——無需 npm 安裝。啟用 Chrome 遠端偵錯同樣簡單,只需導航到 chrome://inspect/#remote-debugging 並切換開關即可。

自動偵測瀏覽器 CLI 能自動偵測 macOS 和 Linux 上的 Chrome、Chromium、Brave、Edge 和 Vivaldi。如果瀏覽器在非標準位置儲存 DevToolsActivePort,可以設定 CDP_PORT_FILE 環境變數指向完整路徑。

功能指令 功能指令包括:

  • 列出開啟的標籤
  • 擷取螢幕截圖
  • 生成無障礙樹狀結構
  • 提取完整 HTML
  • 在頁面環境中執行 JavaScript
  • 導航到 URL
  • 監測網路資源時序
  • 點擊元素
  • 輸入文字
  • 反覆點擊「載入更多」按鈕直到消失
  • 執行原始 CDP 指令

與競品的比較 與「chrome-devtools-mcp」相比,chrome-cdp 的優勢明顯。後者在每條指令時都重新連接,導致 Chrome 的「允許偵錯」對話方塊會重複出現,且在多個標籤頁開啟時目標列舉容易逾時。chrome-cdp 則為每個標籤頁維持單一持久的背景程式——對話方塊只出現一次,能可靠地處理 100 多個標籤。該程式會在 20 分鐘無活動後自動結束。

技術架構優勢 這種方法直接連接到 Chrome 的遠端偵錯 WebSocket,無需 Puppeteer 或任何中介層。正因為這一設計,它能可靠地處理超過 100 個開啟的標籤,而建立在 Puppeteer 基礎上的工具往往會在目標列舉期間超時。