策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 700 篇
Mistral 推出 Voxtral TTS,一款輕量化的多語言文字轉語音模型,聲稱在零樣本語音適應測試中超越 ElevenLabs v2.5 Flash,同時維持低延遲性能,主要瞄準企業級語音代理應用。 核心功能與設計特點 Voxtral...
@MistralAIGoogle DeepMind 團隊針對大型語言模型(LLM)存在的知識斷層問題發布了 Gemini API developer skill。LLM 在特定時間點進行訓練後知識就固定了,而軟體工程領域變化迅速——新程式庫每天都在推出,最佳實...
@_philschmid文件搜尋與回答(RAG)系統在處理 PDF 時面臨方法選擇問題,Weaviate 最新研究表明,文字提取、影像嵌入與混合方法各有優勢,沒有單一答案,而是需要視應用場景而定。 研究背景與核心問題 在構建 PDF RAG 管線時,開發者面臨兩條...
@victorialslocum使用 Gemini 3.1 Flash Live 建構即時對話式 Agent 今天,我們透過 Google AI Studio 中的 Gemini Live API 正式推出 Gemini 3.1 Flash Live。Gemini ...
@GoogleAIStudioSwarnim Jain 開發了 Grove,一個突破性的分散式機器學習訓練庫,讓 MacBook 無需任何設定就能自動發現彼此並協力訓練模型。核心創新在於利用 Apple 設備內建的 AWDL(Apple Wireless Direct ...
@swar_ja經過 10 多年開發、累計超過 1.9 億次下載和每週 360 萬次安裝量,TypeORM 終於推進到 v1.0 beta 階段。開發團隊已釋出 beta 版本供社群測試(npm install typeorm@beta),並尋求使用者回饋...
@typeormjsArrowJS 1.0 正式開源,定位為「coding agent 專用的 UI 框架」。核心優勢在於設計philosophy 徹底簡化:無需編譯器、無需建置流程、無需 JSX transformer,純粹 TypeScript/JavaS...
@jpschroeder我們如何透過 Karpathy 的 Auto-Research 打造出最佳瀏覽器 Agent 瀏覽器 Agent 的 Auto-Research 運作方式 我們提供 Claude Code 一個連接到我們評估平台的 CLI,以及一個在迴圈中...
@mamagnus00LangSmith Fleet 現已支援可共享的 skills(技能),讓團隊能夠為 Agent 配備專項任務的領域知識。skills 是一組指令與領域知識,附加到 Agent 上,作用如同持久性的簡報文件,塑造 Agent 針對特定任務或...
@LangChainCapCut 推出 Video Studio,一個無時間軸的畫布式人工智慧影片製作工作區,整合 Dreamina Seedance 2.0 模型,為各級創作者提供高效能的故事訴說平台。 Dreamina Seedance 2.0 的核心優勢...
@capcutappGoogle 推出「Vibe Coding XR」,一套快速原型製作工作流程,將 Gemini Canvas 與開源的「XR Blocks」框架相結合,讓使用者透過自然語言提示直接生成功能完整、具物理感知能力的 WebXR 應用程式。這套系...
@GoogleResearchCursor 宣布正式推出自託管雲端 Agent,核心價值在於讓使用者保留完整的安全控制權——程式庫、工具執行和建置成果物完全不離開企業自有網路,同時仍能享受雲端 Agent 的所有能力。這項發展針對受到嚴格法規約束的組織,尤其是金融服務業...
@cursor_ai