策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 74 篇
Aqua Voice 於 iOS 上線,主打語音鍵盤與 AI 編輯功能。 Aqua Voice 是一款適用於 iOS 的付費語音鍵盤,旨在讓使用者在任何應用程式中透過語音輸入與編輯,將手機轉化為高效的工作站。 核心功能與應用 ...
@aquavoiceOpenAI 內部模型成功解決五項 Erdős 數學難題。 OpenAI 近期發表了一篇新論文,展示其內部模型成功解決了五項數學界的「Erdős 問題」,證明 AI 在處理複雜數學推論上的進展。 研究成果與亮點 這篇論文(編號...
@mehtaab_sawhneyTanStack AI 推出 Code Mode,讓 LLM 透過執行 TypeScript 程式碼解決複雜任務。 LLM 在處理數學運算與工具呼叫(Orchestration)時表現不佳,TanStack AI 提出的「Code M...
@tan_stackGoogle Gemini 深度整合筆記功能,實現雙向資料存取。 Google 宣布將 Gemini 與筆記功能進行更深度的整合,讓使用者能直接在 Gemini App 中存取個人筆記,並將對話內容作為筆記來源,強化了兩者間的協作關係...
@NotebookLMMeta 發布 Muse Spark 多模態推理模型。 Meta Superintelligence Labs 推出 Muse Spark,這是其「個人超級智慧」願景下的首款原生多模態推理模型,具備工具使用、視覺思維鏈及多 Agent...
@AIatMetaACE-Step 1.5 發布,引入 4B 參數 DiT 解碼器提升音樂生成品質。 ACE-Step 1.5 推出全新 XL 系列,透過將 DiT 解碼器擴展至 4B 參數,在保持高效能與相容性的同時,顯著提升了音訊品質、指令遵循能力...
@acemusicAIPrism 推出「Paper Review」功能,旨在透過 AI 提升學術論文的技術嚴謹度。 Prism 今日發布「Paper Review」工作流,這項工具並非為了產出 AI 垃圾內容,而是致力於強化科學研究的嚴謹性、正確性與可重現...
@kevinweilHeyGen 推出 Avatar V 模型,實現了高擬真且具備行為一致性的數位分身生成。 HeyGen 發布了最新的 Avatar V 模型,這是一套能透過單一參考影片與音訊,生成長度不受限、且能精準還原個人外貌特徵與行為習慣的 AI...
@joshua_xu_Ideogram 推出可編輯文字圖層與設計分類功能,實現生成式設計的精細化編輯。 Ideogram 今日宣布推出「Editable Text Layers」與「Design Categories」功能,旨在解決生成式影像中文字難以修改...
@ideogram_aiGemma Multimodal Fine-Tuner 讓使用者能在 Apple Silicon 上,透過本地端與雲端串流技術,高效微調 Gemma 3n 與 Gemma 4 模型。 這款工具填補了 Apple Silicon 生態系...
@mattmirelesClicky 開源釋出,讓開發者能打造具備螢幕感知與互動能力的 AI 教學夥伴。 開發者 Farza 近期將其開發的 AI 助手「Clicky」正式開源,這是一款能常駐於 macOS 選單列的 AI 教學夥伴,具備螢幕截圖、語音對話及...
@FarzaTVRowboat 是一款開源且以本地優先的 AI 協作工具,能將工作內容轉化為知識圖譜並執行任務。 Rowboat 是一款主打「本地優先 (Local-first)」的開源 AI 協作工具,它能自動串接使用者的電子郵件與會議筆記,構建出...
@segmenta