策展精選
AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 16 篇
VLM
熱度
排序
𝕏🔥
Google 發布 Gemma 4 開放模型系列,主打高效能與行動裝置端部署。 Google DeepMind 推出 Gemma 4 開放模型系列,採用 Apache 2.0 授權,旨在提供業界領先的智慧密度,並支援從行動裝置到伺服器...
@OfficialLoganK♥6.2k🔁 596
𝕏🔥
Falcon OCR 透過早期融合架構,以 0.3B 輕量參數實現高效能文件辨識。 TII 發布了「Falcon Perception」與「Falcon OCR」,這兩款模型挑戰了傳統複雜的視覺語言模型架構,證明透過單一「早期融合 (...
@dahou_yasser♥731🔁 129
𝕏🔥
阿里巴巴推出 Qwen3.5-Omni,是其最新一代完全多模態大語言模型,支援文字、圖像、音訊及音訊-視覺內容的原生理解。該模型系列包含三個規模的 Instruct 版本(Plus、Flash、Light),支援 256k 長文脈輸入。相比...
@Ali_TongyiLab♥2.3k🔁 287
𝕏🔥🔥
Luma 推出首個統一理解與生成模型「Uni-1」,標誌著從純粹擴展視覺媒體生成能力向更根本的轉變。該公司明確指出,「不加思考的生成有其根本限制」,因此 Uni-1 的核心創新在於將推理與想像能力整合在單一架構中——模型能夠在生成像素的同時...
@LumaLabsAI♥4.7k🔁 776