AI 技術社群精選內容,按時間排序瀏覽所有策展貼文。共 1 篇
MegaTrain 實現單 GPU 訓練 100B+ 參數模型。 MegaTrain 透過將主機記憶體作為參數儲存核心,成功在單一 GPU 上實現 100B+ 參數模型的高精度訓練,挑戰了傳統以 GPU 為中心的設計限制。此研究指出,...