123,123

內(nèi)容簡介
編輯推薦
作者介紹
目錄

本書以通俗易懂、大量圖解的方式剖析了DeepSeek的底層技術(shù)。

全書分為3章和附錄，第1章詳細分析了推理大模型的范式轉(zhuǎn)變，即從訓練時計算到測試時計算；第2章解讀了DeepSeek-R1的架構(gòu)混合專家（MoE）；第3章展示了DeepSeek-R1詳細的訓練過程及核心技術(shù)，涵蓋基于GRPO的強化學習等；附錄分享了DeepSeek開源周活動。

本書適合大模型從業(yè)人員和對大模型底層技術(shù)感興趣的讀者。書中通過豐富的圖解將復雜的技術(shù)解釋得簡單、清晰、通透，是學習大模型技術(shù)難得一見的參考書。

你還可能感興趣

圖解人工智能大全圖解AI大全日本著名人工智能權(quán)威機構(gòu)首席、高級研究員編寫
人工智能算法圖解
圖解DeepSeek技術(shù)
GPT圖解大模型是怎樣構(gòu)建的
工業(yè)級知識圖譜：方法與實踐
你好啊，人工智能：你的第一本前沿科技啟蒙書

我要評論