企業(yè)大模型實戰(zhàn):核心技術與行業(yè)賦能
定 價:118 元
- 作者:惠潤海
- 出版時間:2025/7/1
- ISBN:9787121506635
- 出 版 社:電子工業(yè)出版社
- 中圖法分類:F272.7
- 頁碼:344
- 紙張:
- 版次:01
- 開本:16開
本書系統(tǒng)化探討大模型在企業(yè)場景中的技術與應用,全面覆蓋大模型興起的技術背景、發(fā)展趨勢,以及提示詞工程、智能體、模型微調、推理等關鍵應用技術。書中重點介紹了LangChain等開發(fā)框架,并深度剖析醫(yī)療、教育、智能駕駛、科研等行業(yè)應用案例,展現(xiàn)大模型賦能產(chǎn)業(yè)升級的巨大潛力。本書遵從理論到實踐的路徑,致力于為企業(yè)構建可擴展、高性能的大模型應用體系提供完整方法論和技術解決方案,適合作為企業(yè)智能化升級的參考讀物。
惠潤海,教授級高工,長期致力于面向人工智能和高性能計算的先進算力與數(shù)據(jù)存儲的研究和規(guī)劃,擁有20多年的專業(yè)經(jīng)驗,承擔過多項國家和省級重大項目課題,獲得過多項省部級以上獎項。王延飛,大模型應用與算力調度專家,技術公眾號“螢火AI百寶箱”創(chuàng)辦人,專注于算力、云原生、大模型等方向的深度分享,在技術社區(qū)創(chuàng)下超千萬閱讀記錄。
第1章 人工智能的起源與演進 1
1.1 日常生活中的人工智能 1
1.2 從圖靈測試到專家系統(tǒng) 2
1.3 神經(jīng)網(wǎng)絡的初步探索 4
1.4 本章小結 5
第2章 機器學習的崛起 6
2.1 機器學習的定義與核心思想 6
2.2 機器學習方法 7
2.2.1 有監(jiān)督學習 7
2.2.2 無監(jiān)督學習 10
2.2.3 強化學習 12
2.3 機器學習的常用算法 15
2.3.1 有監(jiān)督學習的常用算法 15
2.3.2 無監(jiān)督學習的常用算法 17
2.3.3 強化學習的常用算法 19
2.3.4 如何選擇最佳機器學習算法 21
2.4 機器學習在IBM Watson中的應用 25
2.5 本章小結 26
第3章 深度學習的革命 27
3.1 深度學習的發(fā)展歷程 27
3.2 深度神經(jīng)網(wǎng)絡基礎 34
3.2.1 神經(jīng)元 34
3.2.2 單層神經(jīng)網(wǎng)絡 35
3.2.3 多層神經(jīng)網(wǎng)絡 35
3.3 關鍵技術突破:RNN、CNN、GAN 38
3.3.1 RNN:循環(huán)神經(jīng)網(wǎng)絡 38
3.3.2 CNN:卷積神經(jīng)網(wǎng)絡 40
3.3.3 GAN:生成對抗網(wǎng)絡 42
3.3.4 RNN、CNN和GAN的優(yōu)缺點對比 43
3.4 ImageNet挑戰(zhàn)賽 43
3.5 經(jīng)典AI與現(xiàn)代AI的分野 45
3.5.1 IBM深藍:經(jīng)典AI的巔峰 45
3.5.2 AlphaGo:現(xiàn)代AI的典范 46
3.6 本章小結 47
第4章 大模型的興起與發(fā)展 48
4.1 大模型的崛起 48
4.2 大模型的分類 51
4.3 大模型的特點 52
4.3.1 參數(shù)規(guī)模大 52
4.3.2 算力消耗大 54
4.3.3 數(shù)據(jù)Token化 55
4.3.4 泛化能力 58
4.4 Transformer 60
4.4.1 Transformer的特點 60
4.4.2 Transformer的架構設計 63
4.4.3 Transformer的發(fā)展歷程 70
4.4.4 Transformer的應用場景 71
4.5 GPT系列模型 73
4.6 DeepSeek系列模型 78
4.6.1 DeepSeek的發(fā)展歷程 78
4.6.2 DeepSeek的技術創(chuàng)新 79
4.7 大模型發(fā)展趨勢:技術與應用的雙向推進 84
4.8 本章小結 86
第5章 提示詞工程:大模型的溝通話術 88
5.1 提示詞的重要性 89
5.2 大模型提示詞的工作流程 90
5.2.1 提示詞工程的工作機制 90
5.2.2 提示詞工程的工作流程 92
5.3 大模型提示詞編寫技術及最佳實踐 93
5.3.1 角色設定與指令注入 93
5.3.2 問題拆解與分層設計 94
5.3.3 編程思維與Few-Shot設計 95
5.3.4 高級提示詞設計技巧 96
5.4 巧用萬能Prompt 97
5.5 使用CO-STAR框架編寫提示詞 99
5.5.1 CO-STAR框架的使用方法 100
5.5.2 CO-STAR框架的代碼案例 101
5.6 推理大模型的提示詞設計 103
5.7 本章小結 107
第6章 智能體應用 108
6.1 智能體:大模型落地的“最后一公里” 108
6.2 ReAct Agent實現(xiàn)智能體與環(huán)境交互 113
6.2.1 ReAct Agent的特點 113
6.2.2 ReAct Agent的架構組成 114
6.2.3 ReAct Agent的工作流程 115
6.3 智能體生態(tài):構建智能體發(fā)展的基礎 116
6.4 智能體與具身智能 118
6.5 斯坦福小鎮(zhèn)模擬人類行為 120
6.5.1 技術架構與實現(xiàn) 122
6.5.2 智能體設計與行為生成 123
6.6 本章小結 125
第7章 模型微調與定制化 126
7.1 為什么需要微調 126
7.2 大模型微調技術路線 128
7.3 大模型的高效微調 132
7.3.1 Hugging Face的三大創(chuàng)新 132
7.3.2 LoRA:參數(shù)高效微調的技術突破 133
7.3.3 實戰(zhàn):高效微調Llama模型 135
7.4 檢索增強生成和微調 140
7.4.1 企業(yè)級RAG系統(tǒng)設計 143
7.4.2 企業(yè)級微調系統(tǒng)設計 147
7.5 本章小結 151
第8章 大模型推理與服務化 152
8.1 什么是大模型推理 152
8.2 大模型推理引擎 154
8.2.1 TensorRT-LLM 155
8.2.2 vLLM 157
8.2.3 LMDeploy 162
8.2.4 Hugging Face TGI 165
8.3 大模型的推理優(yōu)化 168
8.3.1 大模型推理的優(yōu)化手段 170
8.3.2 提升大模型數(shù)學推理能力 171
8.4 大模型推理評估 177
8.5 KServe:基于Kubernetes的標準化模型推理平臺 180
8.5.1 KServe架構解析 181
8.5.2 KServe的關鍵技術優(yōu)勢 184
8.5.3 Kserve推理服務的發(fā)布流程 186
8.5.4 實戰(zhàn):KServe快速發(fā)布推理服務 188
8.6 本章小結 195
第9章 大模型應用開發(fā)框架LangChain 196
9.1 為什么需要LangChain 196
9.2 LangChain的架構設計 198
9.3 LangChain的關鍵概念 201
9.4 實戰(zhàn):LangChain API 207
9.5 LangGraph Agent:賦予大模型執(zhí)行力的智能體框架 218
9.6 實戰(zhàn):基于LangChain構建智能知識庫問答系統(tǒng) 224
9.7 本章小結 239
第10章 醫(yī)療健康:大模型助力健康革命 240
10.1 醫(yī)療健康行業(yè)概覽 241
10.1.1 醫(yī)療健康行業(yè)面臨的主要挑戰(zhàn) 242
10.1.2 醫(yī)療健康數(shù)據(jù)的特點與價值 243
10.1.3 醫(yī)療健康行業(yè)的智能化轉型 245
10.2 AI重塑醫(yī)療服務價值鏈 247
10.2.1 AI醫(yī)療的關鍵能力 247
10.2.2 AI醫(yī)療自動化的不同階段 249
10.2.3 AI賦能診前、診中、診后環(huán)節(jié) 250
10.3 大模型在醫(yī)療健康行業(yè)的核心應用場景 252
10.3.1 輔助診斷:提升診斷效率與準確性 252
10.3.2 藥物研發(fā):加速新藥發(fā)現(xiàn)與優(yōu)化 255
10.3.3 健康管理與公共衛(wèi)生:構建智能健康防線 256
10.4 大模型技術在醫(yī)療健康行業(yè)的創(chuàng)新實踐 257
10.4.1 Google醫(yī)療AI模型Med-Gemini 257
10.4.2 清華大學智能體醫(yī)院 261
10.5 本章小結 267
第11章 教育革新:大模型重塑學習體驗 269
11.1 教育技術的發(fā)展:機遇與挑戰(zhàn) 270
11.1.1 傳統(tǒng)教育技術的局限 270
11.1.2 大模型帶來的機遇 271
11.1.3 教育技術發(fā)展面臨的挑戰(zhàn) 272
11.2 大模型賦能教育:個性化學習與教學輔助 274
11.2.1 大模型在個性化學習中的應用:千人千面,因材施教 276
11.2.2 大模型在教學輔助中的應用:解放教師,提質增效 279
11.3 教育領域的大模型技術創(chuàng)新案例 281
11.3.1 EduChat的核心功能 281
11.3.2 EduChat的構建過程 283
11.3.3 EduChat效果驗證 286
11.4 大模型在教育中的應用前景 287
11.5 本章小結 288
第12章 智能駕駛:大模型推動未來出行 290
12.1 智能駕駛:一個空間機器人的時代 291
12.2 智能駕駛與大模型 292
12.2.1 智能駕駛中的大模型技術 292
12.2.2 大模型成為智能駕駛技術突破的核心力量 297
12.3 智能駕駛案例:特斯拉FSD系統(tǒng) 298
12.3.1 特斯拉FSD系統(tǒng)的技術基石:端到端神經(jīng)網(wǎng)絡架構 298
12.3.2 視覺感知核心:BEV+Transformer 299
12.3.3 深度學習與強化學習在特斯拉FSD系統(tǒng)中的深度應用 300
12.3.4 大模型驅動的技術飛躍:特斯拉FSD系統(tǒng)的進化之路 301
12.3.5 FSD技術面臨的挑戰(zhàn)與未來發(fā)展 304
12.4 本章小結 305
第13章 科研探索:大模型加速科學發(fā)現(xiàn) 306
13.1 科研領域的創(chuàng)新需求與挑戰(zhàn) 307
13.1.1 數(shù)據(jù)洪流:機遇與挑戰(zhàn)并存 307
13.1.2 跨學科研究的瓶頸 308
13.1.3 科研效率亟待提升 310
13.2 大模型技術在科研數(shù)據(jù)分析與模擬中的應用 310
13.2.1 天文學:大模型助力天文圖像分析 311
13.2.2 化學:大模型賦能下的分子與材料探索 312
13.2.3 生物學:大模型加速生命科學的理解與設計 316
13.2.4 數(shù)學:大模型推動算法的自我進化 317
13.2.5 地球科學:大模型洞悉地球系統(tǒng)的奧秘 319
13.2.6 神經(jīng)科學:大模型揭示大腦的秘密 321
13.3 AI For Science的代表:AlphaFold 322
13.3.1 AlphaFold的技術突破 323
13.3.2 AlphaFold 2的工作流程 323
13.3.3 AlphaFold 2的應用領域 326
13.3.4 AlphaFold 3:進一步的突破與挑戰(zhàn) 326
13.4 本章小結 327
結語 329