計(jì)算機(jī)視覺——從理論到實(shí)踐
定 價(jià):59.8 元
叢書名:新一代人工智能創(chuàng)新人才培養(yǎng)精品系列
讀者對(duì)象:本書適用于人工智能、智能科學(xué)與技術(shù)等專業(yè)學(xué)生
本書深入探索計(jì)算機(jī)視覺的核心技術(shù),圍繞五大關(guān)鍵任務(wù)展開介紹,即圖像分類、圖像分割、目標(biāo)檢測(cè)、目標(biāo)跟蹤及三維重建。本書共9章,分為三篇,即基礎(chǔ)篇、識(shí)別篇和重建篇,系統(tǒng)性地引導(dǎo)讀者逐步深入了解計(jì)算機(jī)視覺的復(fù)雜內(nèi)涵與應(yīng)用實(shí)踐。基礎(chǔ)篇(第1~4章)著重介紹了構(gòu)成計(jì)算機(jī)視覺的通用理論與算法,包括但不限于圖像濾波技術(shù)的基本原理、邊緣檢測(cè)的實(shí)現(xiàn)方法、尺度不變特征的提取策略及模型擬合的數(shù)學(xué)工具等,為后續(xù)章節(jié)的學(xué)習(xí)奠定必要的理論與技術(shù)基礎(chǔ)。識(shí)別篇(第5~7章)深入分析了機(jī)器解析圖像內(nèi)容的高級(jí)能力,具體涉及圖像分割、圖像分類、目標(biāo)檢測(cè)與跟蹤的經(jīng)典算法及模型。重建篇(第8、9章)聚焦于如何從二維圖像數(shù)據(jù)中復(fù)原三維場(chǎng)景結(jié)構(gòu),詳細(xì)闡述了攝像機(jī)幾何原理、極幾何的應(yīng)用、雙目立體視覺等關(guān)鍵技術(shù)的概念與算法,展現(xiàn)了從圖像像素到三維場(chǎng)景結(jié)構(gòu)的轉(zhuǎn)換過程。本書可作為人工智能、智能科學(xué)與技術(shù)等專業(yè)計(jì)算機(jī)視覺、機(jī)器視覺等課程的教材,也可供計(jì)算機(jī)視覺領(lǐng)域的專業(yè)人士(包括開發(fā)人員、科技人員和研究學(xué)者)參考使用。
魯鵬: 北京郵電大學(xué)人工智能學(xué)院副教授;2003年7月獲得華中科技大學(xué)圖像所碩士學(xué)位,2006年7月獲得中國(guó)科學(xué)院自動(dòng)化所博士學(xué)位,2008年至2010年在北京大學(xué)人機(jī)交互與多媒體實(shí)驗(yàn)室從事博士后研究工作;在北京郵電大學(xué)任教以來,長(zhǎng)期從事本科生、研究生計(jì)算機(jī)視覺課程的教學(xué)工作,在B站上講授的計(jì)算機(jī)視覺相關(guān)課程的錄播視頻播放量超過100萬人次,同時(shí),主講的計(jì)算機(jī)視覺在線慕課已在學(xué)堂在線上線;教學(xué)經(jīng)驗(yàn)豐富、成果顯著,出版《計(jì)算機(jī)視覺從理論到實(shí)踐(微課版)》《計(jì)算機(jī)視覺基礎(chǔ)》等多部教材。
【章名目錄】第 1章 緒論 1第 2章 線性濾波器 8第3章 圖像邊緣提取與模型擬合 27第4章 局部特征提取 56第5章 圖像分割 81第6章 圖像檢索與分類 94第7章 目標(biāo)檢測(cè)與跟蹤 117第8章 攝像機(jī)幾何與標(biāo)定 144第9章 三維重建 175【詳細(xì)目錄】第 1章 緒論 11.1 計(jì)算機(jī)視覺概述 11.2 相關(guān)學(xué)科 21.3 發(fā)展歷程 31.4 應(yīng)用領(lǐng)域 5本章小結(jié) 7習(xí)題 7第 2章 線性濾波器 82.1 卷積 82.1.1 圖像表示與線性濾波 82.1.2 卷積的定義 102.1.3 卷積的性質(zhì) 112.1.4 卷積示例 112.1.5 動(dòng)手實(shí)踐:圖像銳化 132.2 圖像去噪 142.2.1 噪聲分析 142.2.2 中值濾波器 162.2.3 動(dòng)手實(shí)踐:去除圖像中的椒鹽噪聲 182.2.4 高斯濾波 202.2.5 動(dòng)手實(shí)踐:去除圖像中的高斯噪聲 24本章小結(jié) 26習(xí)題 26第3章 圖像邊緣提取與模型擬合 273.1 圖像邊緣與圖像求導(dǎo) 273.1.1 邊緣的位置特點(diǎn) 273.1.2 圖像導(dǎo)數(shù)與梯度 293.1.3 高斯一階偏導(dǎo)核 303.1.4 動(dòng)手實(shí)踐:圖像求導(dǎo) 333.2 邊緣檢測(cè) 353.2.1 Canny邊緣檢測(cè)器 353.2.2 動(dòng)手實(shí)踐:車道線檢測(cè) 373.3 模型擬合 383.3.1 最小二乘擬合 383.3.2 魯棒擬合 413.3.3 RANSAC算法 423.3.4 動(dòng)手實(shí)踐:RANSAC直線擬合 453.3.5 霍夫變換 473.4 動(dòng)手實(shí)踐:硬幣定位 53本章小結(jié) 55習(xí)題 55第4章 局部特征提取 564.1 圖像拼接問題與局部特征 564.2 Harris-Laplace檢測(cè)器 594.2.1 Harris角點(diǎn)檢測(cè)器 594.2.2 尺度不變理論 654.2.3 LoG算子 674.3 SIFT特征 724.3.1 DoG尺度空間 724.3.2 SIFT特征點(diǎn)檢測(cè) 744.3.3 SIFT特征描述子 754.4 動(dòng)手實(shí)踐:圖像拼接 76本章小結(jié) 80習(xí)題 80第5章 圖像分割 815.1 圖像分割概述 815.2 人類視覺分組與格式塔理論 825.3 基于像素聚類的圖像分割 835.3.1 基于K-means的圖像分割 835.3.2 基于均值漂移的圖像分割 855.3.3 動(dòng)手實(shí)踐:圖像分割 89本章小結(jié) 92習(xí)題 93第6章 圖像檢索與分類 946.1 圖像分類任務(wù)概述 946.1.1 圖像分類任務(wù)的難點(diǎn) 956.1.2 圖像分類任務(wù)的評(píng)價(jià)指標(biāo) 986.1.3 數(shù)據(jù)驅(qū)動(dòng)的圖像分類系統(tǒng)的基本范式 996.2 詞袋模型與圖像檢索 1006.2.1 文本詞袋模型 1006.2.2 TF-IDF加權(quán) 1016.2.3 視覺詞袋模型 1026.2.4 動(dòng)手實(shí)踐:基于詞袋模型的圖像檢索 1046.3 基于詞袋模型的圖像分類 1076.3.1 線性分類模型 1076.3.2 多類支持向量機(jī)損失 1086.3.3 模型優(yōu)化 1096.3.4 欠擬合與過擬合 1106.3.5 動(dòng)手實(shí)踐:場(chǎng)景圖像分類 111本章小結(jié) 116習(xí)題 116第7章 目標(biāo)檢測(cè)與跟蹤 1177.1 目標(biāo)檢測(cè)任務(wù)概述 1177.2 基于滑動(dòng)窗口的目標(biāo)檢測(cè)范式 1187.3 基于AdaBoost的人臉檢測(cè) 1217.3.1 人臉檢測(cè)任務(wù)概述 1217.3.2 AdaBoost算法 1217.3.3 構(gòu)建弱分類器 1227.3.4 級(jí)聯(lián)結(jié)構(gòu) 1257.3.5 動(dòng)手實(shí)踐:人臉檢測(cè) 1277.4 基于HOG特征的行人檢測(cè) 1297.4.1 行人檢測(cè)任務(wù)概述 1307.4.2 HOG特征 1307.4.3 應(yīng)用HOG特征實(shí)現(xiàn)行人檢測(cè) 1317.4.4 動(dòng)手實(shí)踐:行人檢測(cè) 1327.5 基于光流的運(yùn)動(dòng)跟蹤 1337.5.1 光流計(jì)算基本等式 1347.5.2 Lucas-Kanade光流計(jì)算 1367.5.3 動(dòng)手實(shí)踐:車輛運(yùn)動(dòng)跟蹤 138本章小結(jié) 142習(xí)題 142第8章 攝像機(jī)幾何與標(biāo)定 1448.1 針孔模型與透鏡 1448.1.1 針孔攝像機(jī) 1448.1.2 透鏡成像 1488.2 攝像機(jī)幾何 1518.2.1 齊次坐標(biāo) 1518.2.2 坐標(biāo)系變換和剛體變換 1538.2.3 一般攝像機(jī)的幾何模型 1578.2.4 透視投影矩陣的性質(zhì) 1618.3 攝像機(jī)標(biāo)定 1618.3.1 投影矩陣估計(jì) 1618.3.2 退化情況 1638.4 徑向畸變的攝像機(jī)標(biāo)定 1648.4.1 徑向畸變模型 1648.4.2 徑向畸變標(biāo)定 1658.5 動(dòng)手實(shí)踐:攝像機(jī)標(biāo)定 167本章小結(jié) 173習(xí)題 173第9章 三維重建 1759.1 三維重建基礎(chǔ) 1759.1.1 三角化的概念 1759.1.2 三角化的線性解法 1779.1.3 三角化的非線性解法 1789.2 極幾何與基礎(chǔ)矩陣 1799.2.1 極幾何 1799.2.2 本質(zhì)矩陣與基礎(chǔ)矩陣 1809.2.3 基礎(chǔ)矩陣估計(jì) 1829.2.4 動(dòng)手實(shí)踐:基礎(chǔ)矩陣估計(jì) 1849.3 雙目立體視覺 1909.3.1 基于平行視圖的雙目立體視覺 1909.3.2 圖像校正 1949.3.3 對(duì)應(yīng)點(diǎn)搜索 1979.3.4 動(dòng)手實(shí)踐:雙目立體視覺定位 201本章小結(jié) 208習(xí)題 208參考文獻(xiàn) 210