本書主要針對網(wǎng)絡計量分析中普遍存在的問題,例如開放獲取網(wǎng)絡資源的技術(shù)門檻較高、網(wǎng)絡內(nèi)容提取和分析技術(shù)繁多且復雜、定量分析的結(jié)果解讀困難等,提出具體解決方案和技術(shù)實踐路徑,尤其是利用R語言編程的方法解決上述問題,包括網(wǎng)頁數(shù)據(jù)自動抓取、網(wǎng)絡鏈接分析和網(wǎng)絡文本內(nèi)容分析等,以便相關(guān)專業(yè)的師生掌握網(wǎng)絡計量分析的方法和技能,并依據(jù)統(tǒng)計分析的原理和方法解釋定量分析的結(jié)果。
現(xiàn)在網(wǎng)絡計量學已經(jīng)被廣泛理解為研究基于網(wǎng)絡內(nèi)容和網(wǎng)絡現(xiàn)象,以實現(xiàn)社會科學研究目標的定量研究方法。該方法通常研究與傳統(tǒng)文獻計量學相關(guān)的問題,研究范圍包括網(wǎng)站鏈接、網(wǎng)站引用和搜索引擎評估分析方法等。網(wǎng)絡計量學利用更廣泛的學術(shù)對象,如專利、網(wǎng)頁、社交媒體等。網(wǎng)絡計量學已被廣泛用于研究學科的學術(shù)交流結(jié)構(gòu)。本書內(nèi)容是在“網(wǎng)絡計量分析”的教學實踐中使用的教學內(nèi)容,這些內(nèi)容包含了部分開放的網(wǎng)絡資源,如網(wǎng)絡數(shù)據(jù)、R語言代碼以及使用手冊等。
楊孟輝:人民大學信息資源管理學院教授,主持國家自然科學基金重大項目、面上項目、中國博士后科學基金項目等多項。在國際SCI學術(shù)期刊和國內(nèi)重要學報等以第一作者發(fā)表論文40余篇;授權(quán)國家發(fā)明專利2項。國家自然科學基金項目評審專家,國家認監(jiān)委檢驗檢測機構(gòu)(教育組)資質(zhì)認定評審員(國家級)。
第1章
網(wǎng)絡計量分析
1.1 大數(shù)據(jù)理論
1.2 Web超鏈接分析
1.3 計算文本分析
1.4 網(wǎng)絡分析
第2章 如何找到合適的網(wǎng)絡數(shù)據(jù)
2.1 Google Books Ngram Viewer
2.2 Google Trends
2.3 Google Search
2.4 Google Scholar
第3章 網(wǎng)頁數(shù)據(jù)自動抓取
3.1 下載并安裝Data Miner到Google
Chrome中
3.2 開啟Data Miner
3.3 打開Data Miner
3.4 注冊并登錄Data Miner
3.5 創(chuàng)建Recipe
3.6 設置待爬取網(wǎng)頁的類型
3.7 設置待爬取網(wǎng)頁中行的信息
3.8 設置待爬取網(wǎng)頁中列的信息
3.9 設置爬取時自動翻頁
3.10 設置爬取動作
3.11 設置腳本
3.12 保存設置
3.13 開始爬取
3.14 本章小結(jié)
第4章 網(wǎng)絡鏈接分析
4.1 URL提取
4.2 URL分析
4.3 Domain分析
4.4 Site分析
4.5 頂級域名TLD分析
4.6 本章小結(jié)
第5章 網(wǎng)絡文本內(nèi)容分析
5.1 R語言文本分析框架
5.2 數(shù)據(jù)準備
5.3 數(shù)據(jù)分析
5.4 高級主題
第6章 網(wǎng)絡分析
6.1 網(wǎng)絡分析基礎
6.2 R語言中的網(wǎng)絡數(shù)據(jù)管理
6.3 基本網(wǎng)絡繪圖和布局
6.4 有效的網(wǎng)絡圖形設計
6.5 高級網(wǎng)絡圖形
6.6 網(wǎng)絡成員的重要性評估
6.7 割點和橋
6.8 子組(子群子圖子網(wǎng))
6.9 隨機網(wǎng)絡模型
6.10 統(tǒng)計網(wǎng)絡模型
結(jié)束語
參考文獻