本書以Python作為主要工具,著重講解海量數(shù)據(jù)采集與處理相關(guān)內(nèi)容。力求通過由淺入深、先理論基礎(chǔ)后實(shí)踐應(yīng)用的思路,培養(yǎng)學(xué)生應(yīng)用Python解決實(shí)際問題的能力。全書內(nèi)容分為上、下篇共9章。上篇主要介紹數(shù)據(jù)采集的基本概念、Python開發(fā)環(huán)境、數(shù)據(jù)采集常用的兩種框架Numpy和Pandas的使用;下篇對(duì)數(shù)據(jù)采集原理、爬蟲基礎(chǔ)庫(kù)的使用、頁(yè)面采集框架的使用、數(shù)據(jù)的存儲(chǔ)與使用、數(shù)據(jù)的清洗與預(yù)處理,以及綜合實(shí)例的應(yīng)用進(jìn)行介紹。本書在內(nèi)容編寫與安排上盡量做到結(jié)構(gòu)合理、邏輯嚴(yán)謹(jǐn),可供信息管理與信息系統(tǒng)、大數(shù)據(jù)、計(jì)算機(jī)、人工智能等相關(guān)專業(yè)的學(xué)生使用;亦可供經(jīng)濟(jì)管理類其他專業(yè)學(xué)生入門參考,用于交叉方向的科學(xué)研究。
江成,計(jì)算機(jī)應(yīng)用技術(shù)專業(yè)博士,教授,博導(dǎo)。北京市屬高校教師隊(duì)伍建設(shè)支持計(jì)劃優(yōu)秀青年人才,北京市優(yōu)秀青年骨干教師,首都經(jīng)濟(jì)貿(mào)易大學(xué)后備學(xué)科帶頭人。兼任中國(guó)計(jì)算機(jī)學(xué)會(huì)計(jì)算經(jīng)濟(jì)學(xué)專委會(huì)執(zhí)行委員、中國(guó)優(yōu)選法統(tǒng)籌法與經(jīng)濟(jì)數(shù)學(xué)研究會(huì)應(yīng)急管理專委會(huì)理事、京津冀協(xié)同發(fā)展促進(jìn)30人專家委員、《安全與環(huán)境學(xué)報(bào)》編委等職務(wù)。研究領(lǐng)域?yàn)榻?jīng)濟(jì)社會(huì)復(fù)雜系統(tǒng),主持國(guó)家社會(huì)科學(xué)基金項(xiàng)目、國(guó)家自然科學(xué)基金項(xiàng)目、北京市社會(huì)科學(xué)基金重點(diǎn)項(xiàng)目及企事業(yè)委托課題等10余項(xiàng)。在Applied Soft Computing和Knowledge-Based Systems以及《管理評(píng)論》《計(jì)算機(jī)科學(xué)與探索》等國(guó)內(nèi)外期刊發(fā)表論文30余篇,出版專著和教材6部。主筆的近20項(xiàng)資政報(bào)告獲省部級(jí)及以上領(lǐng)導(dǎo)肯定性批示或部門采納,多篇成果被中央三報(bào)一刊報(bào)道。