本書以項目實戰(zhàn)為核心載體,采用任務(wù)驅(qū)動教學(xué)模式,系統(tǒng)且深入地解析Hadoop生態(tài)圈中主流的大數(shù)據(jù)開發(fā)技術(shù)。全書精心編排7個項目,從Hadoop的基礎(chǔ)理論入門,逐步深入到Hadoop集群環(huán)境配置、Hadoop分布式文件系統(tǒng)、MapReduce分布式計算框架,再到MapReduce離線數(shù)據(jù)處理、基于Hive的離線數(shù)據(jù)分析,
本書是面向大數(shù)據(jù)人才培養(yǎng)的高等學(xué)校數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)系列教材中的一本,通過把數(shù)據(jù)思維融入全書各章,并通過Python實現(xiàn)相關(guān)案例,使抽象的數(shù)據(jù)思維具體化,從而加深讀者對數(shù)據(jù)的感性認(rèn)識,提高讀者對數(shù)據(jù)思維的理解能力。本書首先介紹了大數(shù)據(jù)相關(guān)的概念,然后根據(jù)數(shù)據(jù)處理流程的邏輯順序,對大數(shù)據(jù)平臺和大數(shù)據(jù)開發(fā)進(jìn)行了深入介
本書系統(tǒng)地介紹了數(shù)據(jù)挖掘算法、原理及基于Python的實現(xiàn)方法,將算法原理與案例相結(jié)合,幫助讀者建立數(shù)據(jù)挖掘領(lǐng)域的理論基礎(chǔ),提升基本的實踐技能。本書共15章,主要包括數(shù)據(jù)挖掘概述、Python環(huán)境的搭建、數(shù)據(jù)預(yù)處理、數(shù)據(jù)集劃分與交叉驗證評分、回歸、分類、集成學(xué)習(xí)、參數(shù)調(diào)優(yōu)、降維、特征選擇與特征聯(lián)合、流水線、聚類、關(guān)聯(lián)規(guī)
本書為大數(shù)據(jù)分析的入門級雙語教材,基于大數(shù)據(jù)分析應(yīng)知應(yīng)會的基本要求,以培養(yǎng)學(xué)生三個基本(基本概念、基本認(rèn)知、基本思維)為中心,采用國外MBA教材的體例和寫法,將案例與教材知識點(diǎn)相結(jié)合,將專業(yè)知識與實踐場景相結(jié)合。書聚焦大數(shù)據(jù)分析的基本認(rèn)知和數(shù)據(jù)思維的培養(yǎng),通過大數(shù)據(jù)分析的基礎(chǔ)知識、理論方法、技術(shù)工具和實踐應(yīng)用等,幫助讀
本書共8個項目,分別講解Hadoop大數(shù)據(jù)處理平臺、大數(shù)據(jù)存儲技術(shù)(HDFS)、大數(shù)據(jù)離線計算框架(MapReduce&YARN)、大數(shù)據(jù)數(shù)據(jù)庫(HBase)、大數(shù)據(jù)數(shù)據(jù)倉庫(Hive)、大數(shù)據(jù)數(shù)據(jù)轉(zhuǎn)換(Sqoop)、大數(shù)據(jù)日志處理(Flume)、大數(shù)據(jù)實時計算框架(Spark)。
本書以Scala和Python兩種編程語言為工具詳細(xì)介紹了Spark的功能和技術(shù),講解了Scala和Python的語言基礎(chǔ);深入探討了Spark的系統(tǒng)原理、系統(tǒng)架構(gòu)和運(yùn)行機(jī)理,并提供了詳細(xì)的安裝指南;在數(shù)據(jù)處理方面詳細(xì)介紹了Spark的RDD編程、結(jié)構(gòu)化數(shù)據(jù)處理和流數(shù)據(jù)處理;涉及Spark在機(jī)器學(xué)習(xí)和圖計算領(lǐng)域的應(yīng)用,
機(jī)電系統(tǒng)是大部分電氣機(jī)械設(shè)備的基本功能基礎(chǔ),機(jī)電系統(tǒng)的故障診斷與健康管理(PHM)對整個機(jī)械設(shè)備的安全運(yùn)行具有至關(guān)重要的意義。本書結(jié)合大數(shù)據(jù)技術(shù)在機(jī)電系統(tǒng)PHM中的應(yīng)用,全面介紹了智能機(jī)電系統(tǒng)PHM的相關(guān)理論、關(guān)鍵技術(shù)和應(yīng)用實例。全書分為三篇12章,第一篇從機(jī)電系統(tǒng)PHM重要性進(jìn)行分析,介紹了智能機(jī)電系統(tǒng)及其研究現(xiàn)狀和
本書緊密貼合千樂咖啡網(wǎng)店的實際運(yùn)營狀況,深入地剖析數(shù)據(jù)采集與處理在現(xiàn)代企業(yè)管理中的關(guān)鍵作用。本書詳細(xì)闡述數(shù)據(jù)如何為企業(yè)決策提供有力支撐,引導(dǎo)讀者理解數(shù)據(jù)驅(qū)動決策的重要性,并學(xué)會運(yùn)用數(shù)據(jù)優(yōu)化運(yùn)營策略,從而有效提高企業(yè)的市場競爭力。本書體系完備、邏輯清晰有序,從大數(shù)據(jù)的基本概念與特征出發(fā),逐步深入到數(shù)據(jù)應(yīng)用維度、常見數(shù)據(jù)指
本書系統(tǒng)、全面地介紹了大數(shù)據(jù)與Hadoop的基本概念、Hadoop安裝與配置、Hadoop核心組件應(yīng)用、Hadoop生態(tài)系統(tǒng)探索、大數(shù)據(jù)優(yōu)化和維護(hù)等知識。通過學(xué)習(xí)本書,讀者可以更好地理解Hadoop大數(shù)據(jù)平臺部署與運(yùn)維的具體實施方法與基本操作技巧。本書既可以作為培養(yǎng)大數(shù)據(jù)應(yīng)用型人才的教材,又適用于大數(shù)據(jù)初學(xué)者和對大數(shù)據(jù)
《大數(shù)據(jù)與人工智能導(dǎo)論》緊密結(jié)合人工智能時代的發(fā)展要求,針對不同學(xué)科專業(yè)人才培養(yǎng)對新一代信息技術(shù)知識的迫切需求,精選相關(guān)核心內(nèi)容編寫而成。以“數(shù)據(jù)”和“服務(wù)”為主線,以“數(shù)據(jù)驅(qū)動”和“知識驅(qū)動”為核心,以大數(shù)據(jù)與人工智能技術(shù)和方法及其應(yīng)用為內(nèi)容主體,體現(xiàn)大數(shù)據(jù)與人工智能所要求的數(shù)據(jù)(算料)、算法、算力、知識等要素的融合