《數(shù)據(jù)決策》是為普通人打造的一本數(shù)據(jù)思維急救手冊。作者艾倫?唐尼現(xiàn)任奧林學(xué)院榮譽(yù)教授、PyMC實驗室首席數(shù)據(jù)科學(xué)家,他非常擅長用通俗的語言解析深奧的統(tǒng)計學(xué)原理。
本書以反直覺的數(shù)據(jù)為切入點,通過數(shù)十個真實有趣的案例,帶領(lǐng)讀者逐步認(rèn)清統(tǒng)計悖論。比如:吸煙孕婦生出的低體重兒更健康,這其實是混淆了相關(guān)性與因果性的典型謬誤;疫苗接種者死亡率更高也只是統(tǒng)計假象,實則是統(tǒng)計者的年齡結(jié)構(gòu)差異導(dǎo)致的。這些案例將顛覆我們的認(rèn)知,從而引發(fā)讀者對數(shù)據(jù)解讀的深入思考。
更重要的是,作者沒有在書中空談理論,而是將統(tǒng)計學(xué)方法轉(zhuǎn)化為可復(fù)用的決策工具。例如:基本比率法則能幫我們避免醫(yī)學(xué)檢測導(dǎo)致的過度恐慌或輕視;因果圖模型可區(qū)分直接影響與間接干擾,避開相關(guān)性等于因果性的陷阱;長尾分布思維則提醒決策者需要為極端事件預(yù)留出容錯空間;等等。這些工具能滲透到生活中的各種日常場景,使抽象的方法具有可實踐性。此外,書中對數(shù)據(jù)倫理的探討也提醒我們,數(shù)據(jù)不是冰冷數(shù)字,數(shù)據(jù)記錄著社會進(jìn)步的軌跡,并承載著重要的社會價值。
這本書像一把解碼數(shù)據(jù)的鑰匙,能重塑我們看待世界的方式,讓我們在數(shù)據(jù)泛濫的時代,避開統(tǒng)計陷阱,保持清醒思考,做出理性決策。
在數(shù)據(jù)泛濫的時代,這本書是你最需要的批判性思維指南讓數(shù)字回歸真相,讓決策回歸理性。
·當(dāng)數(shù)據(jù)揭開真相:一場重塑思維的決策革命
你是否曾因大多數(shù)人都這么選而隨波逐流?是否被權(quán)威數(shù)據(jù)誤導(dǎo)過判斷?《數(shù)據(jù)決策》正是一本為普通人打造的數(shù)據(jù)思維急救手冊,用20余個鮮活案例,帶你識破統(tǒng)計悖論,掌握數(shù)據(jù)時代的生存法則。
·決策工具箱:從數(shù)據(jù)到行動的科學(xué)框架
本書拒絕空談理論,而是將統(tǒng)計學(xué)轉(zhuǎn)化為可復(fù)用的決策工具。如因果圖模型、長尾分布思維,這些工具并非束之高閣的理論,而是滲透在生活場景中:如何解讀體檢報告的假陽性?怎樣評估職場決策的潛在風(fēng)險?書中用超市促銷、法庭審判等日常案例,讓抽象方法落地生根。
·數(shù)據(jù)倫理:理性背后的人文溫度
數(shù)據(jù)不僅是冰冷的數(shù)字,更承載著社會價值。書中對算法偏見的探討振聾發(fā)聵:COMPAS系統(tǒng)因訓(xùn)練數(shù)據(jù)的歷史偏差,將黑人被告誤判為高風(fēng)險的概率是白人的兩倍。這種數(shù)據(jù)正義的缺失,直指技術(shù)中立的假象。作者呼吁:當(dāng)我們用算法預(yù)測犯罪時,更應(yīng)追問數(shù)據(jù)是否裹挾了歷史偏見。
·寫給每一個人的數(shù)據(jù)宣言
無論你是職場人、學(xué)生,還是關(guān)心公共事務(wù)的公民,本書都將重塑你看待世界的方式。
對職場決策者:學(xué)會用分層分析避免平均數(shù)暴政,如評估團(tuán)隊績效時,關(guān)注個體分布而非整體均值。
對普通讀者:在醫(yī)療選擇、消費(fèi)決策中,不再盲從大數(shù)據(jù)結(jié)論,而是追問樣本是否有偏因果是否成立。
對思考者:透過數(shù)據(jù)看到社會的復(fù)雜性,如老年人更保守實為代際價值觀差異,而非年齡導(dǎo)致的思想僵化。
[美]艾倫·唐尼(Allen Downey)
擁有加州大學(xué)伯克利分校(U.C. Berkeley)的博士學(xué)位,以及麻省理工學(xué)院(MIT)的碩士和學(xué)士學(xué)位。他曾在奧林學(xué)院(Olin College)、科爾比學(xué)院(Colby College)和韋爾斯利學(xué)院(Wellesley College)任教,目前擔(dān)任奧林學(xué)院的榮譽(yù)教授,也是PyMC實驗室的首席數(shù)據(jù)科學(xué)家。
他已出版多本與編程和數(shù)據(jù)科學(xué)相關(guān)的書,包括《思考Python》(Think Python)、《思考統(tǒng)計》(Think Stats)和《思考貝葉斯》(Think Bayes)等系列作品。這些書背后的核心理念是:你如果懂得如何編程,就可以利用這一技能去學(xué)習(xí)其他領(lǐng)域的知識。
中文版序 VII
引言 用證據(jù)和理性指引我們的決策 IX
第1章 人人都不正常嗎?高斯曲線與中心極限定理 001
高斯曲線與高斯分布 004
中心極限定理 007
各種分布與偏差 010
偏差到底有多大? 013
平均人神話 014
大五人格測試 017
我們都是怪異的! 022
但有些人更正常 024
第2章 犯過罪的人一定會再犯?檢驗悖論與友誼悖論 027
檢驗悖論與過度抽樣 030
無偏數(shù)據(jù)與有偏數(shù)據(jù) 032
尖鋒厚尾 034
友誼悖論 037
尋找超級傳播者 039
比我快的和比我慢的 041
被高估的刑期 043
重復(fù)犯罪率到底有多高? 045
無處不在且隱蔽的檢驗悖論 047
第3章 如果每位女性都少生一個孩子?普雷斯頓悖論 049
原生家庭規(guī)模 053
大蕭條和嬰兒潮 055
不斷下降的生育率 056
普雷斯頓悖論 059
如果每位女性比其母親少生一個孩子 061
新的生育模式 062
第4章 頂級牛人有什么特別之處?對數(shù)正態(tài)分布與 SPC 框架 065
成年人的體重不符合高斯分布 068
新生兒出生體重符合高斯分布 071
模擬增加體重后 072
速度的對數(shù)正態(tài)分布 076
國際象棋的積分分布 080
頂尖人物的異常值 084
用 SPC 框架找工作 086
第5章 如何活到300歲?預(yù)期新比舊優(yōu)與預(yù)期舊比新優(yōu) 089
新燈泡還是舊燈泡的壽命長? 093
第39、40、41周孕婦的分娩時間 095
腫瘤病人的存活時間 097
出生時的預(yù)期壽命 102
不同區(qū)域的兒童死亡率 104
讓死亡率驟降且長壽的秘密 106
第6章 你應(yīng)該點菜單上那道最讓人沒食欲的菜?伯克森悖論與伯克森偏倚 113
數(shù)學(xué)能力和語言能力 116
精英大學(xué)與二流大學(xué)里的相關(guān)性 118
膽囊炎和糖尿病之間的相關(guān)性 121
新冠病毒感染和伯克森悖論 124
抑郁癥和伯克森悖論 126
位置不好的餐館更值得去! 127
第7章 吸煙對胎兒更有利?出生體重悖論,多胞胎悖論與肥胖悖論 129
母親吸煙與嬰兒死亡率之間的關(guān)系 134
高海拔地區(qū)的母親與矮個子母親 136
低出生體重悖論的終結(jié) 138
多胞胎悖論與早產(chǎn) 139
肥胖悖論也是不存在的 140
伯克森烤面包機(jī)與因果圖 142
第8章 黑天鵝事件的發(fā)生有規(guī)律性嗎?尾端分布與對數(shù) t 模型 147
災(zāi)害損失的尾端分布 150
地震震級的尾端分布 155
太陽耀斑通量的尾端分布 159
月球上的隕石坑 164
小行星直徑的尾端分布 166
股市崩盤的規(guī)模分布 169
黑天鵝與灰天鵝 171
在長尾的世界里醒來 173
第9章 到底要不要接種疫苗?基率謬誤與假陰性率 177
醫(yī)學(xué)檢測的準(zhǔn)確性 181
如果提高靈敏度與特異度 183
患病率和假陽性率 186
酒駕和毒駕的篩查 188
別懷疑疫苗的有效性 191
預(yù)測犯罪風(fēng)險 197
比較組 200
算法比人類更容易糾錯 203
公平很難實現(xiàn) 206
第10章 不敢獨(dú)自走夜路的人,更害怕離婚?辛普森悖論與數(shù)據(jù)開放 211
樂觀的老年人和悲觀的年輕人 214
實際收入下降,總體收入?yún)s上升? 218
企鵝 221
要不要開刀取腎結(jié)石 223
接種疫苗和老年人的死亡率 228
是的,疫苗挽救了很多人的生命 232
開放數(shù)據(jù),公開討論 235
第11 章 你相信世界上存在蜥蜴人嗎?年齡時代世代分析及奧弗頓之窗 237
種族歧視和蜥蜴人 240
年齡效應(yīng)、時代效應(yīng)和世代效應(yīng) 244
我們越來越不恐同 248
變化緣于思想的改變 251
世代效應(yīng)還是時代效應(yīng)? 252
固執(zhí)己見的群體和奧弗頓之窗 253
第12章 老年人的觀念更保守?奧弗頓之窗轉(zhuǎn)移和追逐奧弗頓之窗 257
年老的保守派,年輕的自由派? 260
保守派是什么意思? 262
奧弗頓之窗移向自由主義 265
中間并非一成不變 266
我們是否變得更加兩極分化? 269
追逐奧弗頓之窗 270
附錄 區(qū)分自由派和保守派的問題 273
結(jié)語 問題、數(shù)據(jù)和方法 275
致謝 279
譯后記 281
參考文獻(xiàn) 285