書名:數據、謊言與真相:Google資料分析師用大數據揭露人們的真面目
原文書名:Everybody Lies: Big Data, New Data, and What the Internet Can Te
產品代碼:
9789864773558系列名稱:
新商周叢書系列編號:
BW0653定價:
420元作者:
賽斯?史蒂芬斯—大衛德維茲Seth Stephens-Davidowitz譯者:
陳琇玲Joyce Chen頁數:
368頁開數:
14.8x21裝訂:
平裝上市日:
20171207出版日:
20171207出版社:
商周(城邦)CIP:
541.415市場分類:
電腦資訊產品分類:
書籍免稅聯合分類:
電腦資訊類- ※在庫量小
商品簡介
▍誠品書店當月選書
▍亞馬遜非文學類當月選書
▍亞馬遜 2017 年年度最佳商管書
▍《財星》雜誌當月最佳商業書籍
▍《紐約時報》暢銷書
▍《經濟學人》《紐約郵報》《圖書館期刊》等多家媒體推薦
★大數據下的真實人性!
★結合《精準預測》的大量資訊分析、《異數》的敘事風格,以及《蘋果橘子經濟學》的機智風趣。
★Google前資料分析師描寫大數據最令人信服、深具挑釁,甚至令人捧腹大笑的一本書!
人們謊報在回家途中喝了多少酒,
謊稱自己多常上健身房和新鞋子買多少錢,
就連沒看過的書也說自己有看過。
沒生病卻打電話請病假,說再聯絡卻不再聯絡。
人們說事情跟你無關,但其實就跟你有關。
明明不愛你,卻騙你說愛你。
心情不好時卻說自己很開心,
明明喜歡男人,卻說自己喜歡女人。
人們對朋友說謊、對老闆說謊、對子女說謊、對父母說謊、
對醫生說謊、對老公說謊、對老婆說謊,也對自己說謊。
作者證明大數據提供一種前所未有的方式,
讓我們窺探人們的內心世界,
因為人們透過鍵盤才會在無意中私密地坦承千奇百怪的事情。
歐巴馬當選表示美國的種族歧視緩解了?錯!
黑人球員進入職業運動殿堂是貧困孩子奮發向上的勵志故事?大部分不是!
挑選賽馬最重要的參考依據是血統?不!
父母對待兒子和女兒的態度不一樣嗎?不一樣!
佛洛伊德說夢境中的事物都有性意涵,這是對的嗎?很可能不對!
回答問卷、民意調查、接受採訪、臉書貼文──我們都有可能說謊;
但是你的搜尋行為可不會說謊!
大數據,呈現我們每個人、每秒鐘無意識的反射!
無論是嚴肅或日常的議題,如今我們已有途徑能解答不久之前因種種原因(例如缺乏數據,或單純不敢提問)還未能解答的問題。
四年前,作者還是哈佛經濟系博士班學生,正努力找尋論文題目。有天早上,他發現 Google 基本上已為所有研究者備好所需的資料,也就是說,Google 是全球人類興趣資料庫的集中地,這些資料簡直就是任何對人類行為感興趣的人夢寐以求的:從我們每個人每天的網路搜尋中找到行為模式。然而,這些資料早已存在好些時日,卻從未有任何報章雜誌對其有過深刻的報導與研究。
作者深入研究 Google、推特(Twitter)、臉書(Facebook)、警察局紀錄、電影票收據、維基百科、色情網站、棒球球員個人成績表,和你想像不到的數位與傳統資料來源之後,發現這些資料來源有個共通的特點:他們提供的是大數據,亦即我們每個人每秒鐘無意識的反射,而非根據民意調查而來的一小部分民眾的意見樣本。
網路上的新數據,也就是數十億人在 Google、社群媒體、約會網站,甚至色情網站留下的數位足跡,最後會揭穿事實真相。這些不僅是新類型的數據,更有些是「誠實」的數據,在匿名機制下,彷彿四下無人時,人們才會吐露自己最真實的想法,以及真正想問的尷尬問題。這類數據就像數位版的「誠實豆沙包」,讓人們表達出自己的無性婚姻、個人精神健康問題、不安全感、受虐,以及對黑人或穆斯林的憎惡。透過分析這座數字金礦,我們現在可以了解人們真正在想什麼,真正想要什麼,以及真正做了什麼。
作者在本書中展示,要從數據中獲得寶貴資訊,最關鍵的一點是:你必須問對問題。而大數據有四大關鍵力量可以協助:
⒈大數據能讓你將數據切割分解,讓你見微知著及獲得具體的見解。
⒉新的資料來源通常包括新類型的變數,比現存變數更能幫助我們了解複雜關係,並充分利用。
⒊新的數位資訊能提供我們生活的真實樣貌,而非我們希望自己呈現給外人的形象。
⒋大數據易於與實驗結合,使我們能測試因果關係,而非僅是相關性。
進入網路新時代的這幾十年以來,我們在健康、道德、勞動市場、商業、恐怖主義、性別,以及種族等議題上有長足的認識。我們的數位足跡已把整個世界變成一個實驗室,本書將呈現出這場數位革命如何為我們每個人打開找尋隱藏真理的大門,一窺人們的內心世界,提出大數據時代真正的洞見。
本書以極具啟發性的觀點解讀大數據,並以各式各樣有趣的案例忠實呈現網路世界與當代社會的現況,讓我們得以重新認識自己與這個世界。
專業人士推薦
▍苗博雅(《阿苗帶風向》主持人)、馮勃翰(台大經濟系副教授)專文推薦
▍張鐵志(文化與社會趨勢觀察家)誠實推薦
專業人士推薦語
▍哈佛大學榮譽退休校長暨諾頓講座教授勞倫斯•桑默斯(Lawrence Summers):
「《蘋果橘子經濟學》(Freakonomics)和《魔球》(Moneyball)都要靠邊站了。這本精彩傑作是說明大數據結合聰明才智如何撼動世界的最佳示範。閱讀這本好書,會讓你以嶄新的方式看待生活。」
▍《人性中的良善天使》作者史蒂芬•平克(Steven Pinker):
「研究思維的一種嶄新方式,史蒂芬斯—大衛德維茲的發現一次又一次地顛覆我對自己國家和同胞先入為主的看法……這本書真是太令人著迷了。」
▍《蘋果橘子經濟學》合著者史蒂芬•李維特(Steven Levitt):
「針對大數據揭露人們日常生活真相做出絕頂聰明又機鋒處處的探索。史蒂芬斯—大衛德維茲是我見過最會善用數據說故事的高手。」
▍《我們是誰?大數據下的人類行為觀察》作者克里斯汀•魯德(Christian Rudder):
「對於我們生活的數據進行振奮人心又引人入勝的審視……大數據會徹底推翻你對人們的既定印象,真相會讓你畏縮、暗自竊笑並搖頭嘆息。」
▍《注意力商人》(The Attention Merchants)作者吳修銘(Tim Wu):
「《數據、謊言與真相》仰賴大數據迅速拆穿我們自以為文明的假象。一本讓人既著迷又震驚,時而駭人聽聞的傑作。最棒的是,讓真相一覽無遺。」
▍史丹佛大學經濟學教授拉吉•切提(Raj Chetty):
「《蘋果橘子經濟學》的增強版,這本書顯示大數據如何能針對重要有趣的問題,提供我們驚人的新答案。史蒂芬斯—大衛德維茲以機智俐落的方式提供數據分析,為構成社會科學的大數據提供精闢出色的介紹。 」
▍拉扎德投資銀行(Lazard)董事總經理暨前國會預算辦公室主任彼得•奧薩格(Peter Orszag):
「傑作!!!作者妙筆生花敘述透過大數據進行的一場寓教於樂之旅。這場旅程剛好為人類行為本身提出一個重要的新觀點。如果你想了解我們居住的世界正在發生什麼事,甚至是了解你的友人究竟怎麼回事,你就該從頭到尾看完這本書。」
目錄
推薦序 標題待定╱苗博雅
推薦序 標題待定╱馮勃翰
推薦序 大數據成了窺探你內心的新窗口╱史蒂芬•平克
前 言 川普勝選讓你跌破眼鏡?那是你沒看懂數據
歐巴馬勝選代表種族歧視已經好轉?──看看「黑鬼」的搜尋次數好嗎?
第一篇 管他大數據還是小數據
第一章 別讓直覺扯你後腿──是什麼造就了 NBA 球星?
第二篇 大數據的驚人力量
第二章 佛洛伊德說的正確嗎?──拼錯字背後隱藏的欲望
第三章 怎樣的數據算是大數據?──每個年代都可以算出「平均長相」
第四章 躲在線上的真相──你永遠問不出來的同志比例、仇恨言論、性隱私和顧客的腦袋
第五章 我們周遭發生了什麼事?──逃稅最嚴重的城市
第六章 整個世界,都是我的實驗室──怎樣的頭條標題吸引人?
第三篇 小心面對大數據!
第七章 大數據,大垃圾?
第八章 愈多數據,愈多問題?
結 語 大數據告訴我,很少人看到最後一頁
內文試閱
別讓直覺扯你後腿——是什麼造就了NBA球星?
小時候,我只有一個夢想:我希望長大後成為經濟學家和數據科學家。沒有啦,我開玩笑的。小時候我很想成為職籃球員,效法我的英雄——紐約尼克隊明星中鋒派崔克.尤英(Patrick Ewing)。
有時我懷疑每一位數據科學家的內心都像小孩一般,設法弄清楚為什麼自己童年的夢想沒有成真。難怪最近我會調查要在美國職籃(後稱NBA)闖出名號,需要具備什麼條件。調查結果令人驚訝。事實上,調查結果再次證明,有效的數據科學可能如何改變你對世界的看法,以及這些數字可能多麼違反直覺。
我特別關注的問題是:在貧窮家庭長大,還是在中產階級家庭長大,讓你更有可能在NBA成名?
大多數人會猜前者。一般人都認為,在貧困環境下長大,也許由十幾歲未婚媽媽辛苦扶養的環境,有助於培養在這種競爭激烈運動比賽中達到頂尖水準所需的驅動力。
費城高中籃球教練威廉.艾勒比(William Ellerbee)在接受《運動畫刊》(Sports Illustrated)採訪時表示:「郊區小孩打球往往只是為了好玩,但都市貧民區的小孩卻把籃球當成生死攸關的大事。」唉,我是在紐澤西州郊區由雙親扶養長大,而我這個世代最優秀的球員雷霸龍.詹姆斯(LeBron James),是在俄亥俄州阿克倫由一名十六歲貧窮的單親媽媽扶養長大。
事實上,我進行的一項網路調查顯示,大多數美國人的看法跟艾勒比教練和我一樣:NBA球員大多在貧困環境下長大。
這種普遍看法正確嗎?
我們來看看數據怎麼說。目前並沒有關於NBA球員社經背景的綜合數據來源,但是藉由數據檢測,利用來自許多來源的數據,例如basketball-reference.com、ancestry.com等網站和美國人口普查及其他數據,我們可以弄清楚哪些家庭背景最有利於NBA球員的養成。你會發現這項研究使用各種數據來源,其中有些數據來源較大、有些數據較小,有些是網路數據、有些是離線數據。跟一些新的數據來源同樣令人振奮的是,只要傳統來源的數據有幫助,優秀數據科學家不會將其摒除在外。取得問題正確答案的最佳方式是,結合所有可用的數據。
第一個相關數據是每個球員的出生地。針對美國的每個郡,我記錄在一九八○年代出生的黑人人數和白人人數。然後,我記錄他們當中有多少人成為NBA球員。我把這個數據跟各郡家庭平均所得進行比較。我還控制一個郡的種族人口統計數據,因為黑人成為NBA球員的可能性大約是白人的四十倍,光是這個主題就足以寫一本書好好研究。
數據告訴我們,出生在富裕郡的男孩,更有機會成為NBA球員。舉例來說,跟在最貧窮郡出生的黑人小孩相比,在美國最富裕郡出生的黑人小孩成為NBA球員的可能性是前者的兩倍之多。對白人小孩來說,最富裕郡出生的白人小孩成為NBA球員的可能性,則比最貧窮郡白人小孩的可能性高出六○%。
這表示事實跟普遍的想法正好相反,出身貧困的NBA球員並沒有我們想的那麼多。然而這個數據並不完美,因為美國許多富裕郡,如紐約郡(曼哈頓),也包括哈林區等貧困地區,所以,童年貧困還是有可能激勵小孩成為NBA球員。我們還需要更多線索和更多數據來佐證。
所以我調查NBA球員的家庭背景。這項資訊是在新聞報導和社群網路中找到的。這種方法相當耗時,所以我把這項分析限制在一九八○年代出生、得分最多的一百位非裔美籍NBA球員上。跟美國一般黑人相比,NBA超級明星球員由青少年媽媽或未婚媽媽所生的可能性少了三○%。換句話說,NBA最優秀黑人球員的家庭背景也顯示,寬裕的家庭背景是實現成功的一大優勢。
然而,不管是郡出生數據和有限球員樣本的家庭背景,都沒有提供所有NBA球員童年的完美資訊。所以我還不完全相信中產階級的雙親家庭會比貧困單親家庭,養育出更多NBA球星。針對這個問題我們能蒐集到愈多數據愈好。
然後我想起另一個數據點可以提供球員背景的線索。羅蘭.弗萊爾(Roland Fryer)和史蒂芬.李維特(Steven Levitt)這兩名經濟學家在一篇論文中提到,黑人的名字是個人社經背景的一項指標。弗萊爾和李維特研究一九八○年代加州的出生證明發現,在非裔美國人中,貧窮未受過教育的單身媽媽往往會給自己小孩取很特別的名字,跟中產階級受過教育的已婚雙親會為小孩取的名字不同。
來自富裕背景的小孩更有可能取菜市場名,譬如:凱文、克里斯和約翰。貧困家庭出生的小孩,名字可能較為獨特,譬如:Knowshon、Uneek和Breionshay。出生貧困的黑人小孩,他們名字和同年出生的其他小孩大為不同的機率將近有兩倍之多。
那麼,NBA黑人球員的名字又是什麼狀況呢?他們的名字聽起來更像中產階級出身,還是窮困家庭出身?檢視同一時期加州出生的NBA球員,他們取獨特名字的可能性是一般黑人男性的一半,這是統計數字顯示的一項顯著差異。
你認識的人當中,是否有人認為NBA是出身貧民區者的聯盟?那你可要告訴此人,只要仔細聽聽下一場比賽的轉播,注意羅素有多少次運球超越德懷特,然後試圖將球從賈許伸出的手臂中滑入凱文正等著接球的手裡。如果NBA真的是一個充滿貧窮黑人的聯盟,那麼賽事轉播聽起來會很不一樣,會有更多球員的名字像雷霸龍。
現在,我們蒐集了三種不同證據,包括出生郡、得分最高球員母親的婚姻狀況以及球員的名字。沒有一項數據來源是完美的,但三者都支持同樣的說法。更好的社經地位表示更有可能成為NBA球員。換句話說,普遍的看法是錯誤的。
一九八○年代出生的所有非裔美國人中,約有六○%者的爸媽是未婚的。但是據我估計,在那個年代出生、後來成為NBA球員的非裔美國人中,絕大多數來自雙親家庭。換句話說,NBA不是主要由雷霸龍這類背景的男性組成。有更多的男性像克里斯.波希(Chris Bosh)這樣,在德州由雙親扶養長大,培養出喜歡電子玩具的興趣。或像克里斯.保羅(Chris Paul)是北卡羅來納州路易斯維爾中產階級雙親家庭的第二個兒子,他的家人跟他一起在二○一一年上了一集益智節目《家庭大對抗》(Family Feud)。
(本文摘錄自第一章〈別讓直覺扯你後腿——是什麼造就了NBA球星?〉)
▍誠品書店當月選書
▍亞馬遜非文學類當月選書
▍亞馬遜 2017 年年度最佳商管書
▍《財星》雜誌當月最佳商業書籍
▍《紐約時報》暢銷書
▍《經濟學人》《紐約郵報》《圖書館期刊》等多家媒體推薦
★大數據下的真實人性!
★結合《精準預測》的大量資訊分析、《異數》的敘事風格,以及《蘋果橘子經濟學》的機智風趣。
★Google前資料分析師描寫大數據最令人信服、深具挑釁,甚至令人捧腹大笑的一本書!
人們謊報在回家途中喝了多少酒,
謊稱自己多常上健身房和新鞋子買多少錢,
就連沒看過的書也說自己有看過。
沒生病卻打電話請病假,說再聯絡卻不再聯絡。
人們說事情跟你無關,但其實就跟你有關。
明明不愛你,卻騙你說愛你。
心情不好時卻說自己很開心,
明明喜歡男人,卻說自己喜歡女人。
人們對朋友說謊、對老闆說謊、對子女說謊、對父母說謊、
對醫生說謊、對老公說謊、對老婆說謊,也對自己說謊。
作者證明大數據提供一種前所未有的方式,
讓我們窺探人們的內心世界,
因為人們透過鍵盤才會在無意中私密地坦承千奇百怪的事情。
歐巴馬當選表示美國的種族歧視緩解了?錯!
黑人球員進入職業運動殿堂是貧困孩子奮發向上的勵志故事?大部分不是!
挑選賽馬最重要的參考依據是血統?不!
父母對待兒子和女兒的態度不一樣嗎?不一樣!
佛洛伊德說夢境中的事物都有性意涵,這是對的嗎?很可能不對!
回答問卷、民意調查、接受採訪、臉書貼文──我們都有可能說謊;
但是你的搜尋行為可不會說謊!
大數據,呈現我們每個人、每秒鐘無意識的反射!
無論是嚴肅或日常的議題,如今我們已有途徑能解答不久之前因種種原因(例如缺乏數據,或單純不敢提問)還未能解答的問題。
四年前,作者還是哈佛經濟系博士班學生,正努力找尋論文題目。有天早上,他發現 Google 基本上已為所有研究者備好所需的資料,也就是說,Google 是全球人類興趣資料庫的集中地,這些資料簡直就是任何對人類行為感興趣的人夢寐以求的:從我們每個人每天的網路搜尋中找到行為模式。然而,這些資料早已存在好些時日,卻從未有任何報章雜誌對其有過深刻的報導與研究。
作者深入研究 Google、推特(Twitter)、臉書(Facebook)、警察局紀錄、電影票收據、維基百科、色情網站、棒球球員個人成績表,和你想像不到的數位與傳統資料來源之後,發現這些資料來源有個共通的特點:他們提供的是大數據,亦即我們每個人每秒鐘無意識的反射,而非根據民意調查而來的一小部分民眾的意見樣本。
網路上的新數據,也就是數十億人在 Google、社群媒體、約會網站,甚至色情網站留下的數位足跡,最後會揭穿事實真相。這些不僅是新類型的數據,更有些是「誠實」的數據,在匿名機制下,彷彿四下無人時,人們才會吐露自己最真實的想法,以及真正想問的尷尬問題。這類數據就像數位版的「誠實豆沙包」,讓人們表達出自己的無性婚姻、個人精神健康問題、不安全感、受虐,以及對黑人或穆斯林的憎惡。透過分析這座數字金礦,我們現在可以了解人們真正在想什麼,真正想要什麼,以及真正做了什麼。
作者在本書中展示,要從數據中獲得寶貴資訊,最關鍵的一點是:你必須問對問題。而大數據有四大關鍵力量可以協助:
⒈大數據能讓你將數據切割分解,讓你見微知著及獲得具體的見解。
⒉新的資料來源通常包括新類型的變數,比現存變數更能幫助我們了解複雜關係,並充分利用。
⒊新的數位資訊能提供我們生活的真實樣貌,而非我們希望自己呈現給外人的形象。
⒋大數據易於與實驗結合,使我們能測試因果關係,而非僅是相關性。
進入網路新時代的這幾十年以來,我們在健康、道德、勞動市場、商業、恐怖主義、性別,以及種族等議題上有長足的認識。我們的數位足跡已把整個世界變成一個實驗室,本書將呈現出這場數位革命如何為我們每個人打開找尋隱藏真理的大門,一窺人們的內心世界,提出大數據時代真正的洞見。
本書以極具啟發性的觀點解讀大數據,並以各式各樣有趣的案例忠實呈現網路世界與當代社會的現況,讓我們得以重新認識自己與這個世界。
專業人士推薦
▍苗博雅(《阿苗帶風向》主持人)、馮勃翰(台大經濟系副教授)專文推薦
▍張鐵志(文化與社會趨勢觀察家)誠實推薦
專業人士推薦語
▍哈佛大學榮譽退休校長暨諾頓講座教授勞倫斯•桑默斯(Lawrence Summers):
「《蘋果橘子經濟學》(Freakonomics)和《魔球》(Moneyball)都要靠邊站了。這本精彩傑作是說明大數據結合聰明才智如何撼動世界的最佳示範。閱讀這本好書,會讓你以嶄新的方式看待生活。」
▍《人性中的良善天使》作者史蒂芬•平克(Steven Pinker):
「研究思維的一種嶄新方式,史蒂芬斯—大衛德維茲的發現一次又一次地顛覆我對自己國家和同胞先入為主的看法……這本書真是太令人著迷了。」
▍《蘋果橘子經濟學》合著者史蒂芬•李維特(Steven Levitt):
「針對大數據揭露人們日常生活真相做出絕頂聰明又機鋒處處的探索。史蒂芬斯—大衛德維茲是我見過最會善用數據說故事的高手。」
▍《我們是誰?大數據下的人類行為觀察》作者克里斯汀•魯德(Christian Rudder):
「對於我們生活的數據進行振奮人心又引人入勝的審視……大數據會徹底推翻你對人們的既定印象,真相會讓你畏縮、暗自竊笑並搖頭嘆息。」
▍《注意力商人》(The Attention Merchants)作者吳修銘(Tim Wu):
「《數據、謊言與真相》仰賴大數據迅速拆穿我們自以為文明的假象。一本讓人既著迷又震驚,時而駭人聽聞的傑作。最棒的是,讓真相一覽無遺。」
▍史丹佛大學經濟學教授拉吉•切提(Raj Chetty):
「《蘋果橘子經濟學》的增強版,這本書顯示大數據如何能針對重要有趣的問題,提供我們驚人的新答案。史蒂芬斯—大衛德維茲以機智俐落的方式提供數據分析,為構成社會科學的大數據提供精闢出色的介紹。 」
▍拉扎德投資銀行(Lazard)董事總經理暨前國會預算辦公室主任彼得•奧薩格(Peter Orszag):
「傑作!!!作者妙筆生花敘述透過大數據進行的一場寓教於樂之旅。這場旅程剛好為人類行為本身提出一個重要的新觀點。如果你想了解我們居住的世界正在發生什麼事,甚至是了解你的友人究竟怎麼回事,你就該從頭到尾看完這本書。」
目錄
推薦序 標題待定╱苗博雅
推薦序 標題待定╱馮勃翰
推薦序 大數據成了窺探你內心的新窗口╱史蒂芬•平克
前 言 川普勝選讓你跌破眼鏡?那是你沒看懂數據
歐巴馬勝選代表種族歧視已經好轉?──看看「黑鬼」的搜尋次數好嗎?
第一篇 管他大數據還是小數據
第一章 別讓直覺扯你後腿──是什麼造就了 NBA 球星?
第二篇 大數據的驚人力量
第二章 佛洛伊德說的正確嗎?──拼錯字背後隱藏的欲望
第三章 怎樣的數據算是大數據?──每個年代都可以算出「平均長相」
第四章 躲在線上的真相──你永遠問不出來的同志比例、仇恨言論、性隱私和顧客的腦袋
第五章 我們周遭發生了什麼事?──逃稅最嚴重的城市
第六章 整個世界,都是我的實驗室──怎樣的頭條標題吸引人?
第三篇 小心面對大數據!
第七章 大數據,大垃圾?
第八章 愈多數據,愈多問題?
結 語 大數據告訴我,很少人看到最後一頁
內文試閱
別讓直覺扯你後腿——是什麼造就了NBA球星?
小時候,我只有一個夢想:我希望長大後成為經濟學家和數據科學家。沒有啦,我開玩笑的。小時候我很想成為職籃球員,效法我的英雄——紐約尼克隊明星中鋒派崔克.尤英(Patrick Ewing)。
有時我懷疑每一位數據科學家的內心都像小孩一般,設法弄清楚為什麼自己童年的夢想沒有成真。難怪最近我會調查要在美國職籃(後稱NBA)闖出名號,需要具備什麼條件。調查結果令人驚訝。事實上,調查結果再次證明,有效的數據科學可能如何改變你對世界的看法,以及這些數字可能多麼違反直覺。
我特別關注的問題是:在貧窮家庭長大,還是在中產階級家庭長大,讓你更有可能在NBA成名?
大多數人會猜前者。一般人都認為,在貧困環境下長大,也許由十幾歲未婚媽媽辛苦扶養的環境,有助於培養在這種競爭激烈運動比賽中達到頂尖水準所需的驅動力。
費城高中籃球教練威廉.艾勒比(William Ellerbee)在接受《運動畫刊》(Sports Illustrated)採訪時表示:「郊區小孩打球往往只是為了好玩,但都市貧民區的小孩卻把籃球當成生死攸關的大事。」唉,我是在紐澤西州郊區由雙親扶養長大,而我這個世代最優秀的球員雷霸龍.詹姆斯(LeBron James),是在俄亥俄州阿克倫由一名十六歲貧窮的單親媽媽扶養長大。
事實上,我進行的一項網路調查顯示,大多數美國人的看法跟艾勒比教練和我一樣:NBA球員大多在貧困環境下長大。
這種普遍看法正確嗎?
我們來看看數據怎麼說。目前並沒有關於NBA球員社經背景的綜合數據來源,但是藉由數據檢測,利用來自許多來源的數據,例如basketball-reference.com、ancestry.com等網站和美國人口普查及其他數據,我們可以弄清楚哪些家庭背景最有利於NBA球員的養成。你會發現這項研究使用各種數據來源,其中有些數據來源較大、有些數據較小,有些是網路數據、有些是離線數據。跟一些新的數據來源同樣令人振奮的是,只要傳統來源的數據有幫助,優秀數據科學家不會將其摒除在外。取得問題正確答案的最佳方式是,結合所有可用的數據。
第一個相關數據是每個球員的出生地。針對美國的每個郡,我記錄在一九八○年代出生的黑人人數和白人人數。然後,我記錄他們當中有多少人成為NBA球員。我把這個數據跟各郡家庭平均所得進行比較。我還控制一個郡的種族人口統計數據,因為黑人成為NBA球員的可能性大約是白人的四十倍,光是這個主題就足以寫一本書好好研究。
數據告訴我們,出生在富裕郡的男孩,更有機會成為NBA球員。舉例來說,跟在最貧窮郡出生的黑人小孩相比,在美國最富裕郡出生的黑人小孩成為NBA球員的可能性是前者的兩倍之多。對白人小孩來說,最富裕郡出生的白人小孩成為NBA球員的可能性,則比最貧窮郡白人小孩的可能性高出六○%。
這表示事實跟普遍的想法正好相反,出身貧困的NBA球員並沒有我們想的那麼多。然而這個數據並不完美,因為美國許多富裕郡,如紐約郡(曼哈頓),也包括哈林區等貧困地區,所以,童年貧困還是有可能激勵小孩成為NBA球員。我們還需要更多線索和更多數據來佐證。
所以我調查NBA球員的家庭背景。這項資訊是在新聞報導和社群網路中找到的。這種方法相當耗時,所以我把這項分析限制在一九八○年代出生、得分最多的一百位非裔美籍NBA球員上。跟美國一般黑人相比,NBA超級明星球員由青少年媽媽或未婚媽媽所生的可能性少了三○%。換句話說,NBA最優秀黑人球員的家庭背景也顯示,寬裕的家庭背景是實現成功的一大優勢。
然而,不管是郡出生數據和有限球員樣本的家庭背景,都沒有提供所有NBA球員童年的完美資訊。所以我還不完全相信中產階級的雙親家庭會比貧困單親家庭,養育出更多NBA球星。針對這個問題我們能蒐集到愈多數據愈好。
然後我想起另一個數據點可以提供球員背景的線索。羅蘭.弗萊爾(Roland Fryer)和史蒂芬.李維特(Steven Levitt)這兩名經濟學家在一篇論文中提到,黑人的名字是個人社經背景的一項指標。弗萊爾和李維特研究一九八○年代加州的出生證明發現,在非裔美國人中,貧窮未受過教育的單身媽媽往往會給自己小孩取很特別的名字,跟中產階級受過教育的已婚雙親會為小孩取的名字不同。
來自富裕背景的小孩更有可能取菜市場名,譬如:凱文、克里斯和約翰。貧困家庭出生的小孩,名字可能較為獨特,譬如:Knowshon、Uneek和Breionshay。出生貧困的黑人小孩,他們名字和同年出生的其他小孩大為不同的機率將近有兩倍之多。
那麼,NBA黑人球員的名字又是什麼狀況呢?他們的名字聽起來更像中產階級出身,還是窮困家庭出身?檢視同一時期加州出生的NBA球員,他們取獨特名字的可能性是一般黑人男性的一半,這是統計數字顯示的一項顯著差異。
你認識的人當中,是否有人認為NBA是出身貧民區者的聯盟?那你可要告訴此人,只要仔細聽聽下一場比賽的轉播,注意羅素有多少次運球超越德懷特,然後試圖將球從賈許伸出的手臂中滑入凱文正等著接球的手裡。如果NBA真的是一個充滿貧窮黑人的聯盟,那麼賽事轉播聽起來會很不一樣,會有更多球員的名字像雷霸龍。
現在,我們蒐集了三種不同證據,包括出生郡、得分最高球員母親的婚姻狀況以及球員的名字。沒有一項數據來源是完美的,但三者都支持同樣的說法。更好的社經地位表示更有可能成為NBA球員。換句話說,普遍的看法是錯誤的。
一九八○年代出生的所有非裔美國人中,約有六○%者的爸媽是未婚的。但是據我估計,在那個年代出生、後來成為NBA球員的非裔美國人中,絕大多數來自雙親家庭。換句話說,NBA不是主要由雷霸龍這類背景的男性組成。有更多的男性像克里斯.波希(Chris Bosh)這樣,在德州由雙親扶養長大,培養出喜歡電子玩具的興趣。或像克里斯.保羅(Chris Paul)是北卡羅來納州路易斯維爾中產階級雙親家庭的第二個兒子,他的家人跟他一起在二○一一年上了一集益智節目《家庭大對抗》(Family Feud)。
(本文摘錄自第一章〈別讓直覺扯你後腿——是什麼造就了NBA球星?〉)
作者簡介
姓名:賽斯•史蒂芬斯—大衛德維茲Seth Stephens-Davidowitz
《紐約時報》撰稿人暨華頓商學院客座講師,曾為Google數據科學家。史丹佛大學哲學系畢,哈佛大學優等生榮譽學會(Phi Beta Kappa)成員暨經濟學博士,目前定居紐約市。史蒂芬斯—大衛德維茲的研究使用新的大數據來源,揭露人們潛藏的行為和態度,並已刊登在《公共經濟學期刊》(Journal of Public Economics)等聲望卓著的出版物。
譯者
姓名:陳琇玲Joyce Chen
美國密蘇里大學工管碩士,曾任大學講師、軟體中文化及影片翻譯譯者、Alcatel Telecom主任稽核師。已出版譯作百餘冊並多次獲得金書獎殊榮,現以翻譯為樂並習畫自娛。重要譯作包括:《搜尋未來》《2017-2019投資大進擊》《物聯網革命》《引爆會員經濟》《精準預測時代》《人工智慧的未來》等。
行銷計劃