本文節(jié)選自《基因彩票》,上一章鏈接:
《基因彩票:運氣、平等與補償性公正》,作者是凱瑟琳·佩奇·哈登,行為基因?qū)W家、臨床心理學教授,曾發(fā)表100多篇關(guān)于遺傳對復雜人類行為影響的科學論文?!痘虿势保哼\氣、平等與補償性公正》提出一個有趣的概念:除卻家庭與社會環(huán)境的“卵巢彩票”之外,一個人還要經(jīng)歷遺傳因素隨機匹配機制的“基因彩票”抽獎。作者認為承認“基因彩票”的作用,才能更好地追尋一個在技術(shù)和生理上較為平等的社會。
近期我將會在網(wǎng)易號平臺將這本書的各個章節(jié)分享給大家,感興趣的網(wǎng)友可以去買一本實體書。
第三章:食譜和大學
當我兒子還是個嬰兒時,兒科醫(yī)生向我們推薦了一位神經(jīng)科醫(yī)生,因為她懷疑我兒子患有1型神經(jīng)纖維瘤?。ㄖx天謝地,只是虛驚一場)。神經(jīng)纖維瘤病是一種罕見的遺傳疾病,會在大腦、脊髓和神經(jīng)末端產(chǎn)生無數(shù)的腫瘤。 注【“Neurofibromatosis Type 1,”Genetics Home Reference,accessed November 7,2019,https://ghr.nlm.nih.gov/condition/neuro.bromatosis-type-1.】 它是由NF1基因的突變引起的,作為一種負責編碼蛋白質(zhì)的基因,NF1通??梢苑乐辜毎癯4禾倮p結(jié)在一起那樣過度生長。神經(jīng)纖維瘤病的主要癥狀之一是皮膚上出現(xiàn)咖啡牛奶斑,即加奶咖啡顏色的斑點。我兒子身上有兩個這樣的斑點。
我的新寶寶可能患有嚴重的遺傳病,這當然是很可怕的。我當時的丈夫花了一個下午的時間來檢查兒子的皮膚,翻來覆去,一遍又一遍,生怕有更多的咖啡牛奶斑被我們漏掉了。而我一整天都異常平靜,然后在入睡之后陷入逼真的噩夢。在一個噩夢中,一個沉默的、像天使一樣的生物給了我一把鑷子,并告訴我,我可以治愈我孩子的神經(jīng)纖維瘤病。但要做到這一點,我必須在天亮之前從他身體的每個細胞中一個一個地拔出NF1基因的突變。我開始了這項不可能完成的任務。我知道我不可能及時處理每一個細胞,但還是瘋狂地用神奇的鑷子戳著他小小的身體。
那是一個可怕的噩夢。它彰顯了我們在思考基因時可能想到的東西的本質(zhì):基因具有我們無法逃避的強大力量,一個扭曲的分子可能決定一個人的整個命運。如果你有NF1基因的某種突變,你將不可避免地患上神經(jīng)纖維瘤病。希臘的命運女神阿特洛波斯負責用“可惡的剪子”剪斷生命線, 注【John Milton,Lycidas,accessed November 7,2019,https://www.poetry foundation.org/poems/44733/lycidas.】 而NF1基因突變意味著,某種醫(yī)學上的命運是不可逆轉(zhuǎn)的。
2013年,《科學》雜志發(fā)表了一項涉及超過12萬人的研究結(jié)果,發(fā)現(xiàn)有三個遺傳變異與受教育程度(即一個人完成了多少年的學業(yè))有關(guān)。 注【Cornelius A.Rietveld et al.,“GWAS of 126,559 Individuals Identifies Genetic Variants Associated with Educational Attainment,”Science 340,no.6139 (June 21,2013):1467–71,https://doi.org/10.1126/science.1235488.】 按照科學慣例給這三個變異取的名字仿佛是從斯塔西(Stasi)的檔案系統(tǒng)中借來的:rs9320913、rs11584700和rs4851266。
這個結(jié)果(事實上,這項研究本身)看起來就像我被賦予一套神奇的基因編輯鑷子一樣可怕。總的來說,我們大多可以接受這樣的觀點:我們的基因決定了我們眼睛的顏色,或者我們會不會罹患像神經(jīng)纖維瘤這樣的罕見疾病。但獲得良好的受教育程度是一種成就,是人生的一種成績。而且,正如我在第一章中描述的,受教育程度與生活結(jié)果中幾乎所有其他的不平等都有關(guān)聯(lián)。但現(xiàn)在有人說,受教育程度是命中注定的,一個名為rs11584700的遺傳阿特洛波斯可以消滅你的成就,可以剝奪你的成績。這種想法難道會是真的嗎?
我將在本章(乃至全書)中論證,把rs11584700和受教育程度之間的關(guān)系,看作像NF1基因和神經(jīng)纖維瘤病之間的關(guān)系,是一個錯誤。一個人的基因并不能決定他的教育結(jié)果或經(jīng)濟命運。但與此同時,如果把基因和教育之間的關(guān)系視為微不足道或不重要,也是錯的。正如我們在上一章看到的,一個人的基因可能不會決定他的生活結(jié)果,但仍然關(guān)系到他在退休時能否比別人多擁有數(shù)十萬美元的財富。為了理解應當如何認真對待基因與教育的關(guān)聯(lián),而不誤解這些關(guān)聯(lián),我們需要更詳細地了解這類研究究竟在做什么(以及它們沒有做什么)。因此,讓我們來探討一下《科學》刊登的這項研究。研究者究竟是如何得出結(jié)論,認為rs9320913、rs11584700、rs4851266是與受教育程度相關(guān)的遺傳變異,而我們又如何解釋這一結(jié)果?
遺傳食譜,基因組烹飪書
2013年《科學》刊登的這篇論文的主要作者之一是經(jīng)濟學家菲利普·科林格(Philipp Koellinger)??屏指裆聿氖莞?,四十多歲,笑起來很爽朗,打破了人們對德國人和經(jīng)濟學家的刻板印象。他堅持認為,他參與創(chuàng)立的社會科學遺傳學協(xié)會聯(lián)盟(SSGAC)并不真正指望在他們的這篇論文中發(fā)現(xiàn)什么。毋寧說,他們是對之前的一系列心理學研究感到惱火,這些研究聲稱發(fā)現(xiàn)了與智力測試分數(shù)相關(guān)的基因,但研究樣本太少,所以從統(tǒng)計學上看,其結(jié)論不可能是正確的。
(有人會把幾年的時間投到一個項目中,收集12萬人的數(shù)據(jù)集,以明確證明別人是錯的。如果你對此感到驚訝,只能說明你不了解經(jīng)濟學家這個群體。)
科林格最喜歡吃檸檬雞,而且是整只雞,它依偎在洋蔥和土豆之上,用等量的檸檬汁和橄欖油烘烤。他第一次訪問得克薩斯州時為我做了檸檬雞,并對做出來的效果與他在荷蘭家中做的不同感到驚訝。得克薩斯H-E-B超市里的特大號酸檸檬產(chǎn)自加利福尼亞而不是西班牙。得克薩斯的土豆沒有明確標明是適合軟烘還是硬烘,所以他買的土豆解體成了美味的、適合嬰兒的土豆泥。我那臺陳舊的小烤箱,充其量只能粗略地設(shè)置溫度。而且在得克薩斯州,什么都是大號的,家禽也是如此。我們這頓飯是在一個溫暖的三月夜晚的戶外吃的,很美味,但口味肯定與他在阿姆斯特丹的廚房里按照自己的食譜做的檸檬雞不同。
所有關(guān)于基因的比喻都是錯誤的,但食譜的比喻是有用的:基因就像一個蛋白質(zhì)的食譜。有些基因是編碼基因,意思是它們直接給出了制造蛋白質(zhì)的指令。其他的DNA片段的作用更像是在食譜正文周圍用筆寫下的注釋,相當于說明書的說明書,仿佛是提醒你把黃油從冰箱里拿出來,以便它能達到室溫。
任何一位家庭大廚都可以證明,完全相同的食譜可以產(chǎn)生截然不同的菜肴,這取決于可用的原材料和變幻無常的環(huán)境。奧斯汀的烤雞和阿姆斯特丹的烤雞是不同的。同樣,基因在蛋白質(zhì)中的表達,也會因組織、人和環(huán)境而異。也許最重要的是,在廚房抽屜里有一本食譜,并不代表你就能吃到東西。為了創(chuàng)造最終的產(chǎn)品,必須發(fā)生一些事情。
不過,最終產(chǎn)品是什么,確實受到食譜的限制。你拿著檸檬雞的食譜,不會做出巧克力片曲奇。食譜如果有錯,可能導致你做出一道稍微不那么合胃口的菜(比如鹽不夠)或?qū)嵲谔y吃,完全不能入口的菜(放了一杯鹽而不是一杯糖)。同樣,DNA序列的突變可以導致蛋白質(zhì)的輕微改變或完全喪失功能。而且,有些食譜比其他食譜更能容忍錯誤、偏差和替代。正如制作意大利肉醬面不需要像制作巧克力蛋奶酥那樣嚴格注意重量、溫度和時間,有些基因比其他基因更不能容忍變異。
所有的比喻都有缺陷,但食譜是一個說得過去的比喻,可以幫助我們理解單一基因和單一蛋白質(zhì)之間的關(guān)系。例如,LRRN2是富含亮氨酸重復神經(jīng)元蛋白的基因“食譜”,重復神經(jīng)元蛋白分子有助于使細胞粘在一起。但本書的主題不是蛋白質(zhì),而是人。LRRN2序列的一個小變化與大學能否畢業(yè)有關(guān)(關(guān)系非常、非常、非常弱),但LRRN2并不是上大學的“食譜”。我們需要將食譜的比喻延伸到一個新的方向,去理解大量基因的集體作用,從而建立一種關(guān)于“基因如何與距離分子生物學層面很遠的結(jié)果相關(guān)”的新認識。
如果一個基因是一個食譜,那么你的基因組(包含在你所有細胞的23對染色體中的所有DNA)就是一個龐大的食譜集,一本巨大的烹飪書。當我寫作本書時,我正在看我書架上的食譜書《豐饒》(Plenty),這本素食食譜集來自名廚尤坦·奧圖蘭吉(Yotam Ottolenghi)開在倫敦的餐廳。假設(shè)你和朋友在奧圖蘭吉餐廳舉行一個小型午餐派對。你的朋友剛剛升職,或者她宣布她終于懷孕了。你正在享用石榴籽烤茄子和山羊奶酪焦糖茴香。餐廳的服務很周到。伙伴們歡快而活潑。《豐饒》是你正在享用的食物的食譜(recipe),但它并不是你正在享受的這場派對的“訣竅”(recipe)。
為什么不是呢?最明顯的是,除了食物之外,還有很多因素會影響你的小午餐派對,從物理環(huán)境(燈光太亮或音樂太響,或椅子太讓人腰酸背痛)到社會環(huán)境(你的朋友是情緒糟糕還是活潑愉快?)和文化層面(烤茄子是你熟悉的、讓你想到家庭溫暖的療愈美食,還是令人激動的新鮮菜肴?)??傮w的體驗是由這么多相互作用的維度共同決定的,以至于有些問題完全是無稽之談?!皩τ谀憬裉斓木筒蜐M意度來說,哪一個更重要:在食物中加鹽還是有一把椅子可以坐?”這就是一個愚蠢的問題。
同樣,人類的生活是由基因和環(huán)境的相互作用共同決定的。經(jīng)典的“先天與后天”(nature versus nurture)之爭試圖決出其中哪一個更重要。但如果我們記住,基因就像一個食譜,它會指示廚師在食物中放鹽,而環(huán)境就像有一把椅子可坐,我們就可以看到,所謂的“先天與后天”辯論也是在問一個愚蠢的問題,因為基因和環(huán)境總是都很重要。
同時,即使我們始終牢記環(huán)境的重要性,我們也可以看到,基因組的差異對于我們理解人與人之間的差異關(guān)系重大,正如食譜的差異關(guān)系到我們與餐廳之間的差異的理解。不可否認,在奧圖蘭吉餐廳用餐的體驗是由具體選擇哪本食譜集塑造的。如果餐廳突然改成只提供安東尼·伯爾頓(Anthony Bourdain)的《傳統(tǒng)法式料理》食譜中的菜肴,你的午餐派對就會變得大不一樣。這是我們從幾十年來人類行為遺傳學研究中得到的基本的、無可爭議的道理。如果你的基因組換了一種樣子,你的認知能力、個性、教育、心理健康、社會關(guān)系都會有所改變。換言之,你的整個生活也會隨之不同。
并非所有的差異都同等重要?;蚪M之間的一些差異類似于在一本食譜中用“糖”取代“鹽”,或?qū)⒚糠菔匙V中的鹽量增加一倍或兩倍。亨廷頓舞蹈癥就是一個很好的例子。HTT基因是亨廷頓蛋白的“食譜”,它在特定位點包含一段連續(xù)重復序列(如同重復“加入1/4茶匙孜然,加入1/4茶匙孜然,加入1/4茶匙孜然”)。導致亨廷頓舞蹈癥的HTT基因版本在這個位點包含了太多次的重復,導致HTT基因異常長。然后這種蛋白質(zhì)被剪成小的黏性碎片,在一個人的神經(jīng)元內(nèi)聚在一起。亨廷頓舞蹈癥的所有可怕癥狀(抑郁和憤怒、抽搐的動作,最終喪失走路、說話和吃飯的基本能力)都可以追溯到單獨一個蛋白質(zhì)“食譜”的變化。
不過,人類之間的大多數(shù)遺傳差異并不像用糖代替鹽,也不像大幅度改變一種重要成分的數(shù)量,而像把“洋蔥”這個詞換成“韭蔥”。科學家面臨的挑戰(zhàn),是了解基因組中這種微小的變化對于理解人類生活之間的差異是否真的有意義,以及如果有意義,又是為什么。
一次一個成分
讓我們暫時把關(guān)于人生的問題放一邊,重新拾起餐廳的比喻。如何確定微小的食譜變化是否會對人們的用餐體驗產(chǎn)生影響?一種辦法是,從你已知的關(guān)于烹飪和飲食的知識開始,然后將范圍縮小到你認為可能很重要的一種成分。比如……香菜?有些人認為香菜的味道像肥皂,所以小心翼翼地把每片香菜小葉子從塔可上刮下來。掌握了“有些人不喜歡香菜”的知識,你就可以在城里挑選20家餐廳,看看他們提供的菜肴中是否包含香菜。
是的,只有20家餐廳,這確實不算多。但為了彌補樣本太少的缺陷,你可以非常仔細地衡量人們的用餐體驗。你不單單是問大家有多么喜歡他們的飯菜。你應當派一個訓練有素的調(diào)查員,去數(shù)人們在吃飯時笑了多少次;你應當看看顧客的信用卡賬單,看他們一年中在那家餐廳花了多少錢。到一天結(jié)束時,你只有關(guān)于一種成分的數(shù)據(jù),只在幾家餐廳測量過,但你對你試圖測量的結(jié)果非常非常了解。然后,你可以繼續(xù)測試你的假設(shè)是否正確:不提供香菜的餐廳,是否擁有更快樂的顧客?
這是許多心理學家和遺傳學家在21世紀初采取的策略,即從一些關(guān)于生物學的先驗(a priori)知識出發(fā),將注意力集中在一個遺傳成分上,并在相對較少的人群中非常密集地測量一個結(jié)果。這種方法被稱為候選基因(candidate gene)研究。最著名的候選遺傳變異被稱為5HTTLPR,即血清素(被縮寫為5HT,這有點讓人糊涂)轉(zhuǎn)運體基因連鎖多態(tài)區(qū)域。 注【Avshalom Caspi et al.,“Influence of Life Stress on Depression:Moderation by a Polymorphism in the 5-HTT Gene,”Science 301,no.5631 (July 18,2003):386–89,https://doi.org/10.1126/science.1083968.】 研究者的想法相對簡單。我們已經(jīng)認為血清素與抑郁癥有關(guān),因為如果你給患者服用針對血清素的抗抑郁藥(如百憂解),他們的抑郁癥(有時)會減輕。5HTTLPR是某個特定基因組的一個微小部分,該基因組會影響血清素在人的大腦神經(jīng)元之間的穿梭。所以,也許擁有不同版本5HTTLPR的人,受抑郁癥的影響程度會有所不同。
再進一步說,我們還知道,壓力大的人更容易得抑郁癥。離婚、失業(yè)、貧困、受虐待的童年,諸如此類的壓力是抑郁癥的最有力的預測器。因此,也許5HTTLPR變異并不會導致你變得抑郁,除非你已經(jīng)在某種程度上受到了壓力。
為了驗證這一假設(shè),研究者花費了數(shù)千萬美元,不僅測量人們的DNA(這在過去和現(xiàn)在都變得越來越便宜),還仔細測量人們的大腦和思想的一切,比如他們是否符合醫(yī)生對抑郁癥的臨床定義,也包括他們喚起悲傷記憶的速度,他們的眼睛在看令人悲傷的圖片時花了多少毫秒,以及他們在聽悲傷的音樂時大腦的哪些部分亮了起來。在數(shù)以百計甚至千計的科學研究中,同樣的結(jié)果不斷出現(xiàn),即5HTTLPR變異會導致壓力大的人變得抑郁。
問題是,所有這些結(jié)果都是錯誤的。到2019年,經(jīng)過多年的禮貌警告、統(tǒng)計學上的抱怨,以及對似乎無窮無盡的5HTTLPR研究的不斷升級的惱怒,心理學家馬特·凱勒(MattKeller)發(fā)表了一項研究,其標題絲毫不拐彎抹角——《在多個大樣本中,無證據(jù)表明歷史上的候選基因或基因互作與嚴重抑郁癥有關(guān)聯(lián)》。 注【Richard Border et al.,“No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression Across Multiple Large Samples,”The American Journal of Psychiatry 176,no.5 (May 1,2019):376–87,https://doi.org/10.1176/appi.ajp.2018.18070881.】 精神病學家、博客作者斯科特·西斯金德沒有遵守科學期刊的禮貌慣例,而是對凱勒論文的結(jié)論作了更生動的總結(jié)。西斯金德譴責那些報告5HTTLPR“結(jié)果”的研究者,認為他們是在編造獨角獸的故事,只不過更糟糕:“這不僅僅是一個探險家從東方回來,聲稱那里有獨角獸。這是探險家在描述獨角獸的生命周期,獨角獸吃什么,獨角獸的所有不同亞種,獨角獸身上的哪種肉最好吃,以及詳細描述獨角獸和大腳怪之間的摔跤比賽。” 注【Scott Alexander [Siskind],“5-HTTLPR:A Pointed Review,”Slate Star Codex,May 8,2019,https://slatestarcodex.com/2019/05/07/5-httlpr-a-pointed-review/.】
從今天的角度來看,候選基因方法的主要問題是顯而易見的,那就是沒有單一的基因可以導致抑郁癥,就像沒有單一的食譜成分可以讓餐廳成功一樣。甚至十個基因也做不到。抑郁癥、體型、大學畢業(yè)、沖動、甚至身高,這些都是復雜的特征,也就是說,在一個關(guān)鍵方面,它們根本不像亨廷頓舞蹈癥。它們不是由單一基因引起的。它們受到成千上萬個遺傳變異的影響,每個變異都產(chǎn)生了微小的影響。由于影響如此之小,我們需要研究的人比早期候選遺傳學研究中包括的樣本要多得多。
2003年發(fā)表的一項早期的、高調(diào)的5HTTLPR研究的樣本包括847人。2019年發(fā)表的對該研究的權(quán)威反駁的樣本量為44.3264萬人,約為前者的500倍。 注【Caspi et al.,“In.uence of Life Stress on Depression”;Border et al.,“No Support for Historical Candidate Gene or Candidate Gene-by-Interaction Hypotheses for Major Depression.”】 第一項報告某些基因與抑郁癥有可靠關(guān)聯(lián)的研究(使用我將在本章下文描述的方法)的樣本量為48.0359萬人。 注【Naomi R.Wray et al.,“Genome-Wide Association Analyses Identify 44 Risk Variants and Re.ne the Genetic Architecture of Major Depression,”Nature Genetics 50,no.5(May 2018):668–81,https://doi.org/10.1038/s41588-018-0090-3.】 你沒有足夠的數(shù)據(jù)(事實上,對于你真正需要的數(shù)據(jù),你只掌握了不到1%)就試圖找到微小模式(tiny patterns)的一個殘酷后果是:你不僅有可能錯過真正存在的模式,還有可能采信那些看似真實但實際上只是噪聲的假“模式”。
全食譜關(guān)聯(lián)分析注【戲仿“全基因組關(guān)聯(lián)分析”?!?/p>
好吧,所以候選基因方法失敗了。但你仍然想弄清楚哪些遺傳變異(如果有的話)對人們的生活有影響,就好比你想找出對用餐體驗有影響的微小食譜變化。A計劃(從你的烹飪知識開始,提出看似合理的假設(shè),并以此為基礎(chǔ)進行研究)最初看起來很聰明,結(jié)果卻完全沒有產(chǎn)生有價值的知識。為了證明科學家在預測未來方面的成績有多么糟糕,B計劃(宣布你以前的烹飪知識是無用的,并不再嘗試提出看似合理的假設(shè))最初看起來不那么聰明,甚至很可笑。不過,正是這種方法最終開始產(chǎn)生結(jié)果。
這次,我們不是從在幾家餐廳測量單一成分開始,而是把得克薩斯州奧斯汀市的每家餐廳提供的每道菜的食譜都拿出來,并把它們分解成微小的元素。每家餐廳產(chǎn)生的數(shù)據(jù)集都將是巨大的。會有幾千甚至幾十萬行數(shù)據(jù),代表數(shù)量、成分、時間、溫度、儀器和說明,例如:切細,在300攝氏度下烘烤,一湯匙,孜然,煸炒,呈金褐色。
而且,就像基因組一樣,這些數(shù)據(jù)在絕大多數(shù)餐廳都完全一樣。所有人的99%以上的DNA都是相同的,就好比每家餐廳都使用鹽。
因此,讓我們過濾掉各家餐廳完全相同的食譜元素,只保留不同的東西。我家附近的一家餐廳提供油炸博洛尼亞香腸三明治,配上意大利辣腌菜。你不可能在任何地方都能找到意大利辣腌菜。
現(xiàn)在,我們已經(jīng)把每家餐廳提供的食物分解成一點一滴的數(shù)據(jù),我們還需要對餐廳本身進行測量。但我們不再使用僅有20家餐廳的小樣本,所以我們沒有時間或金錢去做顧客滿意度的精細測量。我們需要一些快速和“粗糙”的東西,一些容易在數(shù)千家餐廳當中匯編的東西。也許……可以用Yelp評分?
在過去十年里上過網(wǎng)的人都知道,Yelp是一個眾包本地企業(yè)信息的網(wǎng)站。用戶可以在Yelp上寫評論,對企業(yè)進行一星到五星的評分。一家餐廳要在Yelp上得到高分評價,需要有很多人喜歡在那里吃飯,并留下評論和好評,而且這家餐廳不能有太多差評。截至我寫作本書的時候,得克薩斯州奧斯汀市Yelp評分第一的餐廳是一家名為“咸豬”(Salty Sow)的美食酒吧。正如其名字所示,它是所有豬肉菜肴的圣殿,比如糖漬豬肚、寬葉羽衣甘藍配豬肘、培根魔鬼蛋。評分第二的是一家以炸雞排聞名的南方風格咖啡館,評分第三的是富蘭克林烤肉店,人們?yōu)榱顺缘接型昝澜蛊さ呐k钇?,甘愿在那里排隊等候幾個小時。
現(xiàn)在,我們需要做的,是把我們在第一步編制的食譜元素數(shù)據(jù),與Yelp上的餐廳評分數(shù)據(jù)結(jié)合起來,然后就可以了!我們就有了一個統(tǒng)計分析的雛形。不知提供意大利辣腌菜的餐廳的評分是否更高?
但是,等等!反對之聲十分熱鬧。糖漬豬肚?炸雞排?牛腩?純素主義者提醒我們,Yelp的評分并不能反映某些我們也許應該接受的飲食價值觀,比如在倫理層面反對吃肉。戴眼鏡的時髦人士抱怨說,優(yōu)先考慮大眾市場的滿意度與創(chuàng)新精神是對立的。社會學家提醒我們,花大量時間在互聯(lián)網(wǎng)上匿名發(fā)帖的人,并不是真正有代表性的顧客樣本。
因此,我們要考慮替代方案。與Yelp評分相比,也許餐廳收入是一個更好的衡量標準?相對于奧斯汀其他提供食物和酒水的商家,“完美10人俱樂部”的生意非常興隆,但我懷疑那里的顧客不是為了食物來的 注【“完美10人俱樂部”餐廳(Perfect 10 Men's Club)的特色是有脫衣舞表演,并且女服務員衣著性感?!?。也許專家的意見是衡量餐廳質(zhì)量的更好的標準?畢竟《康泰納仕旅行者》雜志的前20名名單中,包括了我個人最喜歡的幾家餐廳。但話又說回來,也許中年教授的飲食偏好并不具有最廣泛的代表性。
反對的聲音是正確的。衡量標準確實很重要。食譜上的哪些詞與“最佳”餐廳相關(guān),取決于你如何定義“最佳”。專家意見可能會重視具有異域風情的成分(磨碎的海膽,有人想吃嗎?),而某家餐廳的利潤高,可能是因為食物只需要幾乎沒有技能或培訓的工人就可以廉價而可靠地烹飪,或者服務員是衣著清涼的舞者。
在心理學中,我們花了很多時間來思考這類測量問題。你找到了一個你有興趣研究的理論實體,或建構(gòu)(例如,人們對一家餐廳的喜愛程度如何?),然后你需要想出一種方法,將數(shù)字有意義地附加到該建構(gòu)上。什么樣的測量方法是最好的?有些測量問題很簡單,比如身高可以用英寸來衡量。但是,我們感興趣的建構(gòu)往往是難以描述的,而且是有爭議的。比如,幸福感的單位是什么?聰明是指什么?什么是好的餐廳?
有些人可能會對試圖量化餐廳質(zhì)量的想法感到反感,不管你怎么去量化。食物的變化是無窮無盡的,怎么能把一座城市的餐廳場景的感官體驗和文化體驗的織錦濃縮為一個單一的數(shù)字呢?在遺傳學研究的語境里,人們經(jīng)常以類似的理由反對測量智力或個性:人也是變化無窮的,怎么能把他們所有的怪癖和才能濃縮為一個單一的數(shù)字呢?
簡短的回答是:不能。幸運的是,對實體(無論是人還是餐廳)進行“濃縮”,并不是測量的目標。測量是將數(shù)字分配給事件或特征的過程,測量對所有的科學學科都至關(guān)重要。除非你能測量一樣東西,否則你無法科學地研究它。一家餐廳的Yelp評分并不是它的終極衡量標準,而且使一家餐廳成為某人最喜愛的本地餐廳的特質(zhì),可能并不反映在匿名網(wǎng)民給它多少顆星上。但是,即使我們?nèi)娜獾鼐芙^“一家餐廳的一切有價值或有趣的東西都可以‘濃縮’為Yelp評分”的想法,我們也可以認為,Yelp評分是一個雖然粗略但仍然有用的衡量人們多么喜歡某家餐廳的標準。
不過,為了使Yelp評分有用,我們需要清楚地了解它的缺陷和局限性。利用Yelp評分來衡量餐廳的研究,給出的是一個不完美的衡量標準,即有多少人說他們喜歡在某家餐廳吃飯。但由此產(chǎn)生的按順序排列的“好”餐廳名單,可能無法反映一個人對于什么是“好”食物的價值觀。
當我教授心理學概論時,我讓學生練習用下面的語言來談論心理學研究:“這項研究是關(guān)于建構(gòu)X的,通過Y來衡量?!崩纾@項研究是關(guān)于幸福的,通過人們對某事物的評分來衡量,提問就是該事物使得他們今天感覺有多幸福?;蛘?,這項研究是關(guān)于社會焦慮的,通過人們被要求在不茍言笑的評委面前做簡短演講時,唾液中的皮質(zhì)醇(Cortisol)增加多少來衡量。我希望,這種語言練習能幫助學生學會關(guān)注“研究者如何測量像幸福和焦慮這樣的抽象概念”,并對這些測量可能存在的缺陷感到好奇。
說到底,為了科學地研究一些東西,我們必須測量它們,而測量受到時間和金錢的限制。讓我們回到對餐廳質(zhì)量的研究,以Yelp的平均評分來衡量。我們分析數(shù)以百萬計的相關(guān)關(guān)系:在不同餐廳之間,哪些不同的食譜元素與餐廳的Yelp評分相關(guān)?
這樣運算的結(jié)果,可能是一個看起來像瘋狂購物清單的東西。清單中的每個條目都會有一個小數(shù)字,代表它與一家餐廳的Yelp評分有多大關(guān)聯(lián)。具有真正重大影響的嚴重的食譜錯誤,如用糖代替鹽,將是罕見的,幾乎不存在。如果一家餐廳提供沒有鹽的食物,它可能過不了多久就會關(guān)門,所以不會在我們的數(shù)據(jù)庫中停留足夠長的時間。
這種分析會發(fā)現(xiàn)一些微小但一致的模式。也許這些模式能證實你之前的一些預感。也許,正如廚師馬里奧·巴塔利(Mario Batali)聲稱的,“酥脆”是賣出最多食物的廣告詞。也許分析結(jié)果會揭示出以前從來沒有人想到的模式。無論是否出人意料,由此產(chǎn)生的關(guān)聯(lián)性將非常弱?!拔业谋ぁ?Whataburger)快餐店和“昔客堡”(Shake Shack)之間的差異,或許不能歸因為一份食譜中的一個詞。
不過,無論我們的全食譜關(guān)聯(lián)分析的結(jié)果如何,有幾件事是顯而易見的。首先,這些結(jié)果并不意味著餐廳的環(huán)境(座位、音樂、燈光、地段和裝潢)對人們的體驗而言不重要。其次,該分析不會告訴你,允許陌生人對本地企業(yè)寫匿名評論的網(wǎng)站是不是一個好東西,不會告訴你這種評分是否公平,也不會告訴你,這些評分是否符合你的道德觀和審美觀,或者是否符合你對一家餐廳應該如何經(jīng)營的理解。最后,這些結(jié)果絕對不會教你如何做飯。它能告訴你的,非常簡單,就是在你根據(jù)某種衡量標準歸類為“高”與“低”的餐廳中,哪些食譜元素更常見。
從全食譜關(guān)聯(lián)分析到全基因組關(guān)聯(lián)分析
全基因組關(guān)聯(lián)分析(GWAS)的工作方式,基本上和我剛才描述的“全食譜關(guān)聯(lián)分析”是一樣的。就像把食譜上的個別字詞與餐廳的一些可測量特征關(guān)聯(lián)起來一樣,GWAS把基因組的個別元素與人類的一些可測量特征關(guān)聯(lián)起來?;蚪M“食譜”中最常被分析的個別元素,被稱為單核苷酸多態(tài)性(SNP)。
一個DNA分子是由兩條含糖的鏈組成的,由四種不同類型的核苷酸——鳥嘌呤(G)、胞嘧啶(C)、腺嘌呤(A)和胸腺嘧啶(T)互相配對、緊密結(jié)合而成。SNP是人與人之間的遺傳差異,有些人的基因組中的一個特定點(基因座)有一個核苷酸,而另一些人有一個不同的核苷酸。你可能有一個G,而我有一個T。SNP的不同版本被稱為等位基因(alleles)。通常情況下,一個等位基因比另一個更常見。在人群中不太常見的等位基因被稱為次等位基因。每個人的每個基因都有兩個拷貝(一個來自母親,一個來自父親),所以你可以計算一個人對每個SNP擁有的次等位基因的數(shù)量(0,1或2)。GWAS在成千上萬的人中測量數(shù)百萬個SNP,并將每個SNP與表型(phenotypes)相關(guān)聯(lián)。表型就是一個人身上可以測量的東西,如身高、身體質(zhì)量指數(shù)(body mass index)或受教育程度。
即使是數(shù)以百萬計的SNP,也只是人與人之間存在的遺傳差異的總量的一小部分。但是GWAS通常可以忽略基因組的一部分數(shù)據(jù),因為每個被測量的SNP都“標記”了其他許多人人有別的遺傳變異。打個比方,當你讀到一份包含“黑胡椒”字樣的食譜時,你可以合理地猜測(即“推斷”),該食譜可能也包含“鹽”。同樣,當人們有一種形式的SNP時,你通??梢院侠淼赝茢喑銎渌浇倪z傳變異的信息:如果某人在某一特定位置有一個“C”,你通??梢院侠淼赝茢嗨麄冊诹硪晃恢糜幸粋€“T”(罕見的變異,即只發(fā)生在少數(shù)人或少數(shù)家庭中的變異,基本上不會被標記)。
我們之所以能夠通過測量一個變異來標記多個變異,是卵子和精子細胞的產(chǎn)生方式的結(jié)果。讓我們回顧一下人類與細菌的區(qū)別:人類不是簡單地復制自己的DNA,而是進行有性繁殖。也就是說,我們產(chǎn)生精子或卵細胞,每個精子或卵細胞都包含我們一半的DNA,而創(chuàng)造一個完整的人所需的另一半基因組來自有性繁殖的另一方。但在產(chǎn)生精子或卵細胞時,我們的身體并沒有將整個染色體的一個完整拷貝打包。相反,在減數(shù)分裂的過程中,發(fā)生了重組(recombination)。對于我的23對染色體中的每一對,我從母親那里繼承的染色體和我從父親那里繼承的染色體排成一排,互相交換。這種重組過程將遺傳變異
重組成全新的組合,這些組合都是彼此不同的。
重組過程是孟德爾在數(shù)學觀察的基礎(chǔ)上推導出的獨立分配律(law of independent assortment)的生物學基礎(chǔ)。繼承基因A的某個版本的概率,與繼承基因B的某個版本的概率是相互獨立的。
除非,基因A和基因B在基因組內(nèi)彼此非常接近,那樣的話,重組會將父系和母系染色體“洗牌”,但它洗得很糟,讓許多張牌粘在一起。當兩個基因在物理上比較接近時,在它們之間的某個空間發(fā)生重組的機會就比較小。物理上非常接近的基因有可能被一起遺傳,而不是被重組“洗”開。由于物理上相互接近而有可能被一起遺傳的基因,被稱為處于連鎖(linkage)中。連鎖導致基因相互關(guān)聯(lián),即處于連鎖不平衡狀態(tài)(linkage disequilibrium,縮寫為LD)。
了解人類基因組的LD結(jié)構(gòu),對于許多目的來說都是非常有用的,包括在全基因組關(guān)聯(lián)分析(GWAS)中使基因組的測量更加高效。但是,如果GWAS發(fā)現(xiàn)一個特定的單核苷酸多態(tài)性(SNP)與(比方說)受教育程度有關(guān),那么我們就不清楚這種關(guān)聯(lián)是由這個特定的SNP本身驅(qū)動的,還是因為我們測量的SNP與一個我們沒有測量的變異一起遺傳了下來。
那么,我們可以把GWAS結(jié)果看作一張基因藏寶圖。X標記了藏寶地點,現(xiàn)在你知道海盜的黃金位于某個荒島的西南部。但是,你登陸荒島之后發(fā)現(xiàn),那里有一片由藤蔓和密密麻麻的樹木組成的叢林,而且你沒有辦法翻遍叢林的每一寸土地,也就是沒有辦法對該島進行“精細測繪”。
我在本章開始時告訴你的2013年的研究就是一個GWAS,它發(fā)現(xiàn)了三個與人能否從大學畢業(yè)有關(guān)的遺傳變異。如果你把GWAS看成閱讀人們的基因組“食譜”的一種極其粗略的方式,就更容易對其結(jié)果產(chǎn)生直觀的認識。關(guān)于教育的遺傳學研究和我們打比方的全食譜關(guān)聯(lián)分析之間有重要的相似之處,這很值得思考。
第一,受教育程度被定義為一個人完成的正規(guī)學校教育的時長。這很像餐廳的Yelp評分。一方面,兩者都會對真實生活造成影響。Yelp評分低的餐廳可能開不了多久,沒有文憑的人找到工作的可能性較小。另一方面,這兩個指標都不能完全代表我們可能珍視和重視的所有特征,高分者甚至可能有我們非常討厭的特征。一家餐廳在Yelp上有很好的評分,可能是因為它在愉快的氛圍中提供美味的食物。但它也可能是一家全國性的連鎖店,提供工廠化養(yǎng)殖的肉類,并迎合游客的需求,把那些更有特色的本地餐廳排擠掉。一個人在教育領(lǐng)域有很好的成績,可能是因為他們聰明、求知欲強和勤奮,也可能是因為他們循規(guī)蹈矩、規(guī)避風險和有強迫癥,或者因為他們的其他一些特征(漂亮、高挑、苗條、膚色淺),使他們在一個難免有偏見的社會中享有特權(quán)。對在教育體制中取得成功的相關(guān)因素的研究,并不能告訴我們這個體制是否良好、公平或公正。
第二,誰能在教育體制中名列前茅,與文化和歷史背景有關(guān)。在奧斯汀進行的全食譜關(guān)聯(lián)分析的結(jié)果(高分餐廳的相關(guān)因素),可能與在曼哈頓(更不用說在德里或上海)進行同樣的研究的結(jié)果大相徑庭。同樣,對1970年后出生的美國男性進行受教育程度的全基因組關(guān)聯(lián)分析(GWAS),會發(fā)現(xiàn)與該人群受教育程度更高相關(guān)的遺傳變異,但這些遺傳變異是否與在高等教育中的性別歧視被取締之前成年的美國女性的受教育程度相關(guān),就很難說了。這種在不同語境中發(fā)現(xiàn)的不一致,并不意味著Yelp評分是衡量餐廳受喜愛程度的一個有嚴重缺陷的標準,也不意味著GWAS的結(jié)果是無用的。不過,這確實意味著,一時一地的測量結(jié)果,不一定能代表所有時間和地點。
第三,GWAS的結(jié)果并沒有以任何方式表明環(huán)境對教育不重要。GWAS甚至沒有測量關(guān)于環(huán)境的任何東西。
第四,GWAS本身并不表明我們在“DNA的層面”理解教育,就像對食譜的自動化分析并不表明我們在“食材的層面”理解餐廳的社交活動。
第五,GWAS檢測到的相關(guān)性是非常、非常、非常、非常弱的。它們也理應如此?!拔业谋ぁ笨觳偷旰汀拔艨捅ぁ敝g的差異不能歸因為食譜中的一個詞,完成博士學業(yè)的人和高中輟學的人之間的差異也不能歸因為單一的SNP。與受教育程度相關(guān)的每個SNP最多只相當于幾周的教育,而且大多數(shù)SNP的價值比這還要小得多。
第六,GWAS的結(jié)果不會告訴你如何烹飪。也就是說,基因組成分(SNPs)的清單并不能幫助我們了解其機制,也就是這些成分如何組合成一個復雜的結(jié)果。
噩夢般的,還是可忽略不計的?
當我們考慮到受教育程度與單個單核苷酸多態(tài)性(SNP)的關(guān)聯(lián)是多么微不足道,再加上我們無法輕易分辨一個“顯著”的關(guān)聯(lián)是由被測量的SNP本身還是由該SNP“標記”的另一個變異所驅(qū)動,關(guān)于受教育程度的遺傳學研究就不再顯得仿佛噩夢了。相反,我們開始感覺,它就像將食譜中的詞語與餐廳的Yelp評分相關(guān)聯(lián)的研究一樣微不足道。SNP rs11584700并不能決定你的命運。它甚至不能讓你通過大一的第一次期中考試。所以很多人想知道:那么,為什么還要做GWAS呢?如果你專注于每個SNP對教育的影響程度,就很容易將整個GWAS事業(yè)視為浪費時間和金錢。
這就是一些人對GWAS的看法:它并不可怕,也不是優(yōu)生主義的,而是微不足道和浪費資源的。例如,我的博士生導師埃里克·特克海默就因?qū)WAS的價值持懷疑態(tài)度而聞名。2013年,作為即將離任的行為遺傳學協(xié)會主席,他在協(xié)會年會晚宴上發(fā)表了一次如今已經(jīng)臭名昭著的演講。晚宴在馬賽舉辦,天空是粉紅色和金色的,人們穿著西裝外套和晚會長裙出席,氣氛很融洽,直到埃里克上臺說,做GWAS就像通過研究音樂CD上的凹點(pit)來了解一首歌曲是否好聽。聽眾是為GWAS研究投入了數(shù)百萬美元和多年心血的科學界同仁,所以埃里克的演講很不受歡迎。
我當時并不感到震驚,因為我曾多次聽到他的這一觀點。而且截至2013年,我可能會(暗地里)同意他的觀點。年復一年,我聽了一個又一個關(guān)于努力尋找與美好人生相關(guān)的基因的科學講座。所有這些講座都以差不多相同的方式結(jié)束:“我們目前尚未發(fā)現(xiàn)任何東西,但我們只是差更多的樣本!”
一連串代價昂貴的失敗,再加上,說實話,我對基因組學方法似乎篡奪了傳統(tǒng)的行為遺傳學工具(雙生子研究和家庭研究)的位置感到不滿,而我剛剛花了十年時間掌握這些傳統(tǒng)工具,因此我很容易同意埃里克的觀點。人類的行為實在太復雜。我們不可能通過研究一張CD的凹點來了解德彪西,不可能通過做一項全食譜關(guān)聯(lián)分析來了解一家好餐廳究竟好在哪里,不可能通過將真實的人類生活與SNP相關(guān)聯(lián)來了解到任何有用的東西。
但我們錯了。
多基因指數(shù)和生活結(jié)果的(不)可預測性
要想理解全基因組關(guān)聯(lián)分析(GWAS)為什么有價值,不妨回到我已經(jīng)告訴過你的東西:任何單個單核苷酸多態(tài)性(SNP)和受教育程度之間的關(guān)聯(lián)都是非常、非常、非常、非常弱的。這個結(jié)論可能看起來是廢話,甚至是理所當然的。但這一結(jié)論與全球數(shù)以千計科學家的預測相左。在21世紀初,當GWAS方法剛被開發(fā)出來時,許多科學家預測,像精神分裂癥或自閉癥這樣的現(xiàn)象可能是由十幾個不同的遺傳變異引起的。
如果這是真的,那么只要對幾千人進行研究,我們就能輕易地了解到基因組的秘密,而且每個基因的影響力也會相對較大。但事實證明,這些早期的預測天真得可笑。精神分裂癥、自閉癥、抑郁癥、肥胖癥和受教育程度都與任何單一基因無關(guān)。它們甚至與十幾個不同的SNP都沒有關(guān)系。它們是由多基因決定的,也就是說與分散在一個人的基因組中的成千上萬個SNP相關(guān)。
大規(guī)模多基因性(polygenicity)的最明顯的例子也許是身高。正如我們在上一章討論的,非常高的人,如籃球運動員肖恩·布拉德利,之所以這么高,是因為他們繼承了非常多的增加身高的遺傳變異。身高聽起來可能是一個有點無聊的性狀,但統(tǒng)計遺傳學對身高的研究很多,因為身高很容易準確測量,而且具有高遺傳率。幾乎每一項生物醫(yī)學研究都會收集身高的數(shù)據(jù),因此研究者可以使用極多的樣本。而且基因會影響人的身高這一事實沒有爭議,這使得科學家們有相對多的空間來建立他們的數(shù)學模型。
一個這樣的數(shù)學模型計算出,有超過10萬個SNP可能與人的身高有小的關(guān)聯(lián)。 注【Evan A.Boyle,Yang I.Li,and Jonathan K.Pritchard,“An Expanded View of Complex Traits:From Polygenic to Omnigenic,”Cell 169,no.7 (June 15,2017):1177–86,https://doi.org/10.1016/j.cell.2017.05.038.】 在這些計算的基礎(chǔ)上,研究者提出了他們所謂的“全基因”(omnigenic)模型。當然,“全”(omni)的意思是所有,即所有的基因。準確地說,是所有這樣的基因:它體現(xiàn)在身體組織中,而這些組織與研究者所研究的東西有關(guān)。例如,如果你在研究身高,那么相關(guān)的身體組織包括腦垂體(產(chǎn)生生長激素)和骨骼系統(tǒng),以及其他的。如果你研究的是教育,相關(guān)的身體組織就是大腦。 注【James J.Lee et al.,“Gene Discovery and Polygenic Prediction from a Genome-Wide Association Study of Educational Attainment in 1.1 Million Individuals,”Nature Genetics 50,no.8 (August 2018):1112–21,https://doi.org/10.1038/s41588-018-0147-3.】
隨著研究結(jié)果變得更加多基因化,為了區(qū)分信號和噪聲,需要研究的樣本量也相應增加。如果連身高這樣看起來很簡單的性狀都是由多基因決定的,那么社會和行為結(jié)果也同樣是由多基因決定的。我在本章開頭介紹的第一項關(guān)于受教育程度的研究認真考慮了多基因性的影響,所以樣本量達到在當時看起來數(shù)量驚人的12.6559萬人,最后發(fā)現(xiàn)了3個與受教育程度有關(guān)的SNP。這個研究小組堅持不懈,他們的第二項研究在三年后的2016年發(fā)表,樣本量為29.3723萬人,在基因組中找到了74個與受教育程度有顯著關(guān)聯(lián)的SNP。而2018年發(fā)表的第三項后續(xù)研究,樣本量為110萬人,發(fā)現(xiàn)了1271個與受教育程度有顯著關(guān)聯(lián)的SNP。 注【Rietveld et al.,“GWAS of 126,559 Individuals Identifies Genetic Variants Associated with Educational Attainment”;Aysu Okbay et al.,“Genome-Wide Association Study Identifies 74 Loci Associated with Educational Attainment,”Nature 533,no.7604 (May 2016):539–42,https://doi.org/10.1038/nature17671;Lee et al.】 之前有人預測,只要有足夠多的樣本(也就是人),GWAS可以找到與受教育程度等復雜結(jié)果可靠地相關(guān)的SNP。事實證明這個預測是正確的。
當一個性狀涉及成千上萬個遺傳變異時,每個變異的微小關(guān)聯(lián)加總起來,就會形成人與人之間有意義的差異。研究者正是這樣做的:將所有SNP的信息加總成一個單一的數(shù)字。更具體地說,在你做了GWAS之后,你會得到一個長長的數(shù)字列表,你測量的每個SNP都有一個數(shù)字,代表每個SNP和你的目標表型(在這個案例中是受教育程度)之間的關(guān)系強度。然后,你可以根據(jù)這一串數(shù)字,對新的一組人的DNA序列打分。每個人有多少個與教育相關(guān)的遺傳變異的拷貝?是0個、1個還是2個?(記住,你的每個基因都有兩個拷貝,一個來自你的母親,一個來自你的父親)每個SNP的拷貝數(shù)乘以它與受教育程度的關(guān)系強度,然后將你的基因組中所有被測量的SNP的結(jié)果加起來(圖3.1)。這個綜合指數(shù)就是多基因指數(shù)(polygenic index)。
上述的受教育程度GWAS的研究者隨后在一個新的參與者樣本中計算了受教育程度的多基因指數(shù)。這些參與者都是在1990年代讀高中的美國白人。在那些教育多基因指數(shù)最低的人中,大學畢業(yè)生的比例是11%。相比之下,在多基因指數(shù)最高的人中,大學畢業(yè)率為55%。這種差距(高4倍)絕非微不足道。
我已經(jīng)用教育多基因指數(shù)低的人和高的人之間的大學畢業(yè)率的差異來描述教育多基因指數(shù)和受教育程度之間的關(guān)系強度。表達這種關(guān)系強度(統(tǒng)計學家稱之為“效應值”)的另一種方式是用所謂的決定系數(shù)(R2),它衡量的是人們在一個特征上的差異能被我們測量的東西反映的程度。例如,人們的體重不同,而一般來講高個子的人更重,那么知道人們的身高后,可以在多大程度上解釋人們體重的差異?
R2表示為一個百分比,可以在0%和100%之間變化。在身高和體重的例子中,如果R2是100%,那就意味著人們的體重差異單純是因為他們比別人高或矮,而且我們只需知道一個人的身高就能知道他的體重。如果R2是0%,那就意味著人與人之間的體重差異與他們的身高無關(guān),而且知道一個人的身高無助于了解其體重。在現(xiàn)實中,R2值通常在這兩個極端之間。在美國,身高差異大約能解釋人們體重差異的20%。換句話說,人的體重差異的大約五分之一可以通過了解他們的身高而得到,但同樣高的人之間體重仍然存在差異。
圖3.1 創(chuàng)建一個多基因指數(shù)。圖表轉(zhuǎn)載自Daniel W.Belsky and K.Paige Harden,“Phenotypic Annotation:Using Polygenic Scores to Translate Discoveries from Genome-Wide Association Studies from the Top Down,”Current Directions in Psychological Science 28,no.1 (February 2019):82·90,https://doi.org/10.1177/0963721418807729。個別SNP和表型之間的相關(guān)性是在具有大樣本量的“發(fā)現(xiàn)GWAS”中估計的。許多GWAS的樣本量多達數(shù)百萬人。然后,對一個新人的DNA進行測量。這個人的基因組中的次等位基因(0、1或2)的數(shù)量被計算為每個SNP,得出的數(shù)字被GWAS對SNP和表型之間相關(guān)性的估計加權(quán),產(chǎn)生一個多基因指數(shù)。這個多基因指數(shù)將呈正態(tài)分布:大多數(shù)人的多基因指數(shù)在平均水平,少數(shù)人的分數(shù)會非常低或非常高。經(jīng)SAGE Publications,Inc.許可轉(zhuǎn)載。
研究者在談論R2值時使用的措辭可能會引起混淆和誤導。有兩個詞特別容易造成麻煩。一個詞是“解釋”。R2值經(jīng)常被稱為“可解釋方差”(variance explained),但在我看來,“解釋”意味著對兩件事情的關(guān)系有更深的理解。R2值并沒有給出任何科學解釋。它只是一個數(shù)學表達,表明一個變量與另一個變量共同出現(xiàn)的程度。
第二個制造麻煩的詞是“預測”。在日常談話過程中,當我們談論“預測”天氣、選舉結(jié)果或股市活動的能力時,我們通常暗示這些對未來事件的預測是高度準確的。但研究者對未來事件的預測高度不確定且經(jīng)常不準確時,他們也經(jīng)常使用“預測”(predict)和“預測器”(predictor)這些詞。在剛才舉的身高和體重的例子中,我可以利用人們的身高信息,從統(tǒng)計層面說明人們體重的差異,也就是說,身高是體重的一個“預測器”。但實際上對于具體的人的體重,我仍然只能猜測。如果我知道他的身高,我的最佳猜測會比我沒有掌握這個信息時更好。但即便如此,我的最佳猜測仍然會很糟糕,因為身高相同的人在體重上仍然會有很大的差異。
考慮到這些信息,多基因指數(shù)和教育結(jié)果的R2是多少?在生活在高收入國家的白人樣本中,從受教育程度GWAS中創(chuàng)建的多基因指數(shù),通常能捕捉到受教育年限、標準化學業(yè)考試成績或智力測試分數(shù)等結(jié)果中10%—15%的差異。 注【A.G.Allegrini et al.,“Genomic Prediction of Cognitive Traits in Childhood and Adolescence,”Molecular Psychiatry 24,no.6 (June 2019):819–27,https://doi.org/10.1038/s41380-019-0394-4.】
10%—15%聽起來是很多還是很少,在很大程度上取決于你的視角。根據(jù)我的經(jīng)驗,人們往往輕視10%的R2,認為它微不足道、可以忽略不計。當然,10%的R2值告訴我們,多基因指數(shù)不能“算命”,不能準確預測任何個體的未來。 注【Robert Plomin,Blueprint:How DNA Makes Us Who We Are (Cambridge,MA:MIT Press,2018).】 在圖3.2中,我繪制了多基因指數(shù)和生活結(jié)果之間的假設(shè)關(guān)系圖,其中前者捕獲到了后者的大約10%的差異。如果你在橫軸上選取任何一點,即選取多基因指數(shù)的任何給定值,然后向上和向下看,你會發(fā)現(xiàn)人們的生活結(jié)果仍有很大差異。這與我們在現(xiàn)實中看到的情況相吻合:在具有平均水平的教育多基因指數(shù)的人當中,有些人擁有博士學位,有些人沒有從高中畢業(yè),還有介于這兩者之間的各種情況。
雖然多基因指數(shù)并非個人生活的完美“算命先生”,但我們也不能將其視為微不足道或可忽略不計。正如心理學家大衛(wèi)·芬德和丹尼爾·奧澤認為的,我們可以通過將R2值與我們在日常生活中遇到的一些關(guān)系強度相比較,來直覺地判斷R2值是“大”還是“小”, 注【David C.Funder and Daniel J.Ozer,“Evaluating E.ect Size in Psychological Research:Sense and Nonsense,”Advances in Methods and Practices in Psychological Science 2,no.2 (June 1,2019):156–68,https://doi.org/10.1177/2515245919847202.】 比如抗組胺藥緩解過敏癥狀的趨勢(R2=1%),男性比女性更重的趨勢(R2=7%),海拔高的地方更冷的趨勢(R2=12%),以及如前所述,高個子的人更重的趨勢(R2=19%)。在這個清單中,我們可以添加一個與社會不平等研究特別相關(guān)的基準:出生在富裕家庭的孩子從大學畢業(yè)的比例更高(R2=11%)。 注 【Lee et al.,“Gene Discovery and Polygenic Prediction from a Genome-Wide Association Study of Educational Attainment in 1.1 Million Individuals.”】
對收入的比較尤其令人感慨,因為我們太習慣于思考金錢能給學生帶來的好處。更富有的父母可以買更多的玩具和書,把孩子送到更好的學校,為孩子報名參加藝術(shù)課程和智能機器人課后項目。更富有的父母可以負擔得起私人家教和SAT預科課程。來自富裕家庭的學生不必通過勤工儉學來完成大學學業(yè),有更多時間可專注于學習。當然,在富裕家庭長大的孩子并不是注定(destined)會獲得大學學位的。你的家庭經(jīng)濟狀況并不能完全決定(determine)你成年后的社會階層。但是,對于了解在美國誰最有可能獲得大學教育,誰最不可能獲得大學教育,金錢是很重要的。
圖3.2 假設(shè)的多基因指數(shù)可以捕捉到生活結(jié)果中10%的差異。橫軸為多基因指數(shù);縱軸為假設(shè)的生活結(jié)果,如受教育程度。每個點代表一個人。對于多基因指數(shù)的每個值,人們的生活結(jié)果都有相當大的差異。
這些基準比較得出的數(shù)字可能比你想象的要小。芬德和奧澤在論文中指出了三個原因,以解釋為什么R2值通常比我們預期的要低。首先,也是最簡單的原因:人類彼此之間非常不同。有很多差異性需要解釋。
第二,人類生活的因果關(guān)系很復雜,是多種因素相互作用的結(jié)果。鑒于潛在相關(guān)因素的數(shù)量之多,期望任何一個變量(即使是像收入或遺傳這樣重要的因素)能夠解釋結(jié)果中較大的差異,是不現(xiàn)實的。用芬德和奧澤的話說,“也許所有研究者都應該稍微(或大幅)降低他們的期望”。 注【Funder and Ozer,“Evaluating E.ect Size in Psychological Research.”】
最近一項名為“脆弱家庭挑戰(zhàn)”(Fragile Families Challenge)的研究強調(diào),研究者需要降低他們對任何變量的期望,無論是環(huán)境變量還是遺傳變量。“脆弱家庭和兒童福祉研究”是一項正在進行的研究,研究對象是4000多個家庭,他們在孩子出生時被征集參加兒童發(fā)展研究。此后,這些孩子在1歲、3歲、5歲、9歲和15歲時接受了一系列變量的測量。他們的父母、老師,以及孩子們自己,都接受了調(diào)查,調(diào)查項目包括“兒童健康和發(fā)展、父親和母親的關(guān)系、父親在養(yǎng)育中發(fā)揮的作用、婚姻態(tài)度、與大家族的關(guān)系、環(huán)境因素和政府項目、健康和健康行為、人口統(tǒng)計學特征、教育和就業(yè)及收入、父母的監(jiān)督和親子關(guān)系、父母對孩子施加的紀律、兄弟姐妹之間的關(guān)系、生活常規(guī)、學校、青少年犯罪、任務完成和行為,以及健康和安全”。 注atthew J.Salganik et al.,“Measuring the Predictability of Life Outcomes with a Scienti.c Mass Collaboration,”Proceedings of the National Academy of Sciences 117,no.15 (April 14,2020):8398–8403,https://doi.org/10.1073/pnas.1915006117.】 換句話說,就是研究者能想象得到的關(guān)于兒童環(huán)境和發(fā)展的一切。
就在研究者公布孩子們15歲時的測量數(shù)據(jù)之前,他們設(shè)計了一項挑戰(zhàn)任務:讓多個科學家團隊使用盡可能多的變量和統(tǒng)計方法(只要他們想得到),來預測孩子們15歲時的結(jié)果。最終,超過160個科學家團隊參與了這項挑戰(zhàn),每個團隊都獲得了關(guān)于一個孩子及其家庭的1.2萬多個變量。結(jié)果很能令人清醒。最好的模型(它有可能包含自孩子出生以來被測量的成千上萬個變量)只能預測學生15歲時成績差異的20%。在描述這些結(jié)果時,“脆弱家庭挑戰(zhàn)”的組織者附和了芬德和奧澤的呼吁,即在研究復雜的人類生活時,研究者應當保持謙遜:“如果用我們的預測能力來衡量我們的理解程度,那么研究結(jié)果……表明,我們對兒童發(fā)展和生命過程的理解實際上是相當貧乏的。” 注【Salganik et al.】
那么,任何關(guān)于遺傳與人類生活結(jié)果的關(guān)聯(lián)是“強”還是“弱”的討論,都必須面對這樣一個事實:當研究者在研究像兒童學業(yè)成績這樣復雜的東西時,即使研究者測量了他們能想象得到的環(huán)境的每一個方面,仍然沒有一個變量或一組變量的R2值看起來令人印象深刻。
不過,即使是一個小的R2值,也可能是相當有意義的。芬德和奧澤解釋為什么R2值往往比我們想象的要小的第三個理由是,當小的影響一次又一次地重復,在一個又一個人身上重復時,這些小的影響就會累積起來。我們習慣于考慮收入的微小但系統(tǒng)性的影響是如何累積的:在教育軌跡的每一點上,富裕的家庭都可以“作弊”,使他們的孩子更有可能獲得某種結(jié)果,比如考試獲得某個分數(shù),或被分到“快班”,或被精英學校錄取。這個過程乘以數(shù)以百萬計的家庭,就形成了不可忽視的教育不平等的社會模式。因此,DNA也可能是兒童生活中的一種系統(tǒng)性力量,在教育軌跡的每一個點上都會有它的影響。而擁有某種遺傳變異組合所賦予的優(yōu)勢,會在數(shù)百萬人中累積,同樣會導致不可忽視的教育不平等的模式。從長遠來看,那些看起來很小的影響可能是有意義的。
在統(tǒng)計學層面,多基因評分能夠同我們已經(jīng)確信對研究社會不平等很重要的其他變量(如家庭收入)“競爭”,這改變了我對GWAS的價值的看法。知道一個名為rs11584700的SNP與在學校能夠多待兩天相關(guān),可能并不特別有價值。但如果一個多基因指數(shù)對受教育程度的影響大到這種程度——多基因得分最高的學生和得分最低的學生之間在受教育程度上的差距跟最富有的學生和最貧窮的學生之間的差距一樣大,那么這個多基因指數(shù)就是有價值的。正如我們在接下來的篇幅中將會看到的,這一進展為研究的可能性開辟了新的前景,并且勢如雪崩地帶來了大量新的闡釋性問題。
在接下來的章節(jié)中,我將逐一處理這些闡釋性問題。我將考慮這些多基因關(guān)聯(lián)是否是因果關(guān)系(第五章和第六章),基因影響像教育這樣復雜的事物的機制是什么(第七章),以及這些結(jié)果對我們改變?nèi)藗兘逃壽E的能力有什么影響(第八章)。
不過,在我們深入探討這些問題之前,讀者可能已經(jīng)注意到,我描述的這些研究都是用那些被認定為白人的樣本進行的。這些遺傳學研究告訴我們的,是在種族同質(zhì)化的人群內(nèi)部的個體差異狀況。與此同時,在教育結(jié)果或收入方面的一些最大差異,是在不同種族群體之間出現(xiàn)的。正如我在導言中提到的,如果認為我描述的遺傳學結(jié)論為我們提供了關(guān)于群體間差異原因的任何信息,那將是一個嚴重的錯誤。但是為什么?在下一章,我們將考慮這個問題。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.