利用來(lái)自在線(xiàn)家譜網(wǎng)站的數據,一個(gè)著(zhù)名的"基因黑客"創(chuàng )建了可能是迄今為止最大的家譜.這一團隊如今計劃利用這些數據--包括一個(gè)能夠回溯到15世紀的由1300萬(wàn)名個(gè)體構成的超級譜系--分析復雜基因特質(zhì)的遺傳,例如壽命和面部特征.
除了為全世界最大的家庭團聚提供邀請名單之外,由計算生物學(xué)家Yaniv Erlich在于波士頓召開(kāi)的美國人類(lèi)遺傳學(xué)會(huì )年會(huì )上公布的這一研究成果,還能夠為了解基因對于某種特質(zhì)的貢獻到達了何種程度提供一件新工具.其他研究人員將能夠使用這一譜系,但Erlich及其馬薩諸塞州劍橋市白頭研究所的團隊為了保護隱私,已將這些數據的"名字"抹去.
并未參與該項研究的芝加哥大學(xué)人類(lèi)遺傳學(xué)家Nancy Cox指出,家譜本身的結構能夠提供關(guān)于人口統計學(xué)和人口擴張的有趣信息.但她認為,更有趣的可能性是,隨著(zhù)更多的人擁有了自己的基因組序列并將這些信息存放于公共數據庫,這樣的數具有朝一日能夠與醫療信息或DNA序列數據聯(lián)系起來(lái).
"對于這些譜系能夠告訴我們什么,科學(xué)家事實(shí)上剛剛知道些皮毛."Cox說(shuō).
家譜能夠提供有關(guān)基因遺傳的線(xiàn)索.例如,通過(guò)將個(gè)體與家譜中的遠親進(jìn)行比較,一個(gè)給定特質(zhì)(例如生育能力)的頻率變化便可以顯示出這一特質(zhì)在多大程度上起源于遺傳學(xué).它還能夠提供其他一些線(xiàn)索,例如一些特質(zhì)是由具有較大影響的較少基因控制,還是由具有較小影響的許多基因所掌握.
然而Erlich在此次會(huì )議上表示,僅僅是幾千人的家譜也需要數年的時(shí)間用于組裝譜系數據.在過(guò)去,研究人員精心從教堂記錄和個(gè)人志愿者那里收集這些數據.而Erlich及其研究團隊決定從家譜網(wǎng)站geni.com上超過(guò)4300萬(wàn)個(gè)個(gè)人檔案中采集數據,從而使這一過(guò)程合理化.這些檔案通常包括生卒日期,以及居所,偶爾會(huì )有用戶(hù)上傳的照片.
該研究團隊將規模從幾千人到1300萬(wàn)人的數據導入家譜.Erlich表示,之前可供遺傳研究使用的譜系最好的也就包含有幾十萬(wàn)個(gè)家庭成員.
鹽湖城猶他大學(xué)的遺傳學(xué)家Lisa Cannon-Albright敦促要謹慎使用自我報告的譜系數據.她曾廣泛地參與一家關(guān)聯(lián)了一些醫療信息的大型猶他州譜系數據庫的工作."每個(gè)人都想將自己的家庭回溯至皇室."她說(shuō),"對于那些大型的譜系,我們只是不相信它們能夠超越某一個(gè)時(shí)間節點(diǎn)."Cannon-Albright說(shuō),她將自己的數據從1500年切斷.
Cannon-Albright強調,最終,一個(gè)譜系的價(jià)值在于你能夠利用到的信息.在本次會(huì )議上,Cannon-Albright提交的一份來(lái)自猶他數據庫的數據表明,只能由父親傳給兒子的Y染色體能夠攜帶前列腺癌的危險因素.她最近還發(fā)起了一個(gè)新的項目,將譜系數據與來(lái)自聯(lián)邦退伍軍人健康管理局的醫療記錄聯(lián)系起來(lái).
迄今為止,尚不清楚由Erlich及其團隊建立的巨大家譜到底能產(chǎn)生多大的作用.一些科學(xué)家在此次會(huì )議上對該項目表示出極大的熱情,但苦于無(wú)法拿出一個(gè)使用這些數據的特定試驗.
但冰島雷克雅未克市遺傳學(xué)公司deCODE的創(chuàng )始人Kári Stefánsson卻堅信家譜分析在未來(lái)的遺傳學(xué)研究中將扮演一個(gè)重要的角色."人們將越來(lái)越愿意貢獻他們的數據和醫療記錄."他說(shuō),"這是一個(gè)令人興奮的可能性."