PNAS:有了基因組序列,預測外貌不再遠 |
發布時間:2017-09-07 20:52:16點擊次數: 作者:BioRadars |
根據人類的遺傳密碼來預測他們的外貌特征,這一直是科學家們的夢想。然而,從DNA聯想到外表的科學仍然是少得可憐。外貌特征可能是由數百個或數千個基因所塑造的,而每一個的影響都非常小。 如今,研究終于有了新進展。根據本周發表在《美國國家科學院院報》上的一項研究,在沒有其他信息的情況下,通過基因組序列數據預測的外貌特征可能足以分辨某個人。這項研究的通訊作者之一是著名科學家J. Craig Venter。 美國和新加坡的研究人員將1000多名個體的身體表型和全基因組序列數據相關聯,并借助一種新開發的算法,根據遺傳數據來預測生物特征。他們表示,這種算法可以預測大多數人的三維面部結構、種族、身高、體重及其他特征。 不過,這也涉及到基因組隱私的問題。“將基因組數據與表型測定相關聯,這項工作挑戰了目前基因組隱私的概念,”Craig Venter及其他作者寫道。“它將對個人隱私、知情同意、數據去識別,以及警察辦案產生重大的倫理和法律影響。” 在這項研究中,Venter及其同事以1,061名個體作為研究對象,其祖籍分別為非洲、歐洲、拉丁美洲、東南亞等地。首先,他們利用統計模型來研究全基因組序列與身體表型之間的關系,以預測三維面部結構、語音特征、生物學年齡、身高、體重、BMI指數、眼睛顏色、皮膚顏色、禿發或頭發顏色。 當研究人員在基因組序列(平均覆蓋度為30倍)上應用個體預測模型和綜合學習模型時,他們發現,遺傳上簡單的特征可以相當準確地預測,比如眼睛或皮膚的顏色。不過,其他特征也能慢慢理清。 例如,根據體細胞突變、性染色體嵌合的丟失以及端粒縮短,研究人員可以對個體的年齡進行估計。同時,他們也可以從基因組的SNP模式入手,對身高做出相對靠譜的預測,不過體重和BMI指數都比較棘手。基因組數據還實現了面部特征和聲音特征的預測,從而進一步提供年齡和祖先的線索。 根據這些,研究人員提出了一種整合預測信息的方法,并利用他們所謂的最大熵算法將其他人的基因組序列和表型相匹配。在隨機選擇的100人中,他們能夠根據基因組序列將人們分為10人的亞組,距離個體識別又近了一步。 作者指出,這些知識對法醫學可能很有用。不過,這些結果也帶來了如何正確使用和保護基因組序列的嚴重問題。為保護個人隱私,美國發布了健康保險攜帶和責任法案(HIPAA),以確保患者信息是去識別的,但基因組序列目前還不算識別數據。 “如果以不道德的目的開展研究,這種方法可能會損害那些將基因組貢獻給數據庫的個人的隱私,”Venter及其同事總結道。“盡管基因組數據的分享是非常有價值的,但我們的研究表明,基因組不能被認為是完全不可識別的,應通過適當的安全水平來分享。” |
上一篇:一口痰測肺癌:試劑盒已獲準生產,可與影像學檢測相互補充 下一篇:血液中的游離DNA——未來的“分子聽診器” |