“測序技術(shù)抓住了生命科學(xué)技術(shù)的龍頭,基因組測序成本從最初的3000萬美元下降到1000美元甚至更低,使得每個人都可能為自己進(jìn)行基因組測序,這將加速生命數(shù)字化的進(jìn)程。”6月21日,2019測序技術(shù)和應(yīng)用高峰論壇上,中國科學(xué)院院士楊煥明表示,在高通量測序技術(shù)自主化的基礎(chǔ)上,不斷有新的“黑科技”跟進(jìn),這使得人們將獲得更加準(zhǔn)確的基因序列,作為生命數(shù)字化的“藍(lán)本”。
吐口唾液就能測序,但基因組序列不完整
吐口唾液郵寄,一個人的基因組序列就會得到分析。
“目前從全世界范圍來講,大概有接近2000萬人有自己的基因信息。”華大智造首席運(yùn)營官蔣慧表示,隨著這些年測序技術(shù)的普及,測序的門檻越來越低,人們越來越容易對自己的基因進(jìn)行部分測序。
但并不是所有的測序都是獲得完整的基因組序列。蔣慧介紹,大部分此類的測序是對特定區(qū)域的測序,而并不是整個基因組序列的測序。
如果將一個人的基因組比喻成一座奇峰險(xiǎn)峻的高山,可以理解為,有些測序只是拍攝了“一線天”“巨石陣”“黑龍?zhí)?rdquo;這些有代表性的景點(diǎn);更完整地是,有些測序是把所有的景點(diǎn)拍下來,被稱為“功能基因集”;而完整的基因組測序才是把高山全部拍下來,包括像荒草一樣叢生的“沙漠基因”或者“無功能基因”等。
無疑,要實(shí)現(xiàn)生命數(shù)字化,需要的是把高山全部拍下來的完整的基因組測序。
但目前的測序,即便是基因組測序,仍舊不能滿足生命數(shù)字化的需要。“目前無論是數(shù)據(jù)庫構(gòu)建,還是群體研究、疾病研究,都是采用重測序的方式,是通過與參考基因組的比對獲得的,而不是從頭組裝。”蔣慧說,比如在炎黃基因組研究項(xiàng)目中,科學(xué)家找到了大概有4—5兆的區(qū)域是個體所特有的,進(jìn)行測序時(shí)就對個體區(qū)域比對,形成測序數(shù)據(jù),這是受測序效率制約的。
可以理解為,每一座高山的形狀、代表性景點(diǎn)都相似,就先找了最具代表性的山做個詳細(xì)的“數(shù)字化解讀”,描述其他山的時(shí)候,就用差異來體現(xiàn)。
“或許每個人擁有屬于自己的特點(diǎn)序列,但目前的測序方式難以發(fā)現(xiàn)這些獨(dú)特部分。”蔣慧說,與參考基因組比較獲得的基因組測序“密碼”不會對這些未知謎題給出答案。
從頭組裝,完成整個基因鏈條的拼接
數(shù)字化生命實(shí)際上需要一個高清、完整的基因組作為“藍(lán)本”。這意味著需要高質(zhì)量地從頭組裝基因組。
“目前最大的難點(diǎn)是獲得盡可能長的序列進(jìn)行組裝。”蔣慧說。如果單次測序讀長變長,那么獲得從頭組裝基因組的難度就會降低。
人類基因組長度為30億個堿基對,而現(xiàn)在單次測序的讀長僅為50—70kb(5萬到7萬個堿基對的長度),這猶如拼一副45000塊拼圖,其中卻有很多重復(fù)相似的“小塊”,很難拼接完整。不僅需要以參考基因組做對比,還要反復(fù)測序。“目前的行業(yè)標(biāo)準(zhǔn)是需要30倍的重復(fù)測序,以完成整個基因鏈條的拼接。”蔣慧說。
如果將短片段加上標(biāo)簽就不一樣了。玩過拼圖的人都知道,在成千塊的拼圖背面會有不同的區(qū)塊標(biāo)記,提示這些塊在同一區(qū)域。
“以專有DNA分子共標(biāo)簽技術(shù)為基礎(chǔ)的stLFR(單管長片段)技術(shù)就是基于這樣的原理。”蔣慧說,華大智造的這一自主技術(shù)通過將來源于同一DNA長片段的短讀長測序片段標(biāo)記上相同分子標(biāo)簽,能夠基于高精度短讀長測序獲取長片段的DNA信息。
讀長是為了確定他山之石的位置,如果標(biāo)簽可以解決定位問題,將彌補(bǔ)短讀長的弱點(diǎn)。基于此,從頭組裝兩條染色體,獲取二倍體測序數(shù)據(jù)也成為可能。
與此同時(shí),華大智造將執(zhí)行能得到從頭測序基因組的“676”標(biāo)準(zhǔn)?;谶@些數(shù)據(jù),可以檢測所有類型的結(jié)構(gòu)變異,且無需與參考基因組進(jìn)行比對,將大大提高基因組數(shù)據(jù)的參考性,最終幫助個體進(jìn)行復(fù)雜疾病的診斷和預(yù)測。
蔣慧介紹:“我們首先會用新的技術(shù)、新的標(biāo)準(zhǔn)在全球完成1000個人的基因組測序,希望可以建出來一個模板讓大家先試用一下,以在不同人群中創(chuàng)建高質(zhì)量的參考基因組和更為完整的人類基因組多樣性數(shù)據(jù)庫,構(gòu)建一個全新的數(shù)據(jù)集。這些數(shù)據(jù)將免費(fèi)向研究人員開放。”
解讀生命,別忘了體內(nèi)的微生物
2018年,《自然》發(fā)表了一篇“為了生孩子把貓狗扔掉”的報(bào)道,成為科普文章的爆款。文中顯示,加拿大科學(xué)家研究了770個嬰兒的腸道菌群,發(fā)現(xiàn)家中有寵物的嬰兒,其腸道菌群多樣性明顯高于家中沒有寵物的嬰兒;瑞典調(diào)研100多萬兒童發(fā)現(xiàn),與狗狗生活在一起的小孩子得哮喘病的風(fēng)險(xiǎn)能降低13%。
人體是一個龐大的共生體。人體皮膚表面、口腔、呼吸道、腸道生存著大量微生物,它們的數(shù)量是人體本身細(xì)胞的數(shù)十倍,編碼的基因是人體基因的100倍。每個人的經(jīng)歷會以微生物的痕跡留在身體里,而人體的健康會與體內(nèi)的菌群休戚與共。人們將特定環(huán)境中包括微生物在內(nèi)的總DNA稱為宏基因組。
數(shù)字化生命中,人體與微生物的作用和關(guān)聯(lián)如果得到客觀地反映,甚至可能反映生命的進(jìn)程。例如,老年人腸道內(nèi)變形菌門、黏膠球形菌門、擬桿菌屬等含量會降低。“為此,我們在與瑞典卡洛林斯卡醫(yī)學(xué)院的微生物轉(zhuǎn)化醫(yī)學(xué)研究中心做了一個合作,啟動了萬人微生物研究項(xiàng)目,將對一萬人的宏基因組進(jìn)行測序。”蔣慧說,“微生物是人體內(nèi)另外一套基因組,除開自己的基因組之外,我們的身體就像一個小社會,大家平時(shí)和環(huán)境做一些接觸、吃的各種東西,人體內(nèi)的病原或者微生物都會反映出來。”
依據(jù)計(jì)劃,萬人宏基因組測序?qū)⒃?個月內(nèi)完成。卡洛林斯卡醫(yī)學(xué)院之前已經(jīng)收集了大量的樣本,華大智造將負(fù)責(zé)完成數(shù)據(jù)產(chǎn)出,以及產(chǎn)出后的數(shù)據(jù)分析和疾病關(guān)聯(lián)的工作。
DNA是本源,但還需其他參數(shù)
未來,數(shù)字化生命還有很多基礎(chǔ)性工作要做,比如要了解基因和表型是什么關(guān)系,構(gòu)建模型以研究生活習(xí)慣、疾病與特定基因表達(dá)的相互關(guān)系……
但歸根結(jié)底,遺傳性的DNA信息是不會再改變的,它不像其他一些因素,比如人體內(nèi)的一些微生物會隨著環(huán)境、飲食發(fā)生一些變化。最源頭的遺傳,來自于父親和母親的基因組不會再變化,是一個本源核心的東西。“華大集團(tuán)有一個非常宏大的計(jì)劃叫做8B(80億人的高清基因測序),我們希望在未來通過努力讓每個人都有自己的基因組數(shù)據(jù)。”蔣慧說。
“這些需要一步一步去實(shí)現(xiàn),DNA是本源、是核心,但我們還會有很多其他的生命數(shù)據(jù),包括蛋白、代謝等。”蔣慧說,除了基因組數(shù)據(jù),還可以加入很多現(xiàn)有的醫(yī)學(xué)資料,例如體檢時(shí)的血液常規(guī)性篩查,可穿戴設(shè)備上的數(shù)據(jù)等,把這些所有的數(shù)據(jù)收集起來,逐步完成生命數(shù)字化的過程。(張佳星)
近日,蘭博基尼汽車有限公司宣布Urus車型在國內(nèi)正式上市,該車型搭載了4 0L V8雙渦輪增壓發(fā)動機(jī),使其0-100km h加速時(shí)間僅需3 6s,而最高更多
2018-01-08 15:23:45