深圳子科生物報道:
世居高原的藏族人群對低氧環(huán)境的適應(yīng)是人類適應(yīng)性進(jìn)化的典型例子,一直以來受到廣泛的關(guān)注。以往對于藏族高原適應(yīng)的遺傳分析主要集中在基于二代短讀長測序數(shù)據(jù)的單核苷酸變異位點(Single Nucleotide Variants, SNVs)的研究,且發(fā)現(xiàn)了兩個與藏族高原適應(yīng)相關(guān)的關(guān)鍵基因EPAS1和EGLN1,解釋了藏族人群較低血紅蛋白濃度這一適應(yīng)表型。
然而,除了血紅蛋白濃度,藏族其他的高原適應(yīng)特征(比如較高的通氣量、較低的肺動脈壓等)還不能被SNVs解釋。*,基因組上的大尺度結(jié)構(gòu)變異(Structural Variants,SVs)可能影響染色質(zhì)空間結(jié)構(gòu)及基因的表達(dá)調(diào)控,與疾病和進(jìn)化表型也可能相關(guān),但藏族人群基因組中的SVs對高原適應(yīng)是否有貢獻(xiàn)僅有EPAS1基因下游一個大片段缺失的一例報道,缺乏對全基因組水平SVs的系統(tǒng)研究。
中國科學(xué)院昆明動物研究所宿兵課題組、西藏大學(xué)歐珠羅布教授與崔超英教授課題組與上海營養(yǎng)與健康研究所徐書華教授課題組、青海省高原醫(yī)學(xué)科學(xué)研究院吳天一教授課題組等經(jīng)過兩年多聯(lián)合攻關(guān),完成了藏族人群高原適應(yīng)研究的又一階段性成果,旨在利用長片段基因組數(shù)據(jù)從頭組裝藏族人群的高質(zhì)量參考基因組,以期解析藏族人群基因組中的大片段結(jié)構(gòu)變異對高原低氧環(huán)境的遺傳貢獻(xiàn)。
這一成果公布在10月《國家科學(xué)評論》雜志上,這是個藏族人群高質(zhì)量參考基因組?! ?/p>
為了系統(tǒng)解析藏族人群全基因組SVs,中科院昆明動物所宿兵教授、西藏大學(xué)歐珠羅布教授、上海營養(yǎng)與健康研究所徐書華教授和青海省高原醫(yī)學(xué)科學(xué)研究院吳天一院士等合作,利用三代長讀長測序技術(shù)以及多種輔助組裝技術(shù),從頭組裝了一個高質(zhì)量的藏族人參考基因組(珠峰1號,ZF1)。
相比于目前已有的人類參考基因組,ZF1具有更好的序列連續(xù)性和完整性。利用該基因組,研究人員找到了17,900個ZF1中發(fā)生的 SVs,其中6,505個是ZF1有別于其他兩個東亞人(HX1和AK1)的SVs。功能富集分析發(fā)現(xiàn)這些ZF1*的SVs相關(guān)基因的功能顯著富集在一個重要的低氧通路——GTPase活性調(diào)控通路上。通過進(jìn)一步的群體分析,研究人員發(fā)現(xiàn)了一個發(fā)生在MKL1基因內(nèi)含子上的163bp缺失,這個缺失在藏族和漢族群體中表現(xiàn)出顯著的頻率差異,且該缺失與藏族較低的肺動脈壓顯著相關(guān)。
另外,研究人員系統(tǒng)評估了藏族基因組中與古人類(尼安德特人和丹尼索瓦人)共享的基因片段,發(fā)現(xiàn)ZF1相比于其他東亞個體的基因組有更高的共享片段比例(1.32%-1.53%)。其中一個典型的例子是發(fā)生在SCUBE2基因內(nèi)含子上一個662bp的插入,分析發(fā)現(xiàn)該插入在藏族中富集并與藏族的肺功能顯著相關(guān)。
這一基因組是個利用長片段序列從頭組裝的藏族人群的高質(zhì)量參考基因組,并利用該基因組系統(tǒng)解析了藏族人群全基因組水平的結(jié)構(gòu)變異元件數(shù)據(jù)集,將會為今后藏族高原適應(yīng)的醫(yī)學(xué)和進(jìn)化研究提供重要的基礎(chǔ)數(shù)據(jù)資源。
原文標(biāo)題:
De novo assembly of a Tibetan genome and identification of novel structural variants associated with high altitude adaptation