2020年10月12日 訊 /生物谷BIOON/ --日前,,一篇發(fā)表在國際雜志GigaScience上的研究報告中,,來自澳大利亞聯(lián)邦科學(xué)與工業(yè)研究組織(CSIRO)等機(jī)構(gòu)的科學(xué)家們在世界上首次通過利用基于人工智能技術(shù)的VariantSpark平臺來處理一萬億個基因組數(shù)據(jù),該平臺還能幫助鎖定人類基因組中特定疾病致病基因的具體位點(diǎn),。
圖片來源:CC0 Public Domain
人類基因組是一個完整的DNA集合,其包含超過30億個DNA堿基對,研究者表示,,通過分析大規(guī)模的基因組數(shù)據(jù)庫,人工智能(AI)要比傳統(tǒng)方法在更短的時間內(nèi)對多種復(fù)雜疾病進(jìn)行更加深入地分析,,VariantSpark平臺能分析諸如疾病和易感性等特性,,從而揭示誘發(fā)疾病的具體基因;這或許就能在分子水平上提供關(guān)于疾病發(fā)病機(jī)制的重要信息,,以便后期開發(fā)新型靶向性療法,,VariantSpark平臺目前已經(jīng)被用來識別與心血管疾病、運(yùn)動神經(jīng)元疾病,、癡呆癥及阿爾茲海默病相關(guān)的致病基因了,。
這項(xiàng)研究中,研究人員分析了一個由亞馬遜網(wǎng)絡(luò)服務(wù)機(jī)構(gòu)支持的10萬人的綜合數(shù)據(jù)庫,,研究者Bauer博士指出,,目前并沒有其它技術(shù)能夠同時處理1萬億個基因組數(shù)據(jù)點(diǎn)、超過1000萬個基因突變和10萬個樣本,。本文研究結(jié)果表明,,VariantSpark平臺是唯一一種平臺/方法,其能在可控的時間范圍內(nèi)對超高維的基因組數(shù)據(jù)進(jìn)行分析,,該平臺能在15小時內(nèi)處理這些信息,,而其目前最快的競爭對手也可能需要10年多的時間才能處理這么多的數(shù)據(jù),這是一個非常重要的里程碑,,其意味著,,VariantSpark平臺能夠擴(kuò)大規(guī)模來分析基于人口水平的數(shù)據(jù)庫從而推動更好的醫(yī)療護(hù)理結(jié)果。
研究者Hansen表示,,人工智能技術(shù)是理解基因組信息的關(guān)鍵組成部分,,目前在澳大利亞乃至全球各地,人工智能已經(jīng)被越來越多地用于指導(dǎo)當(dāng)?shù)氐尼t(yī)療保健服務(wù),。盡管近年來全基因組測序研究取得了突飛猛進(jìn)的成果,,但研究者對復(fù)雜疾病的分子和遺傳起源仍然并不清楚,這就是的科學(xué)家們難以進(jìn)行疾病的預(yù)測,、合適預(yù)防性措施和個體化療法的開發(fā)面臨一定的困難,。
VariantSpark平臺是世界上首個基于機(jī)器學(xué)習(xí)的健康產(chǎn)品,未來其或能幫助全球的科學(xué)家們獲取重要的人類基因組學(xué)數(shù)據(jù),,從而幫助開發(fā)治療多種疾病的療法,,并加速相關(guān)疾病的研究進(jìn)展,。(生物谷Bioon.com)
原始出處:
Arash Bayat, Piotr Szul, Aidan R O’Brien, et al. VariantSpark: Cloud-based machine learning for association study of complex phenotype and large-scale genomic data, GigaScience (2020). DOI:10.1093/gigascience/giaa077
(潤寶醫(yī)療網(wǎng))