您的位置: 首頁(yè) >科技 >

在測(cè)序數(shù)據(jù)中調(diào)用變體的工具是開(kāi)源的

2019-06-22 11:25:04 編輯: 來(lái)源:
導(dǎo)讀 由Google研究人員馬克·德普里斯托(Mark DePristo)和瑞恩·波普林(Ryan Poplin)創(chuàng)建的用于識(shí)別貓和狗圖像的人工智能在Google好奇號(hào)時(shí)代就

由Google研究人員馬克·德普里斯托(Mark DePristo)和瑞恩·波普林(Ryan Poplin)創(chuàng)建的用于識(shí)別貓和狗圖像的人工智能在Google好奇號(hào)時(shí)代就是如此。這是一年,現(xiàn)在他們正在使用技術(shù)尋找基因突變。

正如Will Knight在麻省理工學(xué)院技術(shù)評(píng)論中所寫(xiě)的那樣,他們?nèi)〉昧肆钊斯奈璧倪M(jìn)展,“了解編碼人類(lèi)生活的大量數(shù)據(jù)仍然是一項(xiàng)艱巨的挑戰(zhàn)。”

Megan Molteni,Wired,至少解讀了挑戰(zhàn)的本質(zhì),以便更多地了解我們的人類(lèi)謎題。“今天,你需要一勺吐痰和一百塊錢(qián)才能獲得你的DNA快照。但是全面了解你的基因組中所有30億個(gè)堿基對(duì) - 需要一個(gè)更加費(fèi)力的過(guò)程。一個(gè),即使是在復(fù)雜的統(tǒng)計(jì)數(shù)據(jù)的幫助下,科學(xué)家仍然在努力。“

DeepVariant是由Google Brain團(tuán)隊(duì)的研究人員開(kāi)發(fā)的,專(zhuān)注于人工智能技術(shù),而Verily則是專(zhuān)注于生命科學(xué)的Alphabet子公司。

它基于相同的神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像識(shí)別,但DeepVariant現(xiàn)在不僅僅是針對(duì)貓ID的頭條新聞,而是作為一種掃描遺傳密碼進(jìn)行突變的方法。DeepVariant已經(jīng)開(kāi)源了。DeepVariant的GitHub定義:“使用深度神經(jīng)網(wǎng)絡(luò)從下一代DNA測(cè)序數(shù)據(jù)中調(diào)用遺傳變異的分析管道。”

研究人員表示,這是一種深度學(xué)習(xí)技術(shù),其“比以前的傳統(tǒng)方法具有更高的準(zhǔn)確性”。

大眾機(jī)械師索菲•韋納(Sophie Weiner)表示,“識(shí)別基因突變比其他任何程序更好。”

FDA管理的2016年P(guān)recisionFDA真實(shí)挑戰(zhàn)評(píng)估了(當(dāng)時(shí))盲法評(píng)估樣本HG002的幾個(gè)社區(qū)提交的變體呼叫集。DeepVariant榮獲最高SNP表現(xiàn)獎(jiǎng)。

Weiner說(shuō),已經(jīng)知道的一個(gè)程序是算法GATK,它使用大量數(shù)據(jù)來(lái)試圖找出測(cè)序可能出錯(cuò)的地方。DeepVariant在技術(shù)上非常擅長(zhǎng)識(shí)別編碼錯(cuò)誤。

DeepVariant使用不同的方法來(lái)嘗試解決這些問(wèn)題:“它將數(shù)據(jù)轉(zhuǎn)換為圖像。由于Google的AI最初用于圖像識(shí)別,因此這種技術(shù)最終運(yùn)行良好。”

大西洋的莎拉·張(Sarah Zhang)向讀者介紹了DeepVariant發(fā)揮其魔力的方式,甚至對(duì)DNA測(cè)序機(jī)器一無(wú)所知。

“ 神經(jīng)網(wǎng)絡(luò)經(jīng)常被類(lèi)比為'神經(jīng)元'層,逐漸處理更復(fù)雜的概念 - 第一層可能響應(yīng)光,第二層形狀,第三層實(shí)際物體。由于DeepVariant采用數(shù)據(jù)訓(xùn)練,它可以了解哪些連接'神經(jīng)元需要加強(qiáng),哪些要被忽略。最終,它可以根據(jù)錯(cuò)誤對(duì)實(shí)際突變進(jìn)行排序。“

任務(wù)變成了視覺(jué)。張說(shuō):“字母-A,T,C或G-got分配了一個(gè)紅色值;該位置的測(cè)序質(zhì)量為綠色值; DNA的兩條鏈?zhǔn)撬{(lán)色值。一起,他們形成了一個(gè)RGB(紅色,綠色,藍(lán)色)圖像。“

DePristo在大西洋引用。“它極大地改變了這個(gè)問(wèn)題,從過(guò)分思考數(shù)據(jù)到尋找更多數(shù)據(jù)。”

奈特指出,它“自動(dòng)識(shí)別測(cè)序數(shù)據(jù)中的小插入和缺失突變以及單堿基對(duì)突變。”

GATK還有一件事就是DeepVariant作為解釋工具:速度。“該計(jì)劃的功能大約是GATK的一半,”韋納說(shuō)。

向前進(jìn)?“像DeepVariant這樣的程序可以利用其復(fù)雜的數(shù)據(jù)分析能力來(lái)預(yù)測(cè)突變的影響,預(yù)測(cè)哪些基因可能會(huì)激活,”Weiner說(shuō)。“這項(xiàng)技術(shù)的潛力是無(wú)限的,盡管我們?nèi)匀挥修k法趕上基因本身的復(fù)雜性。”

在12月4日的谷歌研究博客中,團(tuán)隊(duì)成員表示,DeepVariant作為開(kāi)源軟件的發(fā)布是為了加速使用這項(xiàng)技術(shù)解決實(shí)際問(wèn)題。

“為了實(shí)現(xiàn)這一目標(biāo),我們與Google云平臺(tái)(GCP)合作,在GCP上部署DeepVariant工作流程,這些工作流程采用可擴(kuò)展的GCP技術(shù)(如Pipelines API)針對(duì)低成本和快速周轉(zhuǎn)進(jìn)行了優(yōu)化配置。此配對(duì)版本提供一個(gè)平穩(wěn)的坡道,供用戶(hù)在當(dāng)前的計(jì)算環(huán)境中探索和評(píng)估DeepVariant的功能。“

他們表示,它還提供了一個(gè)可擴(kuò)展的基于云的解決方案,以滿(mǎn)足最大的基因組數(shù)據(jù)集的需求。


免責(zé)聲明:本文由用戶(hù)上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。