4月17日上午,全球首個(gè)億量級(jí)草藥基因編碼天然多樣性成分庫(kù)(Gene-encoded Natural Diverse Components Repository, GNDC)在四川省成都市舉行的第三屆“千種本草基因組計(jì)劃”會(huì)議上發(fā)布。
全球首個(gè)億量級(jí)草藥基因編碼天然多樣性成分庫(kù)發(fā)布儀式。人民網(wǎng)記者 劉海天攝
據(jù)悉,GNDC基于全球八大權(quán)威藥典收錄的1037個(gè)藥用物種的核基因組、細(xì)胞器基因組等多維數(shù)據(jù),通過(guò)自主開(kāi)發(fā)的基因組遍歷算法結(jié)合轉(zhuǎn)錄組、小RNA測(cè)序、肽質(zhì)譜等多組學(xué)技術(shù)實(shí)現(xiàn)了對(duì)天然多樣性成分的挖掘與驗(yàn)證,并創(chuàng)新性整合自然語(yǔ)言處理、對(duì)抗生成網(wǎng)絡(luò)、圖卷積網(wǎng)絡(luò)等人工智能算法實(shí)現(xiàn)成分的識(shí)別、分類(lèi)與功能注釋。GNDC收錄了超過(guò)2.34億個(gè)基因直接或間接編碼的天然多樣性成分,包括232萬(wàn)個(gè)次生代謝產(chǎn)物、22977萬(wàn)條多肽、238萬(wàn)個(gè)小RNA和26萬(wàn)個(gè)碳水化合物。GNDC實(shí)現(xiàn)了基因組信息、成分信息與功能信息的整合,彌補(bǔ)了現(xiàn)有天然產(chǎn)物數(shù)據(jù)庫(kù)在數(shù)據(jù)類(lèi)型與功能解析方面的不足。作為目前全球規(guī)模最大的藥用天然成分庫(kù),GNDC將為藥物發(fā)現(xiàn)提供廣闊的“化學(xué)空間”,加速“大數(shù)據(jù)驅(qū)動(dòng)”模式下的藥物發(fā)現(xiàn)進(jìn)程。
中醫(yī)藥人工智能聯(lián)合實(shí)驗(yàn)室揭牌儀式。人民網(wǎng)記者 劉海天攝
據(jù)介紹,GNDC由成都中醫(yī)藥大學(xué)本草基因組學(xué)團(tuán)隊(duì)聯(lián)合現(xiàn)代中醫(yī)藥海河實(shí)驗(yàn)室、中國(guó)醫(yī)學(xué)科學(xué)院藥用植物研究所、東北林業(yè)大學(xué)、湖北時(shí)珍實(shí)驗(yàn)室等單位共同完成。
項(xiàng)目總負(fù)責(zé)人中國(guó)工程院院士、成都中醫(yī)藥大學(xué)首席教授陳士林指出:“GNDC實(shí)現(xiàn)了基因組數(shù)據(jù)與人工智能算法的深度融合,標(biāo)志著天然成分研究進(jìn)入智能化和精準(zhǔn)化的新階段。通過(guò)創(chuàng)新性整合多組學(xué)技術(shù)與人工智能方法,GNDC在天然多樣性成分的識(shí)別、分類(lèi)與功能注釋方面展現(xiàn)出了突破性優(yōu)勢(shì),將成為驅(qū)動(dòng)天然藥物研發(fā)范式變革、加速中藥現(xiàn)代化進(jìn)程的核心技術(shù)支撐?!保ㄓ浾邉⒑L欤?/p>