越來(lái)越多的學(xué)術(shù)界和工業(yè)界新藥開(kāi)發(fā)組織,、信息發(fā)現(xiàn)技術(shù)公司開(kāi)始重視標(biāo)準(zhǔn)化多學(xué)科分子信息平臺(tái)的構(gòu)建,。這種將化合物分子的化學(xué)信息,、生物信息和臨床信息集成并從中提取知識(shí)的技術(shù),,可以大大提高新藥開(kāi)發(fā)的效率,。國(guó)際上這方面的研究進(jìn)展值得國(guó)內(nèi)同行關(guān)注和學(xué)習(xí),。
瑞士Novartis生物技術(shù)研究院的分子信息平臺(tái)圍繞先導(dǎo)化合物發(fā)現(xiàn),,提供計(jì)算方法的集成通道(integrated pipeline),,用于并結(jié)合化學(xué)信息學(xué)、生物信息學(xué),、對(duì)接和3D藥效團(tuán)分析的高通量計(jì)算機(jī)篩選,。四項(xiàng)核心活動(dòng)是:1)分子多樣性管理(內(nèi)部組合化學(xué)和外部化合物獲得);2)基于高通量對(duì)接和3D藥效團(tuán)搜索的計(jì)算機(jī)篩選;3)高通量篩選和圖表(profiling)數(shù)據(jù)的集成分析,;4)計(jì)算機(jī)篩選中的數(shù)據(jù)庫(kù)管理和軟件工程,。分子多樣性管理:采用由Sandoz開(kāi)發(fā)的Similog分子描述符相似度分析方法對(duì)MDDR數(shù)據(jù)庫(kù)進(jìn)行篩選,涉及H鍵供體和受體,、松散性,、陽(yáng)電性等原子功能描述符,Unity-2D指紋,,2D拓?fù)涿枋龇?,ISIS public key count,以及電荷狀態(tài)描述符,。由經(jīng)典的配體數(shù)據(jù)庫(kù)系統(tǒng)MDDR,、WDI、CMC,、Ensemble等提供配體結(jié)構(gòu)信息,、治療信息和分子藥靶信息。篩選庫(kù)包含若干類型的子集:已知的生物活性化合物,、藥靶族聚焦庫(kù)(例如激酶,、蛋白質(zhì)分解酶等)、模擬肽,、天然產(chǎn)物及其衍生物,、多樣性導(dǎo)向合成庫(kù),以便模仿天然產(chǎn)物的復(fù)雜結(jié)構(gòu),、骨架和立體化學(xué)多樣性,。該研究院擁有約500萬(wàn)化合物和約4000骨架化學(xué)數(shù)據(jù)庫(kù),,以及精選的供應(yīng)商目錄。對(duì)每個(gè)錄入的化合物,,將保存原始結(jié)構(gòu),,并通過(guò)數(shù)據(jù)通道化(pipelining)工具脫除所有溶劑和鹽碎片使結(jié)構(gòu)表達(dá)標(biāo)準(zhǔn)化。通過(guò)定量構(gòu)效分析模型預(yù)測(cè)技術(shù)發(fā)現(xiàn)高通量篩選數(shù)據(jù)中的假陽(yáng)性和陰性,。在先導(dǎo)化合物發(fā)現(xiàn)中使用高通量對(duì)接進(jìn)行活性計(jì)算定位掃描試驗(yàn),,以提高吸收、分布,、代謝,、排泄(ADME)特性。以蛋白酶藥靶為例,,通過(guò)取代位置商業(yè)試劑與骨架的緊密結(jié)合,,構(gòu)造了10000個(gè)化合物的虛擬庫(kù)。最后選出了20個(gè)化合物進(jìn)行合成,,其中4個(gè)被證明是有活性的,,而其中最具活性的化合物被確定為先導(dǎo)化合物。該平臺(tái)采用Pipeline Pilot Software SciTegicTM軟件通過(guò)計(jì)算步驟的分支網(wǎng)絡(luò)實(shí)現(xiàn)藥物開(kāi)發(fā)過(guò)程中的數(shù)據(jù)流分析和管理,。
成立于1999年的英國(guó)De Novo Pharmaceuticals公司是一個(gè)脫胎于劍橋大學(xué)藥理系藥物設(shè)計(jì)小組的獨(dú)立公司,,開(kāi)展如下藥物設(shè)計(jì)合作:根據(jù)客戶提供的藥靶迅速給出能夠與靶點(diǎn)活性部位結(jié)合的數(shù)千分子,結(jié)合醫(yī)學(xué)化學(xué)減少結(jié)構(gòu)數(shù)量,。然后通過(guò)組合化學(xué),、構(gòu)效關(guān)系篩選,反復(fù)進(jìn)行設(shè)計(jì)合成與試驗(yàn),,從而快速得到先導(dǎo)化合物,。該公司技術(shù)包括基于配體設(shè)計(jì)(柔性匹配)Quasi2™、基于結(jié)構(gòu)的設(shè)計(jì)(位點(diǎn)分析)SiteExplorer™,、結(jié)構(gòu)生成(可能的分子結(jié)構(gòu))SkelGen™,、庫(kù)設(shè)計(jì)(骨架選擇)LibMaker™和分子對(duì)接(虛擬篩選)EasyDock?;瘜W(xué)結(jié)構(gòu)生成程序Skelgen™通過(guò)算法產(chǎn)生可能的分子結(jié)構(gòu),,通過(guò)殘基選擇進(jìn)行優(yōu)化,然后以蛋白質(zhì)活性位點(diǎn)的分子骨架為中心設(shè)計(jì)聚焦型組合庫(kù),。在已知結(jié)合小凹約束內(nèi)進(jìn)行分子碎片拼接,。在虛擬化學(xué)合成考慮了H鍵,、親油性,、靜電和空間位阻參數(shù)等物理化學(xué)性質(zhì),設(shè)計(jì)時(shí)共應(yīng)用了21項(xiàng)因子,。2003年De Novo與Roche公司合作開(kāi)發(fā)的Skelgen Ⅱ™包含了合成化學(xué)的know-how,。LibMaker™提供根據(jù)生成策略提供一系列分子骨架,,供化學(xué)家選定將要修飾和開(kāi)發(fā)focused化學(xué)庫(kù)的那些骨架。
PharmaDM公司是一家藥物發(fā)現(xiàn)分析解決方案的全球供應(yīng)商,。該公司的數(shù)據(jù)挖掘技術(shù)使新藥研發(fā)者能夠通過(guò)統(tǒng)一的平臺(tái)(關(guān)系數(shù)據(jù)挖掘軟件DMax™)從生物,、化學(xué)和臨床數(shù)據(jù)信息中提取知識(shí),縮短藥物開(kāi)發(fā)全過(guò)程,、優(yōu)化藥物產(chǎn)品線,。數(shù)據(jù)提取方式有:分類、回歸,、聚類,、概述、頻繁模式發(fā)掘和可視化,。應(yīng)用領(lǐng)域:藥靶確證,、更好地理解基因表達(dá)譜、基因功能預(yù)測(cè),、分子構(gòu)效關(guān)系預(yù)測(cè),、先導(dǎo)分子優(yōu)化(生物利用度、分布等),、毒性預(yù)測(cè),、化學(xué)合成路線優(yōu)化和抗原決定位鑒別。DMax™軟件包含關(guān)系數(shù)據(jù)挖掘,、決策樹(shù),、數(shù)據(jù)立方體三個(gè)部分。優(yōu)點(diǎn)是:避免數(shù)據(jù)縮減,、完全集成分析,、將圖像和文本轉(zhuǎn)化成可以挖掘的格式、數(shù)據(jù)生成和數(shù)據(jù)分析閉環(huán),。關(guān)系數(shù)據(jù)挖掘技術(shù)以原始的天然數(shù)據(jù)為輸入值(傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)將輸入數(shù)據(jù)縮減為描述符列表,,PharmaDM將挖掘技術(shù)應(yīng)用于原始數(shù)據(jù)庫(kù)并自動(dòng)生成復(fù)合描述符),從數(shù)據(jù)中提取綜合知識(shí)而不是簡(jiǎn)單的數(shù)學(xué)方程(提取模型可以是相當(dāng)復(fù)雜的英語(yǔ)邏輯規(guī)則,,科學(xué)家無(wú)需掌握計(jì)算機(jī)語(yǔ)言),,還可以通過(guò)背景信息補(bǔ)充知識(shí)。