越來越多的學(xué)術(shù)界和工業(yè)界新藥開發(fā)組織、信息發(fā)現(xiàn)技術(shù)公司開始重視標(biāo)準(zhǔn)化多學(xué)科分子信息平臺的構(gòu)建。這種將化合物分子的化學(xué)信息,、生物信息和臨床信息集成并從中提取知識的技術(shù),可以大大提高新藥開發(fā)的效率,。國際上這方面的研究進(jìn)展值得國內(nèi)同行關(guān)注和學(xué)習(xí),。
瑞士Novartis生物技術(shù)研究院的分子信息平臺圍繞先導(dǎo)化合物發(fā)現(xiàn),提供計算方法的集成通道(integrated pipeline),,用于并結(jié)合化學(xué)信息學(xué),、生物信息學(xué)、對接和3D藥效團(tuán)分析的高通量計算機(jī)篩選,。四項核心活動是:1)分子多樣性管理(內(nèi)部組合化學(xué)和外部化合物獲得),;2)基于高通量對接和3D藥效團(tuán)搜索的計算機(jī)篩選;3)高通量篩選和圖表(profiling)數(shù)據(jù)的集成分析;4)計算機(jī)篩選中的數(shù)據(jù)庫管理和軟件工程,。分子多樣性管理:采用由Sandoz開發(fā)的Similog分子描述符相似度分析方法對MDDR數(shù)據(jù)庫進(jìn)行篩選,,涉及H鍵供體和受體、松散性,、陽電性等原子功能描述符,,Unity-2D指紋,2D拓?fù)涿枋龇?,ISIS public key count,,以及電荷狀態(tài)描述符。由經(jīng)典的配體數(shù)據(jù)庫系統(tǒng)MDDR,、WDI,、CMC、Ensemble等提供配體結(jié)構(gòu)信息,、治療信息和分子藥靶信息,。篩選庫包含若干類型的子集:已知的生物活性化合物、藥靶族聚焦庫(例如激酶,、蛋白質(zhì)分解酶等),、模擬肽、天然產(chǎn)物及其衍生物,、多樣性導(dǎo)向合成庫,,以便模仿天然產(chǎn)物的復(fù)雜結(jié)構(gòu)、骨架和立體化學(xué)多樣性,。該研究院擁有約500萬化合物和約4000骨架化學(xué)數(shù)據(jù)庫,,以及精選的供應(yīng)商目錄,。對每個錄入的化合物,將保存原始結(jié)構(gòu),,并通過數(shù)據(jù)通道化(pipelining)工具脫除所有溶劑和鹽碎片使結(jié)構(gòu)表達(dá)標(biāo)準(zhǔn)化,。通過定量構(gòu)效分析模型預(yù)測技術(shù)發(fā)現(xiàn)高通量篩選數(shù)據(jù)中的假陽性和陰性。在先導(dǎo)化合物發(fā)現(xiàn)中使用高通量對接進(jìn)行活性計算定位掃描試驗,,以提高吸收,、分布、代謝,、排泄(ADME)特性,。以蛋白酶藥靶為例,通過取代位置商業(yè)試劑與骨架的緊密結(jié)合,,構(gòu)造了10000個化合物的虛擬庫,。最后選出了20個化合物進(jìn)行合成,其中4個被證明是有活性的,,而其中最具活性的化合物被確定為先導(dǎo)化合物,。該平臺采用Pipeline Pilot Software SciTegicTM軟件通過計算步驟的分支網(wǎng)絡(luò)實現(xiàn)藥物開發(fā)過程中的數(shù)據(jù)流分析和管理。
成立于1999年的英國De Novo Pharmaceuticals公司是一個脫胎于劍橋大學(xué)藥理系藥物設(shè)計小組的獨(dú)立公司,,開展如下藥物設(shè)計合作:根據(jù)客戶提供的藥靶迅速給出能夠與靶點(diǎn)活性部位結(jié)合的數(shù)千分子,,結(jié)合醫(yī)學(xué)化學(xué)減少結(jié)構(gòu)數(shù)量。然后通過組合化學(xué),、構(gòu)效關(guān)系篩選,,反復(fù)進(jìn)行設(shè)計合成與試驗,從而快速得到先導(dǎo)化合物,。該公司技術(shù)包括基于配體設(shè)計(柔性匹配)Quasi2™,、基于結(jié)構(gòu)的設(shè)計(位點(diǎn)分析)SiteExplorer™、結(jié)構(gòu)生成(可能的分子結(jié)構(gòu))SkelGen™,、庫設(shè)計(骨架選擇)LibMaker™和分子對接(虛擬篩選)EasyDock,。化學(xué)結(jié)構(gòu)生成程序Skelgen™通過算法產(chǎn)生可能的分子結(jié)構(gòu),,通過殘基選擇進(jìn)行優(yōu)化,,然后以蛋白質(zhì)活性位點(diǎn)的分子骨架為中心設(shè)計聚焦型組合庫。在已知結(jié)合小凹約束內(nèi)進(jìn)行分子碎片拼接,。在虛擬化學(xué)合成考慮了H鍵,、親油性、靜電和空間位阻參數(shù)等物理化學(xué)性質(zhì),,設(shè)計時共應(yīng)用了21項因子,。2003年De Novo與Roche公司合作開發(fā)的Skelgen Ⅱ™包含了合成化學(xué)的know-how。LibMaker™提供根據(jù)生成策略提供一系列分子骨架,,供化學(xué)家選定將要修飾和開發(fā)focused化學(xué)庫的那些骨架,。
PharmaDM公司是一家藥物發(fā)現(xiàn)分析解決方案的全球供應(yīng)商,。該公司的數(shù)據(jù)挖掘技術(shù)使新藥研發(fā)者能夠通過統(tǒng)一的平臺(關(guān)系數(shù)據(jù)挖掘軟件DMax™)從生物、化學(xué)和臨床數(shù)據(jù)信息中提取知識,,縮短藥物開發(fā)全過程,、優(yōu)化藥物產(chǎn)品線,。數(shù)據(jù)提取方式有:分類,、回歸、聚類,、概述,、頻繁模式發(fā)掘和可視化。應(yīng)用領(lǐng)域:藥靶確證,、更好地理解基因表達(dá)譜,、基因功能預(yù)測、分子構(gòu)效關(guān)系預(yù)測,、先導(dǎo)分子優(yōu)化(生物利用度,、分布等)、毒性預(yù)測,、化學(xué)合成路線優(yōu)化和抗原決定位鑒別,。DMax™軟件包含關(guān)系數(shù)據(jù)挖掘、決策樹,、數(shù)據(jù)立方體三個部分,。優(yōu)點(diǎn)是:避免數(shù)據(jù)縮減、完全集成分析,、將圖像和文本轉(zhuǎn)化成可以挖掘的格式,、數(shù)據(jù)生成和數(shù)據(jù)分析閉環(huán)。關(guān)系數(shù)據(jù)挖掘技術(shù)以原始的天然數(shù)據(jù)為輸入值(傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)將輸入數(shù)據(jù)縮減為描述符列表,,PharmaDM將挖掘技術(shù)應(yīng)用于原始數(shù)據(jù)庫并自動生成復(fù)合描述符),,從數(shù)據(jù)中提取綜合知識而不是簡單的數(shù)學(xué)方程(提取模型可以是相當(dāng)復(fù)雜的英語邏輯規(guī)則,科學(xué)家無需掌握計算機(jī)語言),,還可以通過背景信息補(bǔ)充知識,。