
新藥研發(fā)平臺(tái)37問(wèn)
一、云平臺(tái)支持哪些CADD/AIDD場(chǎng)景?
二、云平臺(tái)支持哪些應(yīng)用?支持自定義工作流嗎?
三、對(duì)CADD/AIDD研發(fā)部門(mén)來(lái)說(shuō),有哪些好處?
四、對(duì)IT部門(mén)來(lái)說(shuō),有哪些好處?
一、云平臺(tái)支持哪些CADD/AIDD場(chǎng)景?
1、如何支持AIDD場(chǎng)景?
在AIDD方面,我們支持AlphaFold、RoseTTAFold等常用AI框架所需資料和快速環(huán)境的搭建,并支持更多組件按需集成。

2、平臺(tái)支持分子對(duì)接嗎?支持基因測(cè)序嗎?還支持哪些CADD場(chǎng)景?平臺(tái)可支持CADD中典型場(chǎng)景分子動(dòng)力學(xué)模擬、分子對(duì)接、虛擬篩選等,并支持單細(xì)胞測(cè)序、全基因測(cè)序場(chǎng)景。
3、蛋白與蛋白docking可以在平臺(tái)中運(yùn)行嗎?DOCK發(fā)展到現(xiàn)在整合多步驟的HADDOCK、ClusPro、SwamDock、RosettaDock等等,該領(lǐng)域的算法不斷地升級(jí)迭代。平臺(tái)也能夠很方便地集成相關(guān)軟件,提供驗(yàn)證環(huán)境。
4、想要通過(guò)平臺(tái)篩選一些特定結(jié)構(gòu)的分子,是否可以?xún)?yōu)化化合物庫(kù)?如果您能夠提供確切信息,可以一同討論優(yōu)化。同時(shí),我們也準(zhǔn)備了很多開(kāi)源的分子庫(kù)供大家使用,現(xiàn)在已支持Zinc、Drugbank、Maybridge、Enamine等。
5、目前平臺(tái)中是否有自建的化合物數(shù)據(jù)庫(kù)?
CADD研究過(guò)程中,不論是靶點(diǎn)的發(fā)現(xiàn)和優(yōu)化、還是先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化,開(kāi)源的分子庫(kù)是必不可少的基礎(chǔ)數(shù)據(jù)。目前開(kāi)源的分子庫(kù)數(shù)據(jù)分散各地,下載緩慢,格式不統(tǒng)一,更新頻率不等,導(dǎo)致無(wú)法統(tǒng)一使用和管理,數(shù)據(jù)資產(chǎn)作用發(fā)揮有限。所以我們構(gòu)建了fastone自有的分子庫(kù),并做好了進(jìn)一步的數(shù)據(jù)準(zhǔn)備。
例如:
1、數(shù)據(jù)預(yù)處理,合并或格式轉(zhuǎn)換;
2、數(shù)據(jù)后處理,去重或力場(chǎng)優(yōu)化。
6、你們可以協(xié)助做小分子設(shè)計(jì)嗎?
我們不直接提供具體的小分子設(shè)計(jì),我們負(fù)責(zé)搭建IT和信息平臺(tái),協(xié)助您完成相關(guān)的研發(fā)工作。
7、基因數(shù)據(jù)量很大,平臺(tái)有什么好的解決辦法?
對(duì)于GB級(jí)別的增量數(shù)據(jù),我們支持以混合云組網(wǎng)專(zhuān)線(xiàn)的方式優(yōu)化上傳線(xiàn)路。傳輸通道使用DM工具,支持全自動(dòng)化數(shù)據(jù)上傳,可充分利用帶寬,幫助用戶(hù)快速上傳、下載海量數(shù)據(jù)。
對(duì)于PB級(jí)別的存量數(shù)據(jù),建議通過(guò)離線(xiàn)方式快速傳輸。
8、最終結(jié)果能否在線(xiàn)可視化查看?
平臺(tái)支持圖片、表格、HTML等多種形式展現(xiàn)。

二、云平臺(tái)支持哪些應(yīng)用?支持自定義工作流嗎?
9、云平臺(tái)能覆蓋到我常用的軟件嗎?我們支持常用的生物/化學(xué)計(jì)算類(lèi)應(yīng)用,包括:生物化學(xué)與分子生物學(xué)/化學(xué)工程/生物化學(xué)/應(yīng)用化學(xué)/生物工程/藥物化學(xué)/分析化學(xué)/物理化學(xué)/高分子化學(xué)與物理。
10、具體來(lái)說(shuō),支持哪些生物/化學(xué)計(jì)算類(lèi)應(yīng)用/工具?我們支持幾乎所有的生物/化學(xué)計(jì)算類(lèi)應(yīng)用/工具,包括:AutoDockVina、Amber、FastQC、DeltaVina、GATK、Gromacs、Schr?dinger、NetMHC、Rosetta、BCFtools等。
更多支持應(yīng)用列表,歡迎文末掃碼添加小F獲取。
11、你們支持Alphafold嗎?
我們可以快速提供Alphafold等常用環(huán)境,方便用戶(hù)快速進(jìn)行后續(xù)研究。
12、我們用的軟件是自己編譯的,你們平臺(tái)支持嗎?
支持。我們提供的集群環(huán)境鏡像已包含常見(jiàn)應(yīng)用工具運(yùn)行所需的依賴(lài)庫(kù),用戶(hù)也可以自行安裝配置。
13、對(duì)于一些商業(yè)軟件例如Schr?dinger,你們提供License嗎?
商業(yè)軟件的License文件需要客戶(hù)自行提供,fastone提供License Server進(jìn)行統(tǒng)一管理。
14、分子對(duì)接流程能不能自定義?上云之后每次都要重新弄一遍嗎?
很多時(shí)候,現(xiàn)成的應(yīng)用往往無(wú)法滿(mǎn)足用戶(hù)的需求,需要根據(jù)自己的模型和研究目標(biāo),自定義設(shè)置一套獨(dú)有的工作流程。
特別是新藥研發(fā)所涉及的應(yīng)用上,可以說(shuō)幾乎沒(méi)有一模一樣的工作流。 我們已經(jīng)實(shí)現(xiàn)了多款應(yīng)用(如Vina、Amber)的自定義工作流,可以根據(jù)用戶(hù)的實(shí)際使用場(chǎng)景(包括入?yún)⑽募⒔Y(jié)果文件、流程使用方式、步驟以及相關(guān)說(shuō)明等)實(shí)現(xiàn)自定義模板和腳本自動(dòng)化。用戶(hù)也可以提供腳本,由我們協(xié)助完成并行化改造。
15、你們是否提供固定的工作流模板?
提供。
用戶(hù)在進(jìn)行了一次或多次復(fù)雜的設(shè)定之后,能把這些設(shè)定保存成固定模板,不用重復(fù)手動(dòng)去一步步重新設(shè)置。一次制作,反復(fù)使用,省時(shí)省力,還不用擔(dān)心中間出錯(cuò)。而且,這套自定義的設(shè)置是可以跨應(yīng)用存在的,不一定局限在一個(gè)應(yīng)用范圍內(nèi)。自己重復(fù)用,共享給團(tuán)隊(duì)的其他人用,都可以。

16、你們是怎么幫助我們做工作流優(yōu)化的?
我們有通用的框架。我們也有對(duì)應(yīng)的CADD專(zhuān)家,可理解您的業(yè)務(wù)需求,快速設(shè)計(jì)出合理的相關(guān)流程。
17、你們的云平臺(tái)如何與CADD應(yīng)用相結(jié)合適配?
我們提供兩種模式進(jìn)行適配:任務(wù)模式和集群模式。
集群模式為用戶(hù)提供了一個(gè)靈活的環(huán)境,用戶(hù)可在集群模式下進(jìn)行一系列的調(diào)整和優(yōu)化,自由度非常高。
如果您習(xí)慣使用圖形化界面操作,我們也提供圖形桌面,您可通過(guò)Web瀏覽器啟動(dòng)集群,跳轉(zhuǎn)到虛擬桌面,并可在該桌面直接操作應(yīng)用進(jìn)行相應(yīng)設(shè)置以開(kāi)啟云端任務(wù)。當(dāng)用戶(hù)在集群模式下跑通了之后,可以選擇將整個(gè)流程固化下來(lái),方便更多研發(fā)人員使用。此時(shí)我們可以幫助用戶(hù)將此套流程轉(zhuǎn)換成固定的任務(wù)模式,讓更多的人可以使用這個(gè)成熟的框架,從而加速后續(xù)的整體研發(fā)效率。
三、對(duì)AIDD/CADD研發(fā)部門(mén)來(lái)說(shuō),有哪些好處?
18、你們的平臺(tái)容易操作嗎?用起來(lái)會(huì)不會(huì)很麻煩?
我們?yōu)锳IDD/CADD研發(fā)人員提供了一整套即開(kāi)即用的新藥研發(fā)環(huán)境,從登錄桌面、打開(kāi)應(yīng)用、配置、提交任務(wù)、自動(dòng)上云開(kāi)機(jī)運(yùn)行任務(wù)并自動(dòng)關(guān)機(jī)、查看結(jié)果進(jìn)行調(diào)試……用戶(hù)所需要的操作與本地幾乎完全一致,每一步只需在平臺(tái)上使用鼠標(biāo)簡(jiǎn)單點(diǎn)選即可完成。、

19、有些應(yīng)用需要先跑完主任務(wù)再跑其他任務(wù),上云可以智能化跑任務(wù)嗎?
有些應(yīng)用在運(yùn)算時(shí)存在依從機(jī)制,每若干個(gè)任務(wù)中包含1個(gè)主任務(wù),只有當(dāng)主任務(wù)運(yùn)行結(jié)束后,其他任務(wù)才能開(kāi)始并行運(yùn)算。
由于任務(wù)有先后,所以需要先跑主任務(wù),在每個(gè)主任務(wù)完成之后自動(dòng)調(diào)度資源并行運(yùn)算其他任務(wù)。
而不同任務(wù)完成時(shí)間可能不同,對(duì)資源的需求量可能時(shí)高時(shí)低有波動(dòng),最終結(jié)束關(guān)機(jī)時(shí)間也不同。
我們使用Slurm調(diào)度器按順序調(diào)度任務(wù)排隊(duì),Auto-Scale功能可自動(dòng)監(jiān)控任務(wù)和資源需求,動(dòng)態(tài)按需地開(kāi)啟與關(guān)閉所需資源。詳細(xì)的自動(dòng)化過(guò)程可參考27問(wèn)。
20、做分子對(duì)接,動(dòng)不動(dòng)就是幾百萬(wàn)上千萬(wàn)個(gè)分子,太貴了,有節(jié)約成本的方案嗎?
分子對(duì)接規(guī)模如果巨大,有什么好的解決辦法能加快這個(gè)過(guò)程?怎么做到的?分子對(duì)接的一大特征是任務(wù)數(shù)量龐大而單個(gè)任務(wù)計(jì)算時(shí)間短,單個(gè)分子對(duì)接的時(shí)間通常在幾分鐘以?xún)?nèi)(與參數(shù)設(shè)置有關(guān))。
這一特征天然匹配云端的SPOT實(shí)例。
當(dāng)便宜且隨時(shí)可能被搶占中斷的SPOT實(shí)例遇到迷你卻海量的分子對(duì)接任務(wù),簡(jiǎn)直就是天造地設(shè)的一對(duì)。
1、常規(guī)分子對(duì)接任務(wù)幾分鐘即可算完,特別適合SPOT這種分分鐘可能被搶走的狀態(tài);
2、fastone平臺(tái)具備自動(dòng)重試功能,一個(gè)任務(wù)被中斷可以自動(dòng)重新提交,任務(wù)之間互相不影響,重新提交單個(gè)任務(wù)影響很小。詳見(jiàn)《生信云實(shí)證Vol.3:提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子》
21、任務(wù)量比較大,想提前預(yù)估一下費(fèi)用再做決策,有沒(méi)有什么好辦法?
我們平臺(tái)預(yù)設(shè)了智能預(yù)測(cè)功能,以MOE為例。
用戶(hù)在fastone平臺(tái)的圖形化操作界面運(yùn)算MOE任務(wù),完成以下步驟:
1、用戶(hù)上傳數(shù)據(jù)文件(平臺(tái)自動(dòng)解析文件,判斷其中包含的分子數(shù)量)
2、用戶(hù)輸入期望的運(yùn)算時(shí)間(平臺(tái)推薦用戶(hù)適配機(jī)型或用戶(hù)自行選擇機(jī)型)
3、系統(tǒng)得出預(yù)測(cè)成本

項(xiàng)目負(fù)責(zé)人能夠非常方便地使用該功能預(yù)估項(xiàng)目費(fèi)用,完成項(xiàng)目規(guī)劃和申請(qǐng)。
22、我要跑TPU,你們支持嗎?
支持。
用戶(hù)可以通過(guò)我們平臺(tái)獲取到TPU資源。
23、有時(shí)會(huì)遇到CADD模擬出的結(jié)果與實(shí)際結(jié)果有一定出入,這是為什么?
CADD本身是模擬的結(jié)果,通過(guò)不斷的迭代,力場(chǎng)的優(yōu)化,會(huì)不斷接近實(shí)際情況。CADD和實(shí)際的實(shí)驗(yàn)數(shù)據(jù)相結(jié)合,反復(fù)設(shè)計(jì)和迭代,可以達(dá)到很好的效果。
24、有些任務(wù)需要使用大量的GPU資源,你們有嗎?
當(dāng)單個(gè)云廠商的GPU資源難以滿(mǎn)足需求時(shí),我們會(huì)根據(jù)用戶(hù)任務(wù)需要和特性,跨多家公有云廠商,智能自動(dòng)化調(diào)度云端GPU異構(gòu)資源,保證用戶(hù)對(duì)GPU的需求得到滿(mǎn)足。
25、GPU資源很貴,有沒(méi)有節(jié)約成本的方案?
GPU資源在不同云廠商之間有著顯著的差異,而且往往資源多的售價(jià)高,便宜的資源少,同時(shí)兼顧成本和效率是必須要考慮的問(wèn)題。以各大公有云廠商在北京地區(qū)的GPU實(shí)例(V100)按需價(jià)格為例,最高價(jià)格超過(guò)最低價(jià)2倍。

我們平臺(tái)可綜合考量用戶(hù)對(duì)完成任務(wù)所需時(shí)間和成本的具體要求,在多個(gè)云廠商的資源之間選擇最適配的組合方案,為用戶(hù)跨地區(qū)、跨云廠商調(diào)度所需資源。
26、用Amber跑任務(wù),用GPU跑非常快,但是有時(shí)候會(huì)跑失敗,用CPU雖然穩(wěn)定但是慢,你們?cè)趺唇鉀Q?
這是Amber18版本的固有問(wèn)題,在使用GPU時(shí)計(jì)算時(shí)有10-15%概率失敗,需要及時(shí)調(diào)度CPU資源重新計(jì)算。我們平臺(tái)支持優(yōu)先使用GPU計(jì)算,當(dāng)任務(wù)失敗時(shí),自動(dòng)調(diào)用CPU重新計(jì)算。
該問(wèn)題已在Amber20中修復(fù)。

27、有時(shí)大半夜任務(wù)跑失敗了,第二天早上才發(fā)現(xiàn),很浪費(fèi)時(shí)間是否有自動(dòng)重復(fù)提交任務(wù)的功能?
放著機(jī)器通宵跑任務(wù)時(shí)總會(huì)幻想:第二天一早,任務(wù)已經(jīng)跑完了,完美。
現(xiàn)實(shí)是:任務(wù)才跑了10%。任務(wù)出錯(cuò),進(jìn)度條卡住,可能會(huì)有兩種情形:
第一種:每個(gè)任務(wù)之間獨(dú)立,彼此沒(méi)有關(guān)聯(lián)
一般任務(wù)數(shù)量越多失敗的任務(wù)數(shù)量大概率也會(huì)變多。
第二種:每個(gè)任務(wù)間有明確的先后處理順序必須從A任務(wù)按序跑到Z。
假如到F任務(wù)就失敗了,整個(gè)任務(wù)就此停滯涼涼。

自動(dòng)檢查任務(wù)狀態(tài)并對(duì)失敗任務(wù)及時(shí)重復(fù)提交的功能,就是這種場(chǎng)景的克星,尤其是第二種,不然等待著你的,大概就是通宵,同時(shí)睜大你的雙眼了。
我們的任務(wù)監(jiān)控告警功能,還會(huì)時(shí)刻監(jiān)控任務(wù)狀態(tài),通過(guò)IM及時(shí)通知用戶(hù),任務(wù)出現(xiàn)異常或已經(jīng)完成。
詳情可掃碼:王者帶飛LeDock!開(kāi)箱即用&一鍵定位分子庫(kù)+全流程自動(dòng)化,3.5小時(shí)完成20萬(wàn)分子對(duì)接
四、對(duì)IT部門(mén)來(lái)說(shuō),有哪些好處?
28、現(xiàn)在公司里才幾臺(tái)機(jī)器,天天維護(hù)頭就很大了,云上這么多機(jī)器還不得把自己搞禿了?
云上的運(yùn)行環(huán)境都是自動(dòng)化配置的,不需要人工干預(yù),用戶(hù)還可以通過(guò)平臺(tái)進(jìn)行統(tǒng)一管理和監(jiān)控,方便易操作。
舉個(gè)例子,我們的Auto-Scale功能可以自動(dòng)監(jiān)控用戶(hù)提交的任務(wù)數(shù)量和資源的需求,動(dòng)態(tài)按需地開(kāi)啟和關(guān)閉所需算力資源,在不夠的時(shí)候,還能根據(jù)不同的用戶(hù)策略,自動(dòng)化調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類(lèi)型或相似類(lèi)型實(shí)例資源。所有操作都是自動(dòng)化完成,無(wú)需用戶(hù)干預(yù)。
下圖就是開(kāi)啟Auto-Scale功能后,用戶(hù)某項(xiàng)目一周之內(nèi)所調(diào)用云端計(jì)算資源的動(dòng)態(tài)情況。
其中橙色曲線(xiàn)為OD實(shí)例的使用狀況,紅色曲線(xiàn)為SPOT的使用狀況。

Auto-Scale功能可以根據(jù)任務(wù)運(yùn)算情況動(dòng)態(tài)開(kāi)啟云端資源,并在波峰過(guò)去后自動(dòng)關(guān)閉,讓資源的使用隨著用戶(hù)的需求自動(dòng)擴(kuò)張及縮小,最大程度匹配任務(wù)需求。
29、你們是什么存儲(chǔ)策略?費(fèi)用呢?冷存儲(chǔ)和熱存儲(chǔ)的費(fèi)用是不一樣的,我們會(huì)根據(jù)用戶(hù)的情況提供個(gè)性化的解決方案。
30、數(shù)據(jù)備份的頻率如何?最高可以達(dá)到多少?現(xiàn)有策略怎樣?默認(rèn)每周六進(jìn)行數(shù)據(jù)備份,也可以根據(jù)客戶(hù)需求按天或按小時(shí)備份。
31、使用平臺(tái)的工作人員比較多,能否對(duì)每個(gè)人設(shè)置使用資源的上限?
fastone平臺(tái)的權(quán)限和角色管理功能,支持管理員角色對(duì)每一個(gè)用戶(hù)進(jìn)行相關(guān)權(quán)限設(shè)定,包括預(yù)算使用上限和CPU核數(shù)使用上限,從而在全局角度管控項(xiàng)目的資源消耗。該功能與智能預(yù)測(cè)配合使用,能夠從多個(gè)層面對(duì)預(yù)算和資源進(jìn)行全方位規(guī)劃。

32、公司里還有些機(jī)器能用,你們支持混合云模式嗎?
支持。
可以將本地機(jī)器做成集群,也可以基于本地機(jī)器搭建混合云平臺(tái)。我們支持本地資源不足的時(shí)候,自動(dòng)溢出到云上。
33、你們?cè)趺磳?shí)現(xiàn)混合云?
云資源和本地之間通過(guò)安全的數(shù)據(jù)通道連接,所有資源在fastone平臺(tái)統(tǒng)一管理,有統(tǒng)一視圖,并按需智能調(diào)度,不改變用戶(hù)的使用習(xí)慣。
34、公司里已經(jīng)有機(jī)器了,再增加一套云環(huán)境,IT管理上會(huì)不會(huì)變麻煩?通過(guò)我們可以在不增加負(fù)擔(dān)的情況下對(duì)接多云,減少I(mǎi)T管理壓力。我們的自動(dòng)化管理平臺(tái)很容易上手,對(duì)提升研發(fā)效率和資源利用率都有很大幫助。
35、我們公司有海外研發(fā)部門(mén),用你們平臺(tái)方便嗎?
我們的平臺(tái)支持全球部署,我們會(huì)全球的優(yōu)化組網(wǎng),統(tǒng)一用戶(hù)管理,數(shù)據(jù)管理,優(yōu)化的遠(yuǎn)程接入方式,保持一致的用戶(hù)體驗(yàn)。

36、云上云下的安全如何保障?
安全是一個(gè)立體的概念,包括系統(tǒng)安全、應(yīng)用安全、流程安全、數(shù)據(jù)安全等很多方面。
云的基礎(chǔ)架構(gòu)和傳統(tǒng)IT架構(gòu)在安全方面并沒(méi)有本質(zhì)上的區(qū)別,依然是利用計(jì)算節(jié)點(diǎn)和存儲(chǔ)資源。很多人覺(jué)得這兩者之間存在差異,我們認(rèn)為這取決于個(gè)人的認(rèn)知。本地的安全措施在云上都可以實(shí)現(xiàn),同時(shí)云廠商本身還提供更強(qiáng)大的安全保障。
37、數(shù)據(jù)安全如何實(shí)現(xiàn)?
數(shù)據(jù)全部通過(guò)安全協(xié)議傳輸,并支持RBAC的數(shù)據(jù)訪問(wèn)認(rèn)證鑒權(quán)。同時(shí),我們還支持?jǐn)?shù)據(jù)加密存儲(chǔ),算法可自定義。
- END -
我們有個(gè)新藥研發(fā)云平臺(tái)
集成多種生命科學(xué)領(lǐng)域應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來(lái)幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
快速上手,拖拉點(diǎn)選可視化界面,無(wú)需代碼
支持高級(jí)用戶(hù)直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
-底部-1024x517.png)
更多電子書(shū)歡迎掃碼關(guān)注小F(ID:imfastone)獲取

你也許想了解具體的落地場(chǎng)景:
這樣跑COMSOL,是不是就可以發(fā)Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?
1分鐘告訴你用MOE模擬200000個(gè)分子要花多少錢(qián)
LS-DYNA求解效率深度測(cè)評(píng) │ 六種規(guī)模,本地VS云端5種不同硬件配置
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬(wàn)個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
關(guān)于為應(yīng)用定義的云平臺(tái):
解讀Hyperion年度報(bào)告:脫離場(chǎng)景談?dòng)昧烤褪撬A髅?/a>
這一屆科研計(jì)算人趕DDL紅寶書(shū):學(xué)生篇
一次搞懂速石科技三大產(chǎn)品:FCC、FCC-E、FCP
AI太笨了……暫時(shí)
【2021版】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書(shū)
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
