日本少妇高潮抽搐_黄色三级三级三级三级三级|HD中文字幕在线播放,美女毛片电影,国产视频一区二区在线观看,女邻居的大乳中文字幕2

生信云實證Vol.3:提速2920倍!用AutoDock Vina對接2800萬個分子

AutoDock Vina是用于分子對接和虛擬篩選的開源程序,由Scripps研究所分子圖形實驗室的Oleg Trott博士設計和實現,目前使用最為廣泛的分子對接軟件之一

分子對接技術,作為計算機輔助藥物設計(Computer Aided Drug Design,CADD)的重要方法,已廣泛應用于藥物發現階段的早期虛擬篩選、藥物分子設計、先導化合物優化、藥物潛在作用靶點發現、藥物-靶點相互作用機制、為重要的藥物代謝酶尋找特異性配體等。

目前,限于算力,或者高效靈活地調用大規模計算集群的能力,當前的虛擬篩選通常僅采樣百萬到千萬個分子,而事實上目前可用于藥物發現的有機分子已經超過10的60次方。

分子虛擬篩選-15小時篩選10億分子

在《15小時虛擬篩選10億分子,Nature+HMS驗證云端新藥研發未來》這篇文章里,哈佛大學醫學院的研究人員論證了:分子化合物的質量會隨著虛擬篩選規模的擴大而提升

如何在本地資源有限的情況下,提高虛擬篩選規模和質量,把漫長的藥物研發周期縮短一點?
我們用實證給你一個答案。

與前兩次實證不同,本次生信實證有兩大特點:

1. 任務數量多,云上同一地區某種類型機型可能不足,因此會涉及到多區域資源調度;
2. 可根據用戶偏好匹配合適的資源調度策略,滿足用戶不同需求。


實證背景信息

某大型藥企在本地建設有機房,計算資源總計為104核。
使用AutoDock Vina進行小分子對接:
當設定exhaustiveness=8時,篩選56643個原始分子共需90小時;
當設定exhaustiveness=1時,耗時需18小時。

本地機房-運行vina分子對接計算任務的耗時

(exhaustiveness參數:用來控制對接的細致程度,影響計算時間)

當篩選范圍擴大到整個VS數據庫(2800萬個分子)時,不同參數條件下本地資源所需的運算時間在約2.6-5年不等。

分子對接_分子虛擬篩選,不同exhaustiveness參數對應不同的運算時長

研發負責人認為這么長的時間周期是無法接受的,其本地現有IT架構和資源完全無法滿足研發需求。 


實證目標

1、AutoDock Vina任務能否在云端有效運行?
2、fastone平臺能否大幅度縮短任務運行時間?
3、fastone平臺能否有效控制任務運行成本?
4、針對AutoDock Vina任務小,數量大的特點,fastone平臺是否有針對性策略?


實證參數

平臺:
fastone企業版產品 

應用:
AutoDock Vina 

適用場景:
分子對接,研究配體(藥物分子)與其受體(已知的靶蛋白或活性位點)之間的詳細相互作用,預測其結合模式及親合力,還可以用來發現并優化藥物先導物分子,進而實現基于結構的藥物設計 

云端硬件配置:
AutoDock Vina在運行時需要對接海量分子,對計算性能要求較高,因此平臺為用戶推薦選擇了匹配其應用特點的計算優化型實例機型。 

技術架構圖:

AutoDock Vina分子對接計算-云端硬件部署
AutoDock Vina分子對接計算-云端硬件部署

以下是兩個實證場景。
實證場景一:我們通過10000分子分別進行了AutoDock Vina的云端線性擴展性驗證及成本驗證;
實證場景二:基于不同用戶策略,我們幫用戶進行了2800萬量級的大規模分子對接。
1、時間優先策略以速度為第一優先級:資源選擇以OD按需實例為主,在滿足用戶時間要求的前提下盡可能通過搶占SPOT實例來優化成本。
2、成本優先策略以成本為第一優先級:資源選擇以SPOT實例為主,并在滿足用戶成本要求的前提下使用OD按需實例來優化時間效率。

SPOT:可被搶占實例,又稱競價實例。價格最低可達到按需實例價格的10%,相當于秒殺,手快有手慢無,價格可高可低波動大,隨時可能被搶占中斷,需要有一定的技術實力才能使用。
OD:On-Demand,按需實例。針對短期彈性需求,按小時計費,靈活精準,避免浪費,但價格比較高,通常為SPOT實例的3-10倍。


實證場景一:10000分子
AutoDock Vina云端線性擴展性及成本驗證


結論一:在云端調度不同核數的計算資源對接10000分子,驗證AutoDock Vina在云上具有線性擴展性,即當處理器數量增加一倍,運算時間也會縮短一半。

高性能計算集群,vina分子對接,不同核數的耗時

實證過程:
1、云端調度36核計算資源對接10000分子,采用時間優先策略需耗時527分鐘;
2、云端調度80核計算資源對接10000分子,采用時間優先策略需耗時314分鐘;
3、云端調度144核計算資源對接10000分子,采用時間優先策略需耗時215分鐘;
4、云端調度288核計算資源對接10000分子,采用時間優先策略需耗時98分鐘;
5、云端調度540核計算資源對接10000分子,采用時間優先策略需耗時52分鐘;
6、云端調度1080核計算資源對接10000分子,采用時間優先策略需耗時20分鐘。

結論二:在云端調度不同核數的計算資源對接10000分子,當用戶選擇成本優先策略時,fastone平臺以SPOT實例為主要資源選擇,確保成本為第一優先級。
比時間優先策略,成本降幅最多可達67%-90%。

高性能計算集群,vina分子對接,不同核數的運行成本

實證過程:
1、云端調度36核計算資源對接10000分子,采用成本優先策略搶占SPOT實例,耗費82元;
2、云端調度80核計算資源對接10000分子,采用成本優先策略搶占SPOT實例,耗費84元;
3、云端調度144核計算資源對接10000分子,采用成本優先策略搶占SPOT實例,耗費79元;
4、云端調度288核計算資源對接10000分子,采用成本優先策略搶占SPOT實例,耗費64元;
5、云端調度540核計算資源對接10000分子,采用成本優先策略搶占SPOT實例,耗費58元;
6、云端調度1080核計算資源對接10000分子,采用成本優先策略搶SPOT實例,耗費68元。

實證場景二:2800萬分子
大規模業務驗證:基于不同用戶策略

fastone基于用戶2800萬分子對接需求,提供時間優先成本優先兩種策略供用戶選擇。

01
用戶以時間為第一優先級

結論:
1、通過fastone平臺采用時間優先策略調用10萬核計算優化型實例對接2800萬個分子,耗時約15.23小時,運算效率提高2920倍;
2、fastone平臺根據用戶計算需求,自動化構建并調度云上10萬核大規模算力集群,完成計算任務;
3、時間優先策略下,當任務數量達到一定規模時,云上同一地區某種類型機型可能不足,fastone平臺可跨區、跨類型自動為用戶調度云資源,以最快速度完成計算任務;
4、fastone平臺自動幫用戶確定中斷可能性最低的SPOT池,保障任務順利高效完成,本次實證任務的中斷率為0.95%(通常<5%)。

云端部署手動模式 VS 自動模式之間的巨大差異可查看 EDA云實證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?

實證過程:
1、設定exhaustiveness=8,本地104核計算資源對接約2800萬個分子,經估算需耗時約1853天
2、設定exhaustiveness=8,云端調度10萬核計算資源對接約2800萬個分子,采用時間優先策略需耗時約15.23小時(含配置,安裝,調度等時間)。

本地計算資源與云計算的算力對比

計算資源越多,運算時間越短。

在滿足用戶時間要求的前提下,可通過盡可能搶占SPOT實例來幫助用戶優化成本。
當所需的計算資源達到十萬核這個數量級以后,單個區域內我們的目標類型資源可能會瞬間告罄,造成任務排隊,從而大大拖慢運算時間。

我們需要通過fastone平臺的Auto-Scale功能自動調度本區域及其他區域的目標類型或相似類型SPOT實例資源,以最快速地完成任務。

fastone云平臺-搶占spot云資源的規則

簡單說,就是優先搶低價的SPOT實例,搶完同類型的再搶其他類型的,搶完同區域的再搶其他區域的

這只是Auto-Scale功能的一部分。
fastone的Auto-Scale功能可以自動監控用戶提交的任務數量和資源的需求,動態按需地開啟所需算力資源,在提升效率的同時有效降低成本。可以讓用戶根據自身需求,設置調度集群規模上下限,且所有操作都是自動化完成,無需用戶干預。 

02
用戶以成本為第一優先級

使用AutoDock Vina進行分子對接的一大特征是任務數量龐大而單個任務計算時間短,單個分子對接的時間通常在幾分鐘以內(與參數設置有關)。
這一特征天然匹配云端的SPOT實例。

云端SPOT實例有四大特點:
1、 便宜是真便宜。
2、 不是人人都能用好。
3、 不是你想要啥就有,不是你想用的時候就能用。
4、 或遲或早,最終一定會被搶走。

云計算收費模式-按需實例-預留實例-競價實例

OD按需實例價格通常為SPOT實例的3-10倍。
可參考:《云資源中的低成本戰斗機——競價實例,AWS、阿里云等六家云廠商完全用戶使用指南

當便宜且隨時可能被搶占中斷的SPOT實例遇到迷你卻海量的分子對接任務,簡直就是天造地設的一對。
1、常規分子對接任務幾分鐘即可算完,特別適合SPOT這種分分鐘可能被搶走的狀態;
2、fastone平臺具備自動重試功能,一個任務被中斷可以自動重新提交,任務之間互相不影響,重新提交單個任務影響很小。

fastone平臺會按以下順序依次進行自動化調度:
1、同一區域目標類型的SPOT實例;
2、同一區域其他類型的SPOT實例;
3、其他區域目標類型的SPOT實例;
4、其他區域其他類型的SPOT實例;
5、同一區域目標類型的OD實例;
6、同一區域其他類型的OD實例;
7、其他區域目標類型的OD實例;
8、其他區域其他類型的OD實例。

fastone云平臺-云調度優先級


實證小結

最后我們回顧一下實證目標:

1、AutoDock Vina任務能在云端有效運行;
2、fastone平臺能夠大幅度縮短任務運行時間;
3、fastone平臺能夠有效控制任務運行成本;
4、fastone平臺的Auto-Scale功能可完美匹配AutoDock Vina任務小,數量大的特點;
5、fastone平臺能根據用戶不同需求,為用戶提供不同的自動化調度策略。 

本次生信行業Cloud HPC實證系列Vol.3就到這里。

在下一期的實證中,我們將為大家帶來Amber上云實證,這次涉及到了云端GPU資源的使用。

未來我們還會帶給大家更多領域的用云“真香”實證,請保持關注哦!

- END -

2分鐘自動開通,即刻獲得TOP500超級算力
點擊下圖立即體驗

SaaS計算云-在線體驗版

2020年新版《六大云廠商資源價格對比工具包》
添加小F微信(ID: imfastone)獲取

云比價報告


你也許想了解具體的落地場景:

15小時虛擬篩選10億分子,《Nature》+HMS驗證云端新藥研發未來

CAE云實證Vol.2:從4天到1.75小時,如何讓Bladed仿真效率提升55倍?

EDA云實證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?


關于云端高性能計算平臺:

國內超算發展近40年,終于遇到了一個像樣的對手

幫助CXO解惑上云成本的迷思,看這篇就夠了

靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥

花費4小時5500美元,速石科技躋身全球超算TOP500


關于速石

速石科技致力于為 生命科學、 半導體汽車/智能制造高校科研人工智能金融科技 等領域的企業提供定制化的上云解決方案 。


相關推薦

微信掃一掃

微信掃一掃

微信掃一掃,分享到朋友圈

生信云實證Vol.3:提速2920倍!用AutoDock Vina對接2800萬個分子
返回頂部

顯示

忘記密碼?

顯示

顯示

獲取驗證碼

Close