免费精品久久,嗯啊不要揉捏,av黄色软件 http://www.youjiajingji.com/blog Thu, 20 Jun 2024 03:29:05 +0000 zh-CN hourly 1 https://wordpress.org/?v=5.2.3 http://www.youjiajingji.com/blog/wp-content/uploads/2019/08/cropped-logo-32x32.png 新藥研發平臺 Archives - 速石科技BLOG http://www.youjiajingji.com/blog 32 32 生信實證系列Vol.15:如何用AlphaFold2,啪,一鍵預測100+蛋白質結構 http://www.youjiajingji.com/blog/alphafold2/ http://www.youjiajingji.com/blog/alphafold2/#respond Thu, 20 Jun 2024 03:02:58 +0000 http://www.youjiajingji.com/blog/?p=6273 "結構就是功能"——蛋白質的工作原理和作用取決于其3D形狀。 2020年末,基于深度神經網絡的AlphaFold2,一舉破解了困擾生物學界長達五十年之久的“蛋白質折疊”難題,改變了科學研究的游戲 …

The post 生信實證系列Vol.15:如何用AlphaFold2,啪,一鍵預測100+蛋白質結構 appeared first on 速石科技BLOG.]]>

"結構就是功能"——蛋白質的工作原理和作用取決于其3D形狀

2020年末,基于深度神經網絡的AlphaFold2,一舉破解了困擾生物學界長達五十年之久的“蛋白質折疊”難題,改變了科學研究的游戲規則,可以從蛋白質序列直接預測蛋白質結構,實現了計算機蛋白質建模極高的精確度。
自AF2問世以來,全世界數百萬研究者已經在瘧疾疫苗、癌癥治療和酶設計等諸多領域取得了突破。

2024年5月初,AlphaFold3再登Nature,基于Diffusion(擴散技術)架構,將技術延伸到蛋白質折疊之外,能以原子級精度準確預測蛋白質、DNA、RNA、配體等生命分子的結構及相互作用。

為了避免Diffusion技術在一些無結構區域產生“幻覺”,DeepMind還創新了一種交叉蒸餾(cross-distillation)方法,把AF2預測的結構數據預添加到AF3的預訓練集中,減少AF3的預測失誤。

AF2代碼已開源,AF3目測不會開源,也不能商用。
我們今天的主角——只能是AlphaFold2

想知道怎么使用AlphaFold2最最快樂?
怎么快速完成蛋白質結構預測任務?
我們能在背后幫你默默干點什么?
來吧——

01
先復習一下
AlphaFold2計算的正確打開方式

我們通常說的AlphaFold2是指一個利用多個外部開源程序和數據庫,通過蛋白質序列預測其3D結構的系統。
整個蛋白質結構預測計算過程大致可以分為兩個階段:

一、數據預處理

包括多序列比對(MSA)和模板搜索(Template Search)兩個步驟,主要是利用已知的蛋白質序列和結構模板,獲得不同蛋白質之間的共有進化信息來提升目標蛋白質結構預測的準確性。

需要比對和搜索的數據總和達到了TB量級,涉及數據庫密集I/O讀寫,因此對I/O有較高的要求。
這一階段主要使用HMMER與HH-suite軟件,以及Uniprot、MGnify、PDB等多個蛋白質數據庫。計算耗時與蛋白序列長度正相關,主要使用CPU計算資源

AF2訓練數據集覆蓋多個數據庫,比如UniRef90/MGnify/PDB/BFD等,目前完整版大小約為2.62TB,是世界范圍內較為權威的蛋白質三維結構數據庫。2022年7月28日,Google DeepMind將數據庫從近100萬個結構擴展到超過2億個結構,涵蓋了植物、細菌、動物和其他微生物等多個類別。

二 、模型推理與優化

基于端到端的Transformer神經網絡模型,AF2輸入Templates、MSA序列和pairing信息,其中pairing和MSA信息相互迭代更新,檢測蛋白質中氨基酸之間相互作用的模式,輸出基于它們的3D結構。


再用OpenMM軟件對預測的3D結構進行物理放松,解決結構違規與沖突。

使用Recycling(將輸出重新加入到輸入再重復refinement)進行多輪迭代訓練和測試,多輪迭代優化有一定的必要性,較為復雜的蛋白可能在多輪之后才能折疊到正確的結構。
這一階段計算耗時與迭代次數正相關,主要使用GPU計算資源

02
Workflow全流程自動化
隨心組合,當一個甩手掌柜

作為一個系統,AlphaFold2借助了多個外部開源軟件和數據庫,整個計算過程也比較復雜。
如果用戶想要自行使用,不但要下載龐大的數據庫,還需要自行搭建使用環境,對IT能力的要求不可謂不高。

用戶看到的基本都是左邊這種畫面,我們能做的第一點——就是提供一個平臺,把左邊變成右邊

而第二點,我們能跨越系統各個軟件之間,包括對軟件內部的不同步驟任意重新排列組合做成自動化的Workflow
一次制作,反復使用,省時省力,還不用擔心中間出錯。

比如?

一 、多數據庫同時多序列比對(MSA)

多序列比對需要在多個蛋白質數據庫里進行查找。
常規使用模式,用戶要手動依次在N個數據庫里進行搜索,整個過程耗時等于N次搜索的時間之和。
我們可以讓不同數據庫的搜索同時進行,并做成一個固定Workflow,自動執行,整個過程花費時間將等于耗時最長的數據庫搜索時間。既節約時間,又省事。

二 、全計算流程與資源自由組合

不僅僅限于某一個步驟,我們能做全計算流程的自定義Workflow
上一節我們復習了,AF2第一階段適合用CPU資源,第二階段使用GPU計算效果最佳,每個階段還涉及到不同軟件包。
整個計算過程比較復雜,需要在不同階段的不同步驟使用不同軟件包調用不同底層資源進行計算,手動操作工作量不小。而且,常規使用模式,可能會從頭到尾使用一種資源計算,這樣比較簡單,但是會比較吃虧,要么第一階段GPU純純浪費,要么第二階段慢得吐血,計算時間是原來的數倍。

我們能把整個計算流程與資源自由組合,讓用戶全程可視化操作,只需要輸入不同參數即可。既能實現應用與資源的最佳適配,還能自動化操作,省去大量手動時間。

當然,還有無數種其他組合的可能性。
不止是AlphaFold2,自定義Workflow也能應用在其他場景,戳:1分鐘告訴你用MOE模擬200000個分子要花多少錢

03
掃清技術障礙
TB級數據庫與I/O瓶頸問題

AF2訓練數據庫完整版大小約為2.62TB,數據預處理階段需要在數據庫中執行多次隨機搜索,這會導致密集的I/O讀寫。如果數據的讀取或寫入速度跟不上,就會影響到整個計算過程的效率。

這可能會導致:
1. 同一任務多次計算,耗時卻不同;
2. I/O等待超時,任務異常退出;
3. 即便增加CPU資源,也無法加速計算。

為了解決這一問題,我們對整個數據庫做了梳理和拆分。其中最大的BFD數據庫接近2T,對I/O的要求非常高。
因此,我們將高頻I/O的BFD數據庫存放在本地磁盤,其他數據庫存放在網絡共享存儲上

這帶來了兩大好處:
第一、磁盤空間換時間,計算速度更快
將高頻訪問的BFD數據庫放在本地磁盤上,I/O讀寫速度快,非常適合需要快速響應的數據。因為本地磁盤是與機器綁定的,如果不止一臺機器,這會導致本地磁盤存儲空間增加。
而其他對I/O讀寫速度要求不高的數據庫可以放在網絡共享存儲上,方便所有機器共享讀取和寫入,減少數據同步問題。
整體來說,用磁盤空間換取時間,讓I/O對計算的影響降到最低,顯著提升了AF2的運算效率。

第二、為未來可能的大規模并發計算掃清技術障礙
關于這一點,我們進入下一節。

04
大規模并發!
同時預測100+蛋白質結構

對用戶來說,不可能一次只預測1個蛋白質結構。
那么,如果要同時預測100+蛋白質結構,怎么玩?
如果是以前,你不但需要搭好運行環境,準備好計算資源,然后一個一個預測,而且每一個還得手動走一遍完整的計算流程。這個過程一聽就十分漫長,而且容易出錯。

而現在——
已知一:我們有Workflow全流程自動化的能力,單個蛋白質預測已經是一個自動化的Workflow了;
已知二:我們解決了I/O瓶頸問題,也就是說,多臺機器對I/O讀寫瓶頸問題已經解決。
100+蛋白質結構預測,又有什么難的?

現在,我們只需要再多做一步,同時運行有100+個不同輸入參數的Workflow,就行了。而完成這一步需要具備兩個條件:

一 、充分的CPU/GPU資源


我們調用10萬核CPU資源,使用AutoDock Vina幫用戶進行了2800萬量級的大規模分子對接,將運算效率提高2920倍:提速2920倍!用AutoDock Vina對接2800萬個分子
我們智能自動化調度云端GPU/CPU異構資源,包括155個NVIDIA Tesla V100和部分CPU資源,將運算16008個Amber任務的耗時從單GPU的4個月縮短到20小時:155個GPU!多云場景下的Amber自由能計算

二 、調度器能力

這么多機器和任務,怎么適配,按什么策略使用最佳,怎么配置、啟動、關閉,提高整體資源利用率,最好還能自動化管理、輔助管理決策等等,甚至怎么DEBUG,這需要的可不止是一點點技術。
詳情可戳:國產調度器之光——Fsched到底有多能打?

到這里,這100+蛋白質預測任務,就可以一次性跑完了。

05
V100 VS A100
關于GPU的一點選型建議

那么多GPU型號,你選哪個?

市面上的GPU型號不少,性能和價格差異也很大。
我們選取了3個蛋白質,分別使用V100A100進行了一輪計算:

可以看到,對同一個蛋白質進行結構預測,A100用時約為V100的60-64%
而目前的市場價,無論是小時租賃、包月預留還是裸卡買斷,A100至少是V100的2倍以上。
也就是說,A100是以2倍多的價格,去換取約三分之一的性能提升
兩相比較,除非不差錢,我們推薦使用V100

實證小結


1.AlphaFold2是一個系統,涉及到很多數據庫和不同軟件,我們的Workflow全流程自動化,讓用戶可以隨心組合,輕松上手蛋白質結構預測;
2.我們用磁盤空間換時間的手段,既解決了TB級數據帶來的I/O瓶頸問題,也為大規模并發計算掃清了技術障礙;
3.fastone可支持多個AlphaFold2任務大規模自動并行;
4.GPU也需要選型,我們推薦V100。

本次生信實證系列Vol.15就到這里。

關于fastone云平臺在各種BIO應用上的表現,可以點擊以下應用名稱查看
VinaAmber│?MOE│?LeDock
速石科技新藥研發行業白皮書,可以戳下方查看:
新藥研發37問?頂尖藥企AIDD調研

- END?-


我們有個一站式新藥研發平臺
集成行業應用與自編譯軟件
支持AlphaFold、RoseTTAFold等常用AI應用
可視化Workflow隨心創建、便捷分享
提供Zinc、Drugbank等開源/自有分子庫
CADD專家團隊全面支持掃碼

免費試用,送200元體驗金,入股不虧~

更多BIO電子書
歡迎掃碼關注小F(ID:iamfastone)獲取

你也許想了解具體的落地場景:
只做Best in Class的必揚醫藥說:選擇速石,是一條捷徑
王者帶飛LeDock!開箱即用&一鍵定位分子庫+全流程自動化3.5小時完成20萬分子對接
1分鐘告訴你用MOE模擬200000個分子要花多少錢
155個GPU!多云場景下的 Amber自由能計算
提速2920倍!用AutoDock Vina對接2800萬個分子

新藥研發平臺:
今日上新——FCP
專有D區震撼上市,高性價比的稀缺大機型誰不愛?
國產調度器之光——Fsched到底有多能打?
創新藥研發九死一生,CADD/AIDD是答案嗎?
全球44家頂尖藥企AI輔助藥研行動白皮書


近期重大事件:
速石科技完成龍芯、海光、超云兼容互認證,拓寬信創生態版圖
速石科技入駐粵港澳大灣區算力調度平臺,參與建設數算用一體化發展新范式
速石科技成NEXT PARK產業合伙人,共同打造全球領先的新興產業集群
速石科技出席ICCAD2023,新一代芯片研發平臺助力半導體企業縮短研發周期
速石科技與芯啟源開啟戰略合作,聯手打造軟硬件一體芯片研發云平臺

圖片
The post 生信實證系列Vol.15:如何用AlphaFold2,啪,一鍵預測100+蛋白質結構 appeared first on 速石科技BLOG.]]>
http://www.youjiajingji.com/blog/alphafold2/feed/ 0
創新藥研發九死一生,CADD/AIDD是答案嗎? http://www.youjiajingji.com/blog/aiddcaddjd/ http://www.youjiajingji.com/blog/aiddcaddjd/#respond Wed, 16 Mar 2022 14:43:57 +0000 http://www.youjiajingji.com/blog/?p=2924 創新藥內卷嚴重,九死一生,而且燒錢速度驚人。不管Big Pharma還是Biotech都壓力山大,銷售額、利潤要漲,研發費用要邊漲邊控。Biotech求活下去,求快速具備造血能力;Big Pharma求踩 …

The post 創新藥研發九死一生,CADD/AIDD是答案嗎? appeared first on 速石科技BLOG.]]>
說出你的應用

創新藥內卷嚴重,九死一生,而且燒錢速度驚人。
不管Big Pharma還是Biotech都壓力山大,銷售額、利潤要漲,研發費用要邊漲邊控。
Biotech求活下去,求快速具備造血能力;
Big Pharma求踩穩創新藥這一條新成長曲線,探索國際化的發展模式。

如何做到:
速度要快,姿勢還要帥?

第一:堆新藥研發人才

自己培養和直接搶人,這兩條路一般同時進行。
培養一個新藥研發人才和培養一個飛行員差不多,得用昂貴的試飛成本才能換來一點感覺。
外部就從跨國藥企搶,從大廠搶。既要懂研發,還要懂市場,最好還要懂資本的多面手,最重要的是,要留得住。

第二:外包,買現成管線

一定程度上解決問題,快是快了,但終究不是長久之計。
而且核心知識產權不在自己手上,姿勢不夠帥。

第三:堆CADD/AIDD人才

關于為什么CADD(計算機輔助藥物研發)/AIDD(AI輔助藥物研發)能夠加速新藥研發進展,去年,我們在這篇《 【2021版】全球44家頂尖藥企AI輔助藥物研發行動白皮書 》里已經解釋過了,不再贅述。

CADD和AIDD的區別就是,一個重“人工”,一個重“智能”。
不必取舍,兩者殊途同歸

國內企業在找CADD/AIDD人才方面現在是什么情況?
我們在國內9個主流招聘平臺,相隔半年先后調查了兩次,一共覆蓋134家公司,職位關鍵詞包括:AI、人工智能、CADD、計算化學等
再說一遍:“別看他的眼睛,你看他的手”,行動永遠勝過言語。

結論如下:

1、招聘CADD/AIDD相關職位的公司總量從78家增加到了106家,增幅36%;

2、半年內實際新增招聘公司數量,56家

3、八成以上公司明確表示正在進行創新藥研發,其中近四分之一應用了AI技術

4、2014年以后成立的公司明確表示使用AI技術的比例大幅提升;

5、30家公司正在招聘CADD/AIDD團隊負責人,占比28%,其中有9家在JD中明確提出要組建CADD/AIDD新團隊;

6、最受歡迎CADD/AIDD應用前三名:Schrodinger、MOE和AutoDock。

第三plus:堆資源,或者找個新藥研發平臺?

為啥堆資源就快了?

1、充足的資源會給研發人員帶來充足的想象力和試錯空間,而不是束手束腳施展不開。
就像有人問一位Google芯片設計師:在Google做芯片,是一種什么體驗?他說:就像小朋友走進了一家糖果店,開心瘋了。(做芯片設計也是需要大量資源的

2、充足的資源能夠提供更高的計算精度和準確性,提高結果的質量和可用性。2020年3月,哈佛大學醫學院在《Nature》發表的論文《An open-source drug discovery platform enables ultra-large virtual screens》就明確推導了真陽性率與所篩選化合物數量的函數關系的概率模型,證明:化合物的最高打分隨著規模增加而提高。

作者分別從10萬、100萬、1000萬、1億、10億個化合物中進行了5次篩選,挑選了得分最高的前50個化合物進行對比,從圖中可以很清楚地看到篩選的規模越大,得分越高(位置越靠上)。具體可以看這篇《15小時虛擬篩選10億分子,《Nature》+HMS驗證云端新藥研發未來

3、出結果快。

比如我們幫助一家大型藥企使用AutoDock Vina對整個VS數據庫(2800萬個分子)做小分子對接,本地104核CPU需2.6至5年,在云上自動化構建并調度10萬核大規模算力集群后只用15.23小時就完成了所有任務。

去哪里堆?
企業自己采購機器,搞機房,或者直接用云,都可以。 

那么,直接找個新藥研發平臺呢?
CADD/AIDD研發人員不用身兼數職,甚至要干運維的活;
更輕松、高效地獲取超大規模資源,還可以自動化變大變小彈性伸縮;
Workflow自定義制作模板,降低團隊整體學習和溝通成本;自動化的方式替代人工,提高研發整體效率和管理效率。

做創新藥已經夠難了,充滿了不確定性。讓其他事情變簡單點?

先看幾個成果:

更多你想要的答案,這里應該都有

新藥研發平臺37問

一、云平臺支持哪些CADD/AIDD場景?
二、云平臺支持哪些應用?支持自定義工作流嗎?
三、對CADD/AIDD研發部門來說,有哪些好處?
四、對IT部門來說,有哪些好處?

云平臺支持哪些CADD/AIDD場景?

1、如何支持AIDD場景?
在AIDD方面,我們支持AlphaFold、RoseTTAFold等常用AI框架所需資料和快速環境的搭建,并支持更多組件按需集成。

2、平臺支持分子對接嗎?支持基因測序嗎?還支持哪些CADD場景?平臺可支持CADD中典型場景分子動力學模擬、分子對接、虛擬篩選等,并支持單細胞測序、全基因測序場景。 

3、蛋白與蛋白docking可以在平臺中運行嗎?DOCK發展到現在整合多步驟的HADDOCK、ClusPro、SwamDock、RosettaDock等等,該領域的算法不斷地升級迭代。平臺也能夠很方便地集成相關軟件,提供驗證環境。 

4、想要通過平臺篩選一些特定結構的分子,是否可以優化化合物庫?如果您能夠提供確切信息,可以一同討論優化。同時,我們也準備了很多開源的分子庫供大家使用,現在已支持Zinc、Drugbank、Maybridge、Enamine等。 

5、目前平臺中是否有自建的化合物數據庫?
CADD研究過程中,不論是靶點的發現和優化、還是先導化合物的發現和優化,開源的分子庫是必不可少的基礎數據。目前開源的分子庫數據分散各地,下載緩慢,格式不統一,更新頻率不等,導致無法統一使用和管理,數據資產作用發揮有限。所以我們構建了fastone自有的分子庫,并做好了進一步的數據準備。
例如:
1、數據預處理,合并或格式轉換;
2、數據后處理,去重或力場優化。

 6、你們可以協助做小分子設計嗎?
我們不直接提供具體的小分子設計,我們負責搭建IT和信息平臺,協助您完成相關的研發工作。

 7、基因數據量很大,平臺有什么好的解決辦法?
對于GB級別的增量數據,我們支持以混合云組網專線的方式優化上傳線路。傳輸通道使用DM工具,支持全自動化數據上傳,可充分利用帶寬,幫助用戶快速上傳、下載海量數據。
對于PB級別的存量數據,建議通過離線方式快速傳輸。 

8、最終結果能否在線可視化查看?
平臺支持圖片、表格、HTML等多種形式展現。

二、云平臺支持哪些應用?支持自定義工作流嗎?

9、云平臺能覆蓋到我常用的軟件嗎?我們支持常用的生物/化學計算類應用,包括:生物化學與分子生物學/化學工程/生物化學/應用化學/生物工程/藥物化學/分析化學/物理化學/高分子化學與物理。 

10、具體來說,支持哪些生物/化學計算類應用/工具?我們支持幾乎所有的生物/化學計算類應用/工具,包括:AutoDockVina、Amber、FastQC、DeltaVina、GATK、Gromacs、Schr?dinger、NetMHC、Rosetta、BCFtools等。

更多支持應用列表,歡迎文末掃碼添加小F獲取。

11、你們支持Alphafold嗎?
我們可以快速提供Alphafold等常用環境,方便用戶快速進行后續研究。

12、我們用的軟件是自己編譯的,你們平臺支持嗎?
支持。我們提供的集群環境鏡像已包含常見應用工具運行所需的依賴庫,用戶也可以自行安裝配置。

13、對于一些商業軟件例如Schr?dinger,你們提供License嗎?
商業軟件的License文件需要客戶自行提供,fastone提供License Server進行統一管理。

14、分子對接流程能不能自定義?上云之后每次都要重新弄一遍嗎?
很多時候,現成的應用往往無法滿足用戶的需求,需要根據自己的模型和研究目標,自定義設置一套獨有的工作流程。
特別是新藥研發所涉及的應用上,可以說幾乎沒有一模一樣的工作流。 我們已經實現了多款應用(如Vina、Amber)的自定義工作流,可以根據用戶的實際使用場景(包括入參文件、結果文件、流程使用方式、步驟以及相關說明等)實現自定義模板和腳本自動化。用戶也可以提供腳本,由我們協助完成并行化改造。

15、你們是否提供固定的工作流模板?
提供。
用戶在進行了一次或多次復雜的設定之后,能把這些設定保存成固定模板,不用重復手動去一步步重新設置。一次制作,反復使用,省時省力,還不用擔心中間出錯。而且,這套自定義的設置是可以跨應用存在的,不一定局限在一個應用范圍內。自己重復用,共享給團隊的其他人用,都可以。

16、你們是怎么幫助我們做工作流優化的?
我們有通用的框架。我們也有對應的CADD專家,可理解您的業務需求,快速設計出合理的相關流程。 

17、你們的云平臺如何與CADD應用相結合適配?
我們提供兩種模式進行適配:任務模式和集群模式。
集群模式為用戶提供了一個靈活的環境,用戶可在集群模式下進行一系列的調整和優化,自由度非常高。
如果您習慣使用圖形化界面操作,我們也提供圖形桌面,您可通過Web瀏覽器啟動集群,跳轉到虛擬桌面,并可在該桌面直接操作應用進行相應設置以開啟云端任務。當用戶在集群模式下跑通了之后,可以選擇將整個流程固化下來,方便更多研發人員使用。此時我們可以幫助用戶將此套流程轉換成固定的任務模式,讓更多的人可以使用這個成熟的框架,從而加速后續的整體研發效率。

三、對AIDD/CADD研發部門來說,有哪些好處?

18、你們的平臺容易操作嗎?用起來會不會很麻煩?
我們為AIDD/CADD研發人員提供了一整套即開即用的新藥研發環境,從登錄桌面、打開應用、配置、提交任務、自動上云開機運行任務并自動關機、查看結果進行調試……用戶所需要的操作與本地幾乎完全一致,每一步只需在平臺上使用鼠標簡單點選即可完成。、

 19、有些應用需要先跑完主任務再跑其他任務,上云可以智能化跑任務嗎?
有些應用在運算時存在依從機制,每若干個任務中包含1個主任務,只有當主任務運行結束后,其他任務才能開始并行運算。
由于任務有先后,所以需要先跑主任務,在每個主任務完成之后自動調度資源并行運算其他任務。
而不同任務完成時間可能不同,對資源的需求量可能時高時低有波動,最終結束關機時間也不同。
我們使用Slurm調度器按順序調度任務排隊,Auto-Scale功能可自動監控任務和資源需求,動態按需地開啟與關閉所需資源。詳細的自動化過程可參考27問。

20、做分子對接,動不動就是幾百萬上千萬個分子,太貴了,有節約成本的方案嗎?
分子對接規模如果巨大,有什么好的解決辦法能加快這個過程?怎么做到的?分子對接的一大特征是任務數量龐大而單個任務計算時間短,單個分子對接的時間通常在幾分鐘以內(與參數設置有關)。
這一特征天然匹配云端的SPOT實例。
當便宜且隨時可能被搶占中斷的SPOT實例遇到迷你卻海量的分子對接任務,簡直就是天造地設的一對。
1、常規分子對接任務幾分鐘即可算完,特別適合SPOT這種分分鐘可能被搶走的狀態;
2、fastone平臺具備自動重試功能,一個任務被中斷可以自動重新提交,任務之間互相不影響,重新提交單個任務影響很小。詳見《生信云實證Vol.3:提速2920倍!用AutoDock Vina對接2800萬個分子

21、任務量比較大,想提前預估一下費用再做決策,有沒有什么好辦法?
我們平臺預設了智能預測功能,以MOE為例。
用戶在fastone平臺的圖形化操作界面運算MOE任務,完成以下步驟:
1、用戶上傳數據文件(平臺自動解析文件,判斷其中包含的分子數量)
2、用戶輸入期望的運算時間(平臺推薦用戶適配機型或用戶自行選擇機型)
3、系統得出預測成本

項目負責人能夠非常方便地使用該功能預估項目費用,完成項目規劃和申請。 

22、我要跑TPU,你們支持嗎?
支持。
用戶可以通過我們平臺獲取到TPU資源。

23、有時會遇到CADD模擬出的結果與實際結果有一定出入,這是為什么?
CADD本身是模擬的結果,通過不斷的迭代,力場的優化,會不斷接近實際情況。CADD和實際的實驗數據相結合,反復設計和迭代,可以達到很好的效果。

24、有些任務需要使用大量的GPU資源,你們有嗎?
當單個云廠商的GPU資源難以滿足需求時,我們會根據用戶任務需要和特性,跨多家公有云廠商,智能自動化調度云端GPU異構資源,保證用戶對GPU的需求得到滿足。

 25、GPU資源很貴,有沒有節約成本的方案?
GPU資源在不同云廠商之間有著顯著的差異,而且往往資源多的售價高,便宜的資源少,同時兼顧成本和效率是必須要考慮的問題。以各大公有云廠商在北京地區的GPU實例(V100)按需價格為例,最高價格超過最低價2倍。

我們平臺可綜合考量用戶對完成任務所需時間和成本的具體要求,在多個云廠商的資源之間選擇最適配的組合方案,為用戶跨地區、跨云廠商調度所需資源。

26、用Amber跑任務,用GPU跑非常快,但是有時候會跑失敗,用CPU雖然穩定但是慢,你們怎么解決?
這是Amber18版本的固有問題,在使用GPU時計算時有10-15%概率失敗,需要及時調度CPU資源重新計算。我們平臺支持優先使用GPU計算,當任務失敗時,自動調用CPU重新計算。
該問題已在Amber20中修復。

對IT部門來說,有哪些好處?

27、現在公司里才幾臺機器,天天維護頭就很大了,云上這么多機器還不得把自己搞禿了?
云上的運行環境都是自動化配置的,不需要人工干預,用戶還可以通過平臺進行統一管理和監控,方便易操作。
舉個例子,我們的Auto-Scale功能可以自動監控用戶提交的任務數量和資源的需求,動態按需地開啟和關閉所需算力資源,在不夠的時候,還能根據不同的用戶策略,自動化調度本區域及其他區域的目標類型或相似類型實例資源。所有操作都是自動化完成,無需用戶干預。
下圖就是開啟Auto-Scale功能后,用戶某項目一周之內所調用云端計算資源的動態情況。
其中橙色曲線為OD實例的使用狀況,紅色曲線為SPOT的使用狀況。

Auto-Scale功能可以根據任務運算情況動態開啟云端資源,并在波峰過去后自動關閉,讓資源的使用隨著用戶的需求自動擴張及縮小,最大程度匹配任務需求。

28、你們是什么存儲策略?費用呢?冷存儲和熱存儲的費用是不一樣的,我們會根據用戶的情況提供個性化的解決方案。

29、數據備份的頻率如何?最高可以達到多少?現有策略怎樣?默認每周六進行數據備份,也可以根據客戶需求按天或按小時備份。

30、使用平臺的工作人員比較多,能否對每個人設置使用資源的上限?
fastone平臺的權限和角色管理功能,支持管理員角色對每一個用戶進行相關權限設定,包括預算使用上限和CPU核數使用上限,從而在全局角度管控項目的資源消耗。該功能與智能預測配合使用,能夠從多個層面對預算和資源進行全方位規劃。

31、公司里還有些機器能用,你們支持混合云模式嗎?
支持。
可以將本地機器做成集群,也可以基于本地機器搭建混合云平臺。我們支持本地資源不足的時候,自動溢出到云上。

32、你們怎么實現混合云?
云資源和本地之間通過安全的數據通道連接,所有資源在fastone平臺統一管理,有統一視圖,并按需智能調度,不改變用戶的使用習慣。

 33、公司里已經有機器了,再增加一套云環境,IT管理上會不會變麻煩?通過我們可以在不增加負擔的情況下對接多云,減少IT管理壓力。我們的自動化管理平臺很容易上手,對提升研發效率和資源利用率都有很大幫助。

34、我們公司有海外研發部門,用你們平臺方便嗎?
我們的平臺支持全球部署,我們會全球的優化組網,統一用戶管理,數據管理,優化的遠程接入方式,保持一致的用戶體驗。

35、云上云下的安全如何保障?
安全是一個立體的概念,包括系統安全、應用安全、流程安全、數據安全等很多方面。
云的基礎架構和傳統IT架構在安全方面并沒有本質上的區別,依然是利用計算節點和存儲資源。很多人覺得這兩者之間存在差異,我們認為這取決于個人的認知。本地的安全措施在云上都可以實現,同時云廠商本身還提供更強大的安全保障。

 36、數據安全如何實現?
數據全部通過安全協議傳輸,并支持RBAC的數據訪問認證鑒權。同時,我們還支持數據加密存儲,算法可自定義。

- END -

我們有個新藥研發云平臺
集成多種生命科學領域應用,大量任務多節點并行
應對短時間爆發性需求,連網即用
跑任務快,原來幾個月甚至幾年,現在只需幾小時
快速上手,拖拉點選可視化界面,無需代碼
支持高級用戶直接在云端創建集群 

掃碼免費試用,送200元體驗金,入股不虧~

更多電子書歡迎掃碼關注小F(ID:imfastone)獲取

你也許想了解具體的落地場景:

這樣跑COMSOL,是不是就可以發Nature了
Auto-Scale這支仙女棒如何大幅提升Virtuoso仿真效率?

1分鐘告訴你用MOE模擬200000個分子要花多少錢
LS-DYNA求解效率深度測評 │ 六種規模,本地VS云端5種不同硬件配置
揭秘20000個VCS任務背后的“搬桌子”系列故事
155個GPU!多云場景下的Amber自由能計算
怎么把需要45天的突發性Fluent仿真計算縮短到4天之內?

5000核大規模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子

從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
從30天到17小時,如何讓HSPICE仿真效率提升42倍?

關于為應用定義的云平臺:

解讀Hyperion年度報告:脫離場景談用量就是耍流氓
這一屆科研計算人趕DDL紅寶書:學生篇
一次搞懂速石科技三大產品:FCC、FCC-E、FCP

AI太笨了……暫時
【2021版】全球44家頂尖藥企AI輔助藥物研發行動白皮書
國內超算發展近40年,終于遇到了一個像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
花費4小時5500美元,速石科技躋身全球超算TOP500

圖片
The post 創新藥研發九死一生,CADD/AIDD是答案嗎? appeared first on 速石科技BLOG.]]>
http://www.youjiajingji.com/blog/aiddcaddjd/feed/ 0