第三個(gè)千年開(kāi)始之際,人類醒來(lái),伸展手腳……來(lái)瞧瞧今天有什么重要的事吧 ---《未來(lái)簡(jiǎn)史》
我們總需要時(shí)常回顧過(guò)去,不只是為了懷念,更多是為了找尋通往未來(lái)的一點(diǎn)線索。如果運(yùn)氣再好一些,說(shuō)不定能發(fā)現(xiàn)一些點(diǎn)(leng)子(fan)可以被翻出來(lái)再引人注目。例如AI的發(fā)展,就經(jīng)歷了若干次熱潮,最近的一波我們還身在其中。與此相比,高性能計(jì)算似乎一直很熱,又一直離我們很遠(yuǎn)。說(shuō)高性能計(jì)算一直很熱,是因?yàn)閺奶旌映?jí)計(jì)算機(jī)開(kāi)始,中國(guó)就加入了超級(jí)計(jì)算機(jī)的全球軍備競(jìng)賽,年年?duì)帄Z超算世界冠軍;說(shuō)離我們遠(yuǎn),是因?yàn)槲覀冊(cè)谌粘5墓ぷ魃钪幸?jiàn)識(shí)超級(jí)計(jì)算機(jī)的機(jī)會(huì)并不多。事實(shí)上,高性能計(jì)算(HPC)離我們近在咫尺:路上開(kāi)的車,發(fā)動(dòng)機(jī)、底盤、車架,從內(nèi)到外的設(shè)計(jì)都離不開(kāi)HPC;生病吃的藥,研發(fā)過(guò)程是從計(jì)算模擬開(kāi)始的;無(wú)數(shù)的電影特效,是在HPC上制作的……有意思的是,在過(guò)去的一年,高性能計(jì)算又頻繁被提及,變成了一個(gè)熱門話題。
不一樣的高性能計(jì)算
算1-1-1024x609.jpg)
如今被頻繁提及的高性能計(jì)算和傳統(tǒng)的HPC已經(jīng)大不相同了。包括AI、生命科學(xué)、計(jì)算化學(xué)家等技術(shù)的突飛猛進(jìn)無(wú)疑凸顯了對(duì)計(jì)算力的強(qiáng)烈需求,從而推動(dòng)了HPC的發(fā)展和變化。在前不久結(jié)束的HPC China 2018大會(huì)上,英特爾院士、英特爾HPC戰(zhàn)略總監(jiān)Mark Seager在大會(huì)主題演講中就提到,AI市場(chǎng)將從2017年的25億美元成長(zhǎng)為2022年的80-100億美元,年復(fù)合增長(zhǎng)率達(dá)到30%,但是現(xiàn)有的平臺(tái)技術(shù)(包括HPC)依然不能很好的滿足AI的算力需求。那么問(wèn)題具體出現(xiàn)在哪里?我們覺(jué)得至少有以下幾點(diǎn)值得注意:
- 異構(gòu)的計(jì)算單元——以AI輔助研發(fā)為應(yīng)用場(chǎng)景的HPC,必然涉及大量異構(gòu)的計(jì)算單元,包括各種性能的CPU節(jié)點(diǎn)、GPGPU節(jié)點(diǎn)、專用ASIC計(jì)算模塊、FPGA模塊、TPU和新興的AI專用芯片等
- 更大的計(jì)算規(guī)模——以計(jì)算機(jī)輔助藥物研發(fā)為例,涉及高通量篩選的計(jì)算過(guò)程,常常需要數(shù)以萬(wàn)計(jì)的CPU核做并行計(jì)算。設(shè)想如果同時(shí)提交多個(gè)這樣的計(jì)算任務(wù),計(jì)算規(guī)模又會(huì)成倍增長(zhǎng)
- 多樣化的數(shù)據(jù)存儲(chǔ)——與傳統(tǒng)HPC環(huán)境不同,越來(lái)越多的企業(yè)的數(shù)據(jù)來(lái)源于不同的數(shù)據(jù)源,存放在不同的存儲(chǔ)介質(zhì),存儲(chǔ)的性能和容量可能差別巨大。單一的一套分布式文件系統(tǒng)已經(jīng)不能滿足多樣化的存儲(chǔ)需求了
- 硬件更新異常迅速——僅2018年,全球至少發(fā)布了約10款A(yù)I芯片,2代GPGPU,加上FPGA解決方案等,硬件的更新已經(jīng)不是以年,而是以月計(jì)。為了跟上硬件的更新,需要更迅速有效的系統(tǒng)方案,動(dòng)輒幾個(gè)月的部署上線時(shí)間是不能接受的
- 融合網(wǎng)絡(luò)——也許軟件定義網(wǎng)絡(luò)還不是HPC必須的配置,但無(wú)疑更快速靈活的網(wǎng)絡(luò)管理和動(dòng)態(tài)優(yōu)化是必須的
總之,應(yīng)用場(chǎng)景的變化和對(duì)計(jì)算力的極度渴求正賦予HPC全新的使命。
為什么是現(xiàn)在?
算2-1024x652.jpg)
AI早就不是一個(gè)新學(xué)科了,生命科學(xué)也持續(xù)在發(fā)展,那為什么這些領(lǐng)域的用戶似乎是一夜之間都對(duì)算力如此饑渴?我們覺(jué)得一個(gè)很重要的原因在于數(shù)據(jù)。
這個(gè)表是Gartner評(píng)選出的2010年-2017年間最酷的存儲(chǔ)公司。其中Pure,Nimble和Violin Memory是上市了的。Nimble和Violin Memory先后被收購(gòu),Pure也沒(méi)有實(shí)現(xiàn)PK掉EMC的豪言壯語(yǔ)。更有意思的是,EMC也在不久前與Dell合并,不再是一家獨(dú)立的公司。對(duì)此,我們的解讀是,數(shù)據(jù)存儲(chǔ)依然是一個(gè)巨大且增長(zhǎng)的市場(chǎng),但是已經(jīng)有很多很好的產(chǎn)品和解決方案(包括云存儲(chǔ))可供用戶選擇,跑馬圈地式的發(fā)展已經(jīng)是過(guò)去時(shí)了。同時(shí),從用戶的角度看,存儲(chǔ)雖然不是一個(gè)已經(jīng)完全被解決的問(wèn)題,但在過(guò)去的這些年,用各種存儲(chǔ)產(chǎn)品和方案,也能把他們需要的數(shù)據(jù)積累下來(lái)。
接下來(lái)的問(wèn)題,就是這些數(shù)據(jù)如何為用戶產(chǎn)生價(jià)值。如果把這些還在不斷積累的數(shù)據(jù)看做金礦(真的是金礦),那大量的計(jì)算就是挖掘金礦的工具,更高性能的計(jì)算能力就是現(xiàn)代化金礦挖掘機(jī)!
擁抱改變
要用更快的速度挖出更多的金子,就必須解決我們之前提到的一系列問(wèn)題。這些改變是每一個(gè)用戶都需要,并希望盡快實(shí)現(xiàn)的:
功能與硬件的解耦——底層硬件依然在飛速發(fā)展,異構(gòu)計(jì)算也方興未艾。用戶如何應(yīng)對(duì)最底層硬件的更新?一個(gè)可行的方法是添加軟件的抽象層,將硬件能力封裝,例如TensorFlow
擁抱云計(jì)算——云的規(guī)模優(yōu)勢(shì)非常明顯,可以提供更新更快的硬件,但也會(huì)帶來(lái)額外的復(fù)雜性。對(duì)此,可以嘗試從策略驅(qū)動(dòng)的資源調(diào)度、負(fù)載自動(dòng)溢出到云端、云原生優(yōu)化等方面著手。根據(jù)Univa在2018年對(duì)超過(guò)250家企業(yè)客戶的調(diào)查,相比2017年,客戶對(duì)在混合云上運(yùn)行HPC的興趣增長(zhǎng)了10倍,有61%的用戶表示他們將會(huì),或已經(jīng)在使用混合云運(yùn)行HPC應(yīng)用
更高帶寬、更低延遲的網(wǎng)絡(luò)——這包括單個(gè)數(shù)據(jù)中心內(nèi)部的高速網(wǎng)絡(luò)和跨數(shù)據(jù)中心的網(wǎng)絡(luò)。在這一領(lǐng)域的一個(gè)榜樣是Equinix和一家HPC初創(chuàng)公司RStor共同建立的多云之間的高速網(wǎng)絡(luò)
我們相信,更高效的計(jì)算會(huì)讓我們從海量的數(shù)據(jù)中挖掘出更有價(jià)值的成果,會(huì)更深刻的改變我們所生存的世界!
- END -
關(guān)于我們:
速石科技專為有高算力需求的企業(yè)級(jí)用戶提供一站式算力運(yùn)營(yíng)解決方案,幫助用戶提升10-20倍業(yè)務(wù)運(yùn)算效率,降低成本達(dá)到75%以上,加快市場(chǎng)響應(yīng)速度。目前主要應(yīng)用領(lǐng)域包括藥物研發(fā)、基因測(cè)序分析、半導(dǎo)體行業(yè)的EDA仿真及電路設(shè)計(jì)、汽車行業(yè)的自動(dòng)駕駛開(kāi)發(fā)、虛擬碰撞試驗(yàn)以及AI人工智能。
想了解更多,可添加小F微信(ID:imfastone)
文章推薦:
>>AWS、阿里云、Azure、Google Cloud、華為云、騰訊云 各種云服務(wù)器價(jià)格收費(fèi)對(duì)比(上)
>>云資源中的低成本戰(zhàn)斗機(jī)——競(jìng)價(jià)實(shí)例,AWS、阿里云等六家云廠商完全用戶使用指南
>>全球半導(dǎo)體行業(yè)上云格局一覽和十個(gè)上云實(shí)踐問(wèn)題的過(guò)來(lái)人解答