國(guó)家超級(jí)計(jì)算濟(jì)南中心、國(guó)家超級(jí)計(jì)算深圳中心、國(guó)家超級(jí)計(jì)算無錫中心、國(guó)家超級(jí)計(jì)算鄭州中心、上海高性能集成電路設(shè)計(jì)中心、成都申威科技有限責(zé)任公司、天津飛騰信息技術(shù)有限公司。
這不是超算第一次上榜。
2019年6月,美國(guó)商務(wù)部實(shí)體清單將5家中國(guó)超算機(jī)構(gòu)或企業(yè)列入,分別為中科曙光、天津海光、成都海光集成電路公司、成都海光微電子技術(shù)公司,以及無錫江南計(jì)算技術(shù)研究所。
這是以拜登為首的新一屆美國(guó)政府正式實(shí)施的首殺。
很可能代表了美國(guó)政府在接下來十年對(duì)中國(guó)的態(tài)度。
美國(guó)商務(wù)部表示,這七家實(shí)體“參與了建造超級(jí)計(jì)算機(jī),并用于中國(guó)軍方行動(dòng),足以破壞現(xiàn)有世界格局的軍事現(xiàn)代化發(fā)展以及大規(guī)模殺傷性武器計(jì)劃”。
美國(guó)商務(wù)部長(zhǎng)Gina Raimondo在一份聲明中表示:“超級(jí)計(jì)算能力對(duì)于幾乎所有的現(xiàn)代武器和國(guó)家安全系統(tǒng)的發(fā)展都至關(guān)重要,比如核武器和高超音速武器。”
軍工、武器這種官方理由,當(dāng)然不過是幌子。
真實(shí)理由是:
海量數(shù)據(jù)與構(gòu)建于其上的超級(jí)計(jì)算能力能決定一個(gè)國(guó)家的競(jìng)爭(zhēng)實(shí)力。
截止目前為止,美國(guó)封殺的五大主體:
· 半導(dǎo)體行業(yè)企業(yè)
· 高科技公司尤其是人工智能相關(guān)公司
· 理工類高校及科研機(jī)構(gòu)
· 航空/船舶/能源/通訊類公司
· 超算機(jī)構(gòu)相關(guān)
指向性極其明顯。
他拉黑誰,
誰就代表著我們的未來,
正在或即將卡住美國(guó)的脖子。
計(jì)算力有三個(gè)核心來源:本地服務(wù)器,超算中心,云計(jì)算。
從1983年到現(xiàn)在,中國(guó)超算已經(jīng)發(fā)展了近40年。在最新一期全球超算TOP500排行榜中,中國(guó)共有214臺(tái)超算入選,總數(shù)位居全球第一,遠(yuǎn)遠(yuǎn)超過第二名美國(guó)的113臺(tái)。
2011年,神威藍(lán)光問世,這是以國(guó)產(chǎn)多核CPU芯片為基礎(chǔ)的第一臺(tái)超級(jí)計(jì)算機(jī),我們終于擺脫了只能用國(guó)外芯片生產(chǎn)超級(jí)計(jì)算機(jī)的歷史。
而從2010年開始,國(guó)內(nèi)云計(jì)算也已經(jīng)走過了10年。
我們2019年就純粹用公有云算力跑進(jìn)了全球超算TOP500榜單。
如果說計(jì)算力是火藥,千行百業(yè)才是盛放的煙花。
最終的戰(zhàn)場(chǎng),不是榜單,也不是實(shí)驗(yàn)室,永遠(yuǎn)是產(chǎn)業(yè)和生態(tài)。
藥物研發(fā),芯片設(shè)計(jì)與制造,智能制造,金融科技,人工智能等創(chuàng)新研發(fā)驅(qū)動(dòng)型產(chǎn)業(yè)的發(fā)展,倒逼對(duì)數(shù)據(jù)和算力的需求飛速增長(zhǎng)。
比如2020年5月發(fā)布的GPT-3模型:1750億參數(shù),45TB預(yù)先訓(xùn)練數(shù)據(jù)量。相比初代,算法模型基本沒有變化,但對(duì)GPU/TPU計(jì)算資源的需求已經(jīng)千倍增長(zhǎng)。
而以一款5G芯片為例,該芯片采用7納米工藝,在流片之前的最后仿真環(huán)節(jié),需要的算力高達(dá)1200萬核時(shí),比14納米工藝所需要的算力高出5倍。
以前,計(jì)算力是稀缺資源,超級(jí)計(jì)算機(jī)造價(jià)昂貴、體型巨大,只有少數(shù)大型企業(yè)和政府單位才配擁有。近幾年,超算漸漸走下神壇,對(duì)外開放了一些商用入口;而云計(jì)算本質(zhì)為商用而生,對(duì)所有企業(yè)跟個(gè)人一視同仁。
計(jì)算資源正在成為一種像水電煤一樣的通用服務(wù)。
而從這幾年我們接觸的不同行業(yè)用戶來看,他們使用的高算力需求的應(yīng)用,每一年的計(jì)算資源用量3-5倍的增長(zhǎng),對(duì)數(shù)據(jù)存儲(chǔ)和管理需求也越來越高,這對(duì)于中國(guó)的企業(yè)來講是一個(gè)非常大的轉(zhuǎn)變和明顯突破。
我們的未來,可能就在他們中間。
相關(guān)閱讀:
國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手
花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500
【2021】全球44家頂尖藥企AI輔助藥物研發(fā)行動(dòng)白皮書
告別2020:Cloud HPC的征途,literally,是星辰大海呀
幫助CXO解惑上云成本的迷思,看這篇就夠了
15小時(shí)虛擬篩選10億分子,《Nature》+HMS驗(yàn)證云端新藥研發(fā)未來
全球半導(dǎo)體行業(yè)上云格局一覽和十個(gè)上云實(shí)踐問題的過來人解答
- END -
我們有個(gè)為應(yīng)用定義的云平臺(tái)
集成多種應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對(duì)短時(shí)間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來幾個(gè)月甚至幾年,現(xiàn)在只需幾小時(shí)
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無需代碼
支持高級(jí)用戶直接在云端創(chuàng)建集群
掃碼免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
更多電子書
歡迎掃碼關(guān)注小F(ID:imfastone)獲取
你也許想了解具體的落地場(chǎng)景:
揭秘20000個(gè)VCS任務(wù)背后的“搬桌子”系列故事
155個(gè)GPU!多云場(chǎng)景下的Amber自由能計(jì)算
怎么把需要45天的突發(fā)性Fluent仿真計(jì)算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對(duì)接2800萬個(gè)分子
從4天到1.75小時(shí),如何讓Bladed仿真效率提升55倍?
從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
首先,一點(diǎn)背景知識(shí)。是什么讓超級(jí)計(jì)算機(jī)如此與眾不同?嗯,這個(gè)定義有點(diǎn)難確定。
一般認(rèn)為,超級(jí)計(jì)算機(jī)是指一臺(tái)擁有超級(jí)算力的計(jì)算機(jī),它在任何給定的時(shí)間點(diǎn)上都是世界上最強(qiáng)大、最快的系統(tǒng)之一。
術(shù)語“超級(jí)計(jì)算”是指使用并行工作的多個(gè)計(jì)算機(jī)系統(tǒng)(即“超級(jí)計(jì)算機(jī)”),集中計(jì)算資源來處理一些大量而復(fù)雜的數(shù)據(jù)運(yùn)算問題。通常這樣一個(gè)系統(tǒng),是以任何計(jì)算機(jī)的最大潛在性能工作的,通常以千兆次計(jì)算。
超級(jí)計(jì)算使分析和解決問題的速度大大提升,這在標(biāo)準(zhǔn)計(jì)算機(jī)(如流體動(dòng)力學(xué)計(jì)算)中是根本不可能的,因?yàn)楹臅r(shí)又昂貴。今天,大數(shù)據(jù)賦予了超級(jí)計(jì)算機(jī)更重要的使用價(jià)值。一臺(tái)超級(jí)計(jì)算機(jī)可以從冗繁又無序的海量信息中提取到最關(guān)鍵的因子,從而為人類的商業(yè)活動(dòng)提供更準(zhǔn)確的決策依據(jù)、為科學(xué)研究提供更精確的仿真建模樣本。
高性能計(jì)算(HPC)基于超算發(fā)展而來的有用的變體,使得集中計(jì)算資源解決數(shù)據(jù)分析問題成為可能,而無需花費(fèi)一臺(tái)全尺寸的超級(jí)計(jì)算機(jī)。
數(shù)字化轉(zhuǎn)型和從海量數(shù)據(jù)中提取關(guān)鍵因子進(jìn)行分析和洞察的需求是普遍存在的。因此,支持這些需求的超級(jí)計(jì)算基礎(chǔ)設(shè)施也必須是通用的,從小型企業(yè)到大型國(guó)家實(shí)驗(yàn)室,每個(gè)組織都可以使用。
由于摩爾定律使曾經(jīng)不可能的事情成為可能,企業(yè)開始尋求更加強(qiáng)大的計(jì)算技術(shù)。超級(jí)計(jì)算機(jī)是當(dāng)前世界上速度最快的計(jì)算機(jī)之一。超級(jí)計(jì)算機(jī)曾經(jīng)是政府和高端研究實(shí)驗(yàn)室的領(lǐng)域,執(zhí)行模擬核裝置爆炸或分析大規(guī)模天氣和氣候現(xiàn)象等任務(wù)。但事實(shí)證明,只要稍加調(diào)整,這項(xiàng)工作中使用的算法對(duì)商業(yè)是非常有用的。
現(xiàn)代超級(jí)計(jì)算通常是通過一種稱為大規(guī)模并行處理的技術(shù)來完成的(計(jì)算機(jī)內(nèi)部有許多微處理器同時(shí)工作,一起解決問題)。速度最快的超級(jí)計(jì)算機(jī)是使用數(shù)百個(gè)微處理器制造的,它們都經(jīng)過編程,可以作為一個(gè)超級(jí)大腦協(xié)同工作。
另一種稱為網(wǎng)格計(jì)算的技術(shù)正在進(jìn)一步改變超級(jí)計(jì)算的經(jīng)濟(jì)性。網(wǎng)格計(jì)算是分布式計(jì)算的一種,網(wǎng)格計(jì)算研究如何把一個(gè)需要非常大的計(jì)算能力才能解決的大問題分解成若干個(gè)小的計(jì)算任務(wù),然后把這些小計(jì)算任務(wù)分配給多個(gè)計(jì)算機(jī)同時(shí)進(jìn)行處理,最后把這些計(jì)算結(jié)果整合起來,得到最終結(jié)果。有了網(wǎng)格計(jì)算,公司在現(xiàn)有的個(gè)人電腦或服務(wù)器上安裝了特殊的軟件,使這些計(jì)算機(jī)能夠在一個(gè)共同的問題上協(xié)同工作。大型企業(yè)可能建有本地機(jī)房,本地機(jī)房一般由數(shù)千臺(tái)計(jì)算機(jī)組成,但它們不一定總是在滿負(fù)荷的運(yùn)行中。在計(jì)算需求低谷時(shí)期,會(huì)有很大一部分計(jì)算機(jī)處于閑置狀態(tài)。通過安裝網(wǎng)格軟件,這些閑置設(shè)備可以被組編成計(jì)算集群,來進(jìn)行復(fù)雜的計(jì)算任務(wù),就好像它們是一臺(tái)大型的并行超級(jí)計(jì)算機(jī)一樣。這樣,本地機(jī)房里閑置的普通計(jì)算機(jī)可以得到充分利用,而網(wǎng)格軟件又使計(jì)算集群的整體計(jì)算能力大大提高,計(jì)算成本由此降低。
多核、大規(guī)模并行和網(wǎng)格計(jì)算都是相關(guān)的。把多核芯片想象成在一個(gè)芯片中有幾個(gè)處理器。把大規(guī)模并行的超級(jí)計(jì)算機(jī)想象成在一臺(tái)計(jì)算機(jī)上有幾個(gè)芯片,把網(wǎng)格計(jì)算看作是利用現(xiàn)有的計(jì)算機(jī)一起完成一項(xiàng)任務(wù)(本質(zhì)上是一臺(tái)由多臺(tái)計(jì)算機(jī)組成的計(jì)算機(jī))。雖然這些技術(shù)提供了巨大的希望,但它們都受到相同的限制:必須編寫軟件,將現(xiàn)有問題分成可由每個(gè)內(nèi)核、處理器或計(jì)算機(jī)分別處理的小塊。
世界上第一臺(tái)超級(jí)計(jì)算機(jī)是位于英國(guó)的巨無霸。它的設(shè)計(jì)初衷是在第二次世界大戰(zhàn)期間讀取信息和破解德國(guó)密碼,它每秒最多可以讀取5000個(gè)字符。但是將其與每秒完成42.5萬億次運(yùn)算的現(xiàn)役美國(guó)宇航局哥倫比亞超級(jí)計(jì)算機(jī)相比較,你就會(huì)發(fā)現(xiàn)計(jì)算機(jī)的運(yùn)算速度,在短短的幾十年里有著怎樣天翻地覆的革新。換言之,過去的超級(jí)計(jì)算機(jī)現(xiàn)在僅可以稱得上是一個(gè)令人滿意的計(jì)算器,而我們現(xiàn)在所說的超級(jí)計(jì)算機(jī)是任何計(jì)算機(jī)所能達(dá)到的最先進(jìn)的。
然而,有一些東西使計(jì)算機(jī)分支進(jìn)入“超級(jí)”領(lǐng)域。它通常有一個(gè)以上的中央處理器(CPU),這使得計(jì)算機(jī)可以更快地進(jìn)行電路切換,同時(shí)完成更多的任務(wù)。(正因?yàn)槿绱耍慌_(tái)超級(jí)計(jì)算機(jī)也將擁有大量的存儲(chǔ)空間,因此它可以一次訪問許多任務(wù))它還可以進(jìn)行向量運(yùn)算,這意味著它可以計(jì)算多個(gè)操作列表,而不是一次只計(jì)算一個(gè)。
以上就是超級(jí)計(jì)算機(jī)的背景知識(shí)。
-END-
關(guān)于超算,你可能想了解更多:
關(guān)于超算 VS 高性能計(jì)算云,可以參考下文:
關(guān)于高性能計(jì)算云平臺(tái),更多內(nèi)容請(qǐng)參考:
關(guān)于云計(jì)算,請(qǐng)參考:
The post WIKI:超級(jí)計(jì)算機(jī)的概念詳解 appeared first on 速石科技BLOG.]]>全球超算TOP500排行榜 就屬于各個(gè)國(guó)家秀肌肉的典型比賽,每年兩次。
而云計(jì)算,天生互聯(lián)網(wǎng)基因,為追逐商業(yè)利益而生。
2006年,AWS正式對(duì)外開放。
2010年,阿里云正式對(duì)外。中國(guó)開始有了云計(jì)算。
超算近40年,云計(jì)算10年。
超算開始走下神壇,對(duì)外開放了一些商用的入口。比如我們找到了用“天河二號(hào)”來渲染某些群眾喜聞樂見的動(dòng)畫片的證據(jù)——
而飛速發(fā)展的云計(jì)算,甚至讓超算界逐漸有了“云超算”或者“超算云”的發(fā)展趨勢(shì)。
2019年11月,我們只花了5000美金,用4個(gè)小時(shí)調(diào)用云算力跑進(jìn)了全球超算TOP500榜單,成為全球第二、亞洲唯一一家完全用公有云算力躋身超級(jí)計(jì)算機(jī)榜單的公司。詳情參考:《上榜啦~花費(fèi)4小時(shí)5500美元,速石科技躋身全球超算TOP500》
超算發(fā)展了那么多年,終于遇到了一個(gè)像樣的對(duì)手。
超算中心跟云計(jì)算中心到底有什么區(qū)別?
普通人怎么使用超算?
用超算工作是怎樣的一種體驗(yàn)?
對(duì)于HPC(高性能計(jì)算)用戶,云服務(wù)商和超算中心誰更有優(yōu)勢(shì)?
……
我們對(duì)國(guó)內(nèi)超算中心和云計(jì)算中心進(jìn)行一番全方位的對(duì)比,有以下結(jié)論:
1、超算總節(jié)點(diǎn)數(shù)不超過10萬,云服務(wù)器總規(guī)模超過100萬;
2、大部分超算資源不對(duì)外開放,云資源完全商業(yè)化,只對(duì)單個(gè)用戶有配額限制;
3、超算提供基于傳統(tǒng)HPC場(chǎng)景的一整套垂直方案,云基于IaaS層提供豐富的產(chǎn)品和服務(wù)種類供用戶選擇;
4、使用超算和云資源,對(duì)用戶來說,各有各的難度;
5、超算只有排隊(duì)作業(yè)和獨(dú)占節(jié)點(diǎn)兩種計(jì)費(fèi)方式,云一般有按需、預(yù)留、競(jìng)價(jià)實(shí)例三種,使用靈活性和彈性高;
6、超算申請(qǐng)步驟繁瑣、審核麻煩、商用昂貴,云幾乎沒有門檻;
7、超算的平均硬件更新周期一般為數(shù)年,而用戶能夠以最快的速度在云端體驗(yàn)最新硬件;
8、云擁有完整的第三方合作伙伴生態(tài)來更好地服務(wù)客戶;
9、超算正在嘗試向云靠攏。
我們有一份2020年新版《六大云廠商資源價(jià)格對(duì)比工具包》以及一份在撰寫本文過程中收集整理的國(guó)內(nèi)超算整體數(shù)據(jù)信息,歡迎文末掃碼添加小F微信獲取~
以下是對(duì)比正文
主要包含三個(gè)指標(biāo):總規(guī)模、可用規(guī)模和短時(shí)最大可調(diào)用規(guī)模。
1、總規(guī)模
我們盤點(diǎn)了中國(guó)已落成的主要超算中心的總節(jié)點(diǎn)數(shù)量,總數(shù)為54588個(gè),其中未包括一些正在建設(shè)中的超算中心,以及小型超算中心。
即便加上這些數(shù)量,中國(guó)超算中心的總節(jié)點(diǎn)數(shù)量級(jí)也未過十萬。
那么國(guó)內(nèi)主流云廠商有多少臺(tái)服務(wù)器呢?
雖然各大云廠商并沒有公開自身的服務(wù)器總數(shù),但我們可以從其可用區(qū)的數(shù)量來進(jìn)行推算。可用區(qū)的概念是一個(gè)數(shù)據(jù)中心群,通常包含若干個(gè)超大規(guī)模數(shù)據(jù)中心。
2018年6月,阿里云宣布已在全球18個(gè)地域開放了44個(gè)可用區(qū),當(dāng)時(shí)國(guó)泰君安出的投研報(bào)告估算其服務(wù)器總量超過50萬臺(tái),即單個(gè)可用區(qū)約有1.14萬臺(tái)服務(wù)器。
如今阿里云在全球共有63個(gè)可用區(qū),其中國(guó)內(nèi)有41個(gè)。可推算出阿里云在全球約有71.5萬臺(tái)服務(wù)器,國(guó)內(nèi)約為46.5萬臺(tái)。
根據(jù)IDC公布的中國(guó)公有云市場(chǎng)份額占比,阿里云以46.5萬臺(tái)服務(wù)器搶下了超過40%的市場(chǎng)份額,我們據(jù)此反推出國(guó)內(nèi)云廠商的服務(wù)器總量超過116萬臺(tái),與超算中心完全不在一個(gè)數(shù)量級(jí),可以看下圖感受一下差距。
2、可用規(guī)模
傳統(tǒng)超算中心是典型的圈地自萌,各個(gè)中心之間互不相通。
而云計(jì)算中心的各個(gè)可用區(qū)之間是可以打通的,甚至還可以在不同云廠商之間通過API調(diào)用打通使用,這意味著云計(jì)算中心的可用規(guī)模約等于其總規(guī)模。
超算中心需要保障有充足的算力供給國(guó)家級(jí)科研項(xiàng)目,通常只會(huì)拿出少量的資源對(duì)外開放,且對(duì)單個(gè)用戶申請(qǐng)的資源上限進(jìn)行嚴(yán)格審核,如國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心規(guī)定單個(gè)用戶最多使用100個(gè)節(jié)點(diǎn),不到其節(jié)點(diǎn)總數(shù)的5%。
云計(jì)算中心對(duì)于單個(gè)用戶也有類似的限制,稱為“服務(wù)配額”,該配額根據(jù)賬號(hào)的使用情況與可用區(qū)的實(shí)際情況而定。
跟信用卡額度有異曲同工之妙。
3、短時(shí)最大可調(diào)用規(guī)模
云計(jì)算的一大特色就是具備短時(shí)間內(nèi)大規(guī)模調(diào)用海量計(jì)算資源的能力,這一能力已在各行各業(yè)經(jīng)過了充分的驗(yàn)證。
前不久,哈佛大學(xué)醫(yī)學(xué)院在《Nature》發(fā)布了VirtualFlow開源藥物發(fā)現(xiàn)平臺(tái),稱利用該平臺(tái)調(diào)用16萬個(gè)CPU對(duì)接10億個(gè)分子僅耗時(shí)約15小時(shí),而使用1萬個(gè)CPU則需要2周,具體可戳這里:《15小時(shí)虛擬篩選10億分子,Nature+HMS驗(yàn)證云端新藥研發(fā)未來》
再看一般難獲取的GPU資源。
2019年11月,SDSC圣地亞哥超級(jí)計(jì)算中心聯(lián)合威斯康星州冰立方粒子天體物理中心在AWS,Azure 和 Google云上一共調(diào)度了超過5萬GPU完成一次仿真模擬計(jì)算試驗(yàn)。
圖片來源:IgorSfiligoi, SDSC/加州大學(xué)圣地亞哥分校
這次計(jì)算,基于云的集群提供了全球排名第一超算中心峰值90%的性能。詳情見
《2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC領(lǐng)域年均復(fù)合增長(zhǎng)率超21%》
超算并不具備這樣的靈活性,我們將在后面的部分討論申請(qǐng)超算資源的種種門檻。
超算中心與云計(jì)算中心在總規(guī)模,可用規(guī)模,短時(shí)最大可調(diào)用規(guī)模上均存在相當(dāng)大的差距。
如果說超算中心是套餐,基本都給你配好了;
云計(jì)算中心就是自助餐,想怎么搭就怎么搭。
超算中心面向的是典型的傳統(tǒng)高性能計(jì)算(HPC)場(chǎng)景,基于大規(guī)模并行計(jì)算而設(shè)計(jì)的,在基礎(chǔ)架構(gòu)上進(jìn)行了一定的適配,提供的是一整套垂直方案,這使得超算的專用性極強(qiáng),而通用性則較弱,因此提供的產(chǎn)品與服務(wù)較為固定化。
而云則是基于IaaS層服務(wù),更底層和模塊化,提供的是層級(jí)豐富、類型多樣的產(chǎn)品和服務(wù),軟件定義的特點(diǎn)使其可以根據(jù)任務(wù)自由分配資源,在面對(duì)不同的用戶時(shí)通用性更強(qiáng),用戶可以根據(jù)需要自行搭配使用。
我們將分為基礎(chǔ)資源、附加服務(wù)、使用難度三方面來對(duì)比:
1、基礎(chǔ)資源
基礎(chǔ)資源包括計(jì)算資源、存儲(chǔ)空間、網(wǎng)絡(luò)帶寬。
超算的計(jì)算節(jié)點(diǎn)是影響性能指標(biāo)的核心部分,過去的超算大多采用同構(gòu)計(jì)算(由純CPU組成計(jì)算節(jié)點(diǎn)),后來研究人員發(fā)現(xiàn)GPU在計(jì)算加速上優(yōu)勢(shì)巨大,于是不少超算開始采用異構(gòu)計(jì)算(由CPU+GPU組成計(jì)算節(jié)點(diǎn)),其中CPU和GPU均可單獨(dú)對(duì)外出租。
而云計(jì)算中心除了常見CPU和GPU之外,還包括FPGA和TPU,相比超算中心更為豐富。
傳統(tǒng)超算中心的節(jié)點(diǎn)是物理機(jī),幾乎沒有調(diào)整余地。
比如國(guó)家超級(jí)計(jì)算天津中心“天河一號(hào)”的節(jié)點(diǎn)配置為:雙路12核,2*Intel Xeon X5670@2.93GHz+Tesla M2050,內(nèi)存24GB/48GB
一張表就涵蓋了整個(gè)超算中心能提供的所有的計(jì)算資源、存儲(chǔ)空間、網(wǎng)絡(luò)帶寬。
長(zhǎng)沙中心的基礎(chǔ)資源則包括以下內(nèi)容:
雖然相比天津中心有了更多的選擇,但整體選擇余地依然不大。
云計(jì)算中心主要提供的是虛擬資源,用戶能夠享受到更為豐富的計(jì)算資源選擇。
如某公有云廠商的企業(yè)級(jí)云服務(wù)器ECS分為通用型、計(jì)算型、內(nèi)存型、大數(shù)據(jù)型、GPU型、本地SSD型、高主頻型、FPGA型、彈性裸金屬九大類,其中每一種類型還可以選擇與不同存儲(chǔ)和網(wǎng)絡(luò)的組合。
存儲(chǔ)空間方面,可以選擇20-500GiB不等的高效云盤或SSD云盤作為系統(tǒng)盤,單塊數(shù)據(jù)盤最多則可配到32768GiB。
網(wǎng)絡(luò)帶寬的選擇范圍也很大,用戶可以選擇“按固定帶寬”和“按使用流量”兩種帶寬計(jì)費(fèi)模式,前者的帶寬值可選范圍為1-200M,后者的帶寬峰值可選范圍為1-100M。
綜合計(jì)算資源、存儲(chǔ)空間、網(wǎng)絡(luò)帶寬,云計(jì)算中心給用戶提供了更多選擇的空間。
2、附加服務(wù)
在基礎(chǔ)資源之外,超算中心偶爾也會(huì)提供一些附加服務(wù),但并不多見,如某高校超算中心為用戶提供以下服務(wù):
云計(jì)算中心提供的服務(wù)完全就是另一幅畫風(fēng)了,就看你想要什么吧。
3、使用難度
說起使用難度,超算中心與云計(jì)算中心各有各的難。
在系統(tǒng)方面,主流超算大多使用Linux系統(tǒng),對(duì)于許多習(xí)慣了圖形界面操作系統(tǒng)的用戶而言,存在一定的上手難度。
貼一張超算的實(shí)際操作界面,大家感受一下——
這種命令行界面對(duì)不少非計(jì)算機(jī)專業(yè)的用戶可以起到良好的勸退效果。
另一方面,雖然目前的超算中心大多使用Linux系統(tǒng),但幾乎每個(gè)超算都會(huì)使用不同的系統(tǒng)版本,這就導(dǎo)致其命令行下的命令也會(huì)存在一定的區(qū)別,比如有些命令是各個(gè)發(fā)行版本定制的(如Red Hat的rhn_register命令是其獨(dú)有的,其他版本不存在),一旦用戶需要更換超算中心使用,就需要額外的學(xué)習(xí)成本。
相比之下,云計(jì)算中心就友好一些,以圖形化界面為主。
而且,他們把選擇權(quán)交給用戶,提供豐富的產(chǎn)品和服務(wù)。
但是,問題來了。
云和本地資源的管理方式、部署模式和收費(fèi)模式有很大區(qū)別,不同云廠商之間也有不少區(qū)別。
目前主流云廠商所提供的產(chǎn)品線已經(jīng)相當(dāng)完善,有不少面向行業(yè)的解決方案。但產(chǎn)品和服務(wù)數(shù)量實(shí)在是過于龐大,入口也很多,最終導(dǎo)致操作層面的復(fù)雜性。
而因?yàn)樵粕辖鯚o限的資源池總量帶來的超大規(guī)模集群的調(diào)度和管理,是傳統(tǒng)手動(dòng)模式無法跟上的。
更不用說涉及到本地和云同時(shí)使用的混合云場(chǎng)景IT自動(dòng)化管理,或者多本地+多云場(chǎng)景IT自動(dòng)化管理,這些都對(duì)IT技術(shù)能力有很多新的要求。
因此,從基礎(chǔ)資源,附加服務(wù),使用難度而言,超算中心與云計(jì)算中心的使用體驗(yàn)也有很大差距。
超算中心的計(jì)費(fèi)方式主要有排隊(duì)作業(yè)和獨(dú)占節(jié)點(diǎn)兩種。
排隊(duì)作業(yè)的意思是,付費(fèi)用戶的作業(yè)與其他用戶的作業(yè)一起參與排隊(duì),用戶作業(yè)所需資源具備時(shí)開始運(yùn)行,用戶需要按照實(shí)際使用的機(jī)時(shí)支付相關(guān)費(fèi)用。
這意味著太緊急的任務(wù)接不了,因?yàn)槟悴恢篮螘r(shí)能排到;太大的任務(wù)也接不了,因?yàn)榈却线m資源的時(shí)間可能會(huì)非常久。
我們來看第二種計(jì)費(fèi)方式——獨(dú)占節(jié)點(diǎn),這與云計(jì)算中心的預(yù)留實(shí)例類似,可按月/半年/年使用付費(fèi)。以下是國(guó)家超級(jí)計(jì)算長(zhǎng)沙中心通用CPU服務(wù)器的配置及收費(fèi)標(biāo)準(zhǔn)(單位:萬元/年),可以看到根據(jù)合約的長(zhǎng)短,超算中心會(huì)給予一定的折扣:
至于云計(jì)算中心,之前我們對(duì)包括AWS、阿里云、Azure、Google Cloud、華為云、騰訊云在內(nèi)的六家主流云廠商的計(jì)費(fèi)模式有過非常詳細(xì)的分析:
預(yù)留實(shí)例:相當(dāng)于批發(fā),買定離手。
主要針對(duì)中長(zhǎng)期穩(wěn)定需求,優(yōu)點(diǎn)是價(jià)格整體比較低,缺點(diǎn)是資源必須長(zhǎng)期持有,靈活性差。
按需實(shí)例:相當(dāng)于零售,即買即用。
針對(duì)短期彈性需求,按小時(shí)計(jì)費(fèi),靈活精準(zhǔn),避免浪費(fèi),但價(jià)格比較高。
可被搶占實(shí)例:相當(dāng)于秒殺,手快有手慢無。
價(jià)格可高可低波動(dòng)大,隨時(shí)可能被搶占,需要有一定的技術(shù)實(shí)力才能使用。
詳細(xì)說明推薦看這兩篇:
《【2020新版】六家云廠商價(jià)格比較:AWS/阿里云/Azure/Google Cloud/華為云/騰訊云》
《云資源中的低成本戰(zhàn)斗機(jī)——競(jìng)價(jià)實(shí)例,AWS、阿里云等六家云廠商完全用戶使用指南》
總結(jié)一下兩者的計(jì)費(fèi)方式,超算由于資源有限,只有排隊(duì)作業(yè)和獨(dú)占節(jié)點(diǎn)兩種方式,且存在限制;云計(jì)算中心的計(jì)費(fèi)方式則包括預(yù)留實(shí)例、按需實(shí)例、可被搶占實(shí)例,相比超算更為靈活。
首先是流程,幾乎每家超算中心都有一套申請(qǐng)、審核、使用流程,平均需要5.8個(gè)步驟。以國(guó)家超級(jí)計(jì)算天津中心為例,其步驟如下:
其次是審核,并非用戶遞交了申請(qǐng),就一定能夠獲得通過,由于超算中心的資源會(huì)優(yōu)先供給科研項(xiàng)目,因此對(duì)高校用戶較為友好,商業(yè)用戶的優(yōu)先級(jí)則相對(duì)較低。
最后是收費(fèi)。高校超算中心通常會(huì)對(duì)本院校內(nèi)的用戶實(shí)施優(yōu)惠政策,有時(shí)優(yōu)惠價(jià)格甚至只有商業(yè)用戶的四分之一。
而與云計(jì)算中心類似的是,超算中心也制定了“量大從優(yōu)”的優(yōu)惠政策,但是這個(gè)量的上限可能很快到達(dá)。
步驟繁瑣、審核不易、商用昂貴,這些使用門檻會(huì)進(jìn)一步阻礙商業(yè)用戶使用超算的熱情。
至于云計(jì)算中心,其為商用而生的本質(zhì)注定了云幾乎不存在門檻:
1、申請(qǐng)?jiān)瀑Y源流程簡(jiǎn)便,可以說是即開即用;
2、收費(fèi)上,每家公有云廠商都有多種資源模式,用戶可以根據(jù)自己的實(shí)際需求選擇合適的模式,以最大程度節(jié)省成本;
3、云廠商的各類打折促銷活動(dòng)和新用戶優(yōu)惠層出不窮;
4、對(duì)于商業(yè)用戶,云廠商往往會(huì)推出企業(yè)折扣。
硬件的更新周期也是一個(gè)隱形的性能衡量指標(biāo),畢竟在相近的單價(jià)下,你拿著兩塊相差三年上市的CPU非要拼性能,就有點(diǎn)太欺負(fù)人了。
在硬件更新周期的比拼上,我們主要關(guān)注兩個(gè)維度:
總體更新周期和最新硬件更新周期。
總體更新周期指機(jī)房建設(shè)完成后,大規(guī)模更新硬件的周期。
由于建設(shè)超算中心所受到的各種影響因素較多,不同超算中心對(duì)硬件的更新周期差距很大。
通過對(duì)國(guó)內(nèi)已知超算中心的盤點(diǎn),我們發(fā)現(xiàn)總體更新周期最快的是上海交通大學(xué)高性能計(jì)算中心:
2013年6月,其研發(fā)的π1.0超算系統(tǒng)于進(jìn)入全球超算TOP500;
2016年初,π1.2升級(jí)完成;
2019年4月,π2.0正式上線。
基本按照3年一次的更新速度穩(wěn)步推進(jìn)。
其他超算中心就慢得多了,比如中國(guó)科學(xué)院超級(jí)計(jì)算中心懷柔分中心的“元”超級(jí)計(jì)算系統(tǒng)一期于2014年建設(shè)完成并投入使用,用于替換已運(yùn)行近6年的深騰7000超級(jí)計(jì)算系統(tǒng)。而“元”運(yùn)行至今也已有6年,尚未進(jìn)行下一代更新。
圖片來源:中國(guó)科學(xué)院超級(jí)計(jì)算中心
云計(jì)算中心的建設(shè)通常更為成熟和商業(yè)化,其總體更新周期較為固定。通常而言,云廠商會(huì)依據(jù)具體的更新策略有序推進(jìn)硬件更新工作,這些指導(dǎo)方針往往會(huì)精確規(guī)定硬件更換的頻率,如服務(wù)器每五年更換一次,硬盤每三到五年更換一次,或者不間斷電源電池每?jī)赡旮鼡Q一次。
總體而言,云計(jì)算中心的平均總體更新周期與更新最快的超算中心大致相仿。
最新硬件更新周期是指硬件廠商推出最新規(guī)格或型號(hào)的產(chǎn)品之后,用戶需要多久能夠在超算中心或云計(jì)算中心使用該產(chǎn)品。
超算中心從規(guī)劃設(shè)計(jì)到正式上線需要經(jīng)歷若干年的時(shí)間,能夠在上線時(shí)配置當(dāng)年上市的硬件已經(jīng)是其規(guī)劃能力的最佳體現(xiàn),其最新硬件更新周期以年為單位。
而云計(jì)算廠商可以將最新硬件更新周期縮短到以小時(shí)計(jì)。
2019年4月3日上午,Intel在太平洋兩岸近乎同步發(fā)布了代號(hào)Cascade Lake的第二代至強(qiáng)可擴(kuò)展處理器。
當(dāng)天中午12點(diǎn),國(guó)內(nèi)某云廠商便宣布其基于Cascade Lake的全新一代通用計(jì)算增強(qiáng)型云服務(wù)器C6正式轉(zhuǎn)為商用。
此時(shí),Intel在北京的發(fā)布會(huì)尚未結(jié)束,距舊金山的發(fā)布會(huì)開始也還不到12小時(shí)。
各大云廠商均打造了完整的合作伙伴體系和計(jì)劃,包括一系列的培訓(xùn)與認(rèn)證,為廣大第三方提供包括產(chǎn)品課程、解決方案課程、認(rèn)證培訓(xùn)課程在內(nèi)的多項(xiàng)課程。
云廠商還會(huì)對(duì)合作伙伴的種類進(jìn)行明確的劃分,比如某公有云廠商便將合作伙伴分為系統(tǒng)集成商、戰(zhàn)略咨詢公司、代理機(jī)構(gòu)、托管服務(wù)提供商、原始設(shè)備制造商、半導(dǎo)體制造商、網(wǎng)絡(luò)運(yùn)營(yíng)商,不同類型的合作伙伴各司其職,技術(shù)互補(bǔ),形成一條完整的生態(tài)鏈,為其客戶多角度、全方位、常態(tài)化地提供形形色色的服務(wù)。
這些恰恰都是傳統(tǒng)超算中心所欠缺的,究其原因,在于其底層差異——超算是一套封閉的系統(tǒng),而云是一個(gè)開放的平臺(tái)。
不管是超算云還是云超算,我們看到的概念基本是將超算的既有資源以云的形式賣出去,包括計(jì)費(fèi)和服務(wù)都在向云靠攏。
目前幾大國(guó)家超算中心均有超算向云靠攏的動(dòng)靜,以廣州中心為例。
根據(jù)官網(wǎng)介紹,該中心提供云超算服務(wù)和天河星光云超算平臺(tái)兩類云服務(wù)。
圖片來源:國(guó)家超級(jí)計(jì)算廣州中心
前者采用麒麟安全云系統(tǒng)實(shí)現(xiàn)虛擬化技術(shù),將虛擬機(jī)資源遠(yuǎn)程推送給用戶使用。用戶可按照所需的虛機(jī)配置與數(shù)量進(jìn)行彈性購(gòu)買,最大限度節(jié)約成本,目前虛擬機(jī)規(guī)格共有4種,從4核8G內(nèi)存到24核64G內(nèi)存不等。
后者則在前者的基礎(chǔ)上更進(jìn)一步,嵌入應(yīng)用軟件中心、遠(yuǎn)程可視化和工作流管理三大模塊,讓用戶能夠通過圖形化界面高效使用和管理應(yīng)用。
是時(shí)候展現(xiàn)真正的技術(shù)了:
我們有個(gè)【在線體驗(yàn)版】云平臺(tái),掃碼即可注冊(cè),2分鐘自動(dòng)開通。即刻就能獲得TOP500這種超級(jí)算力,你就不想試一下?你想要的我們可能都有,還送300元體驗(yàn)金,入股不虧的~
戳這里 -> 【在線體驗(yàn)版】
- END -
2020年新版《六大云廠商資源價(jià)格對(duì)比工具包》
掃碼添加小F微信(ID: imfastone)獲取
你也許想了解具體的落地場(chǎng)景 :
EDA云實(shí)證Vol.1:從30天到17小時(shí),如何讓HSPICE仿真效率提升42倍?
15小時(shí)虛擬篩選10億分子,《Nature》+HMS驗(yàn)證云端新藥研發(fā)未來
2019-2020春江云暖你先知,CAE/EDA/高校等CloudHPC領(lǐng)域年均復(fù)合增長(zhǎng)率超21%
關(guān)于云端高性能計(jì)算平臺(tái):
The post 國(guó)內(nèi)超算發(fā)展近40年,終于遇到了一個(gè)像樣的對(duì)手 appeared first on 速石科技BLOG.]]>