—Cadence 云業(yè)務(wù)開發(fā)VP (DAC 2019)
去年9月在DAC(Design Automation Conference)大會之后,我們制作了一個全球半導(dǎo)體行業(yè)上云格局一覽圖,然后得出了兩個結(jié)論:
1. 整個半導(dǎo)體產(chǎn)業(yè)鏈核心角色:EDA廠商/ Foundry/Fabless無一缺席,都已經(jīng)開始上云的步伐;
2. 全球各大云廠商不僅積極擁抱半導(dǎo)體產(chǎn)業(yè),甚至自己主導(dǎo)設(shè)計開發(fā)芯片,在產(chǎn)業(yè)鏈中扮演雙重角色。
如果說去年我們的判斷是全球半導(dǎo)體行業(yè)對云的接受度已經(jīng)在跨越鴻溝的邊緣,那上周ICCAD中國集成電路設(shè)計業(yè)2020年會結(jié)束后,我們認(rèn)為國內(nèi)半導(dǎo)體企業(yè)也已經(jīng)跟上了節(jié)奏。
跟2019年相比:
今年有了幾家云廠商的身影出現(xiàn),關(guān)于芯片設(shè)計EDA上云趨勢和落地實(shí)踐給出了各自的答卷;
也有像恩智浦這樣的公司分享了仿真上云經(jīng)驗(yàn),并且在今年全球疫情的現(xiàn)狀下,正在考慮純云模式來滿足遠(yuǎn)程協(xié)同需求。
我們?nèi)ツ旮鶕?jù)DAC會議Design on Cloud圓桌討論整理了十個上云實(shí)踐問題的過來人解答,有興趣可以去回顧一下:
1. 上云的模式是什么?
2. 最開始,為什么選擇上云?
3. 上云的挑戰(zhàn)主要有哪些?
4. 你覺得EDA供應(yīng)商準(zhǔn)備好上云了嗎?
5. 上云的缺點(diǎn)是什么?
6. 對于芯片設(shè)計,云廠商已經(jīng)準(zhǔn)備好了嗎?
7. 在云上,一切都需要付錢。怎么控制云上的成本?
8. 你覺得在云上設(shè)計安全嗎?
9. 目前為止,上云的成果是什么?
10. 對后來的上云實(shí)踐者有什么建議?
今年我們升個級,來個——
1. EDA云平臺能夠解決什么問題?
適配EDA工具使用需求。
大規(guī)模算力自動化智能調(diào)度。
海量多云資源提供彈性算力支持。
總之,讓研發(fā)人員更專心做設(shè)計,幫助IT人員更好地管理資源滿足復(fù)雜企業(yè)場景需求,最終縮短項(xiàng)目周期,提高公司競爭力。
2. 云上虛擬機(jī)的性能可以嗎?
相當(dāng),并可以更好。
兩方面原因:
1、云上的硬件更新快;
2、云上虛擬化性能逐步接近裸機(jī)。
3. 各個云之間的虛擬機(jī)性能有差異嗎?
有。我們可以為用戶提供專業(yè)建議。
4. 支持哪些云?
國內(nèi)外主流云廠商我們都支持。
5. 多云有什么好處?
不會被某一家云廠商鎖定,資源可用性更高。
多云可以最大限度利用不同云廠商的不同優(yōu)勢,比如資源類型,比如產(chǎn)品價格,比如地域選擇。
6. GPU資源也有嗎?
云廠商上有的資源我們都可以支持。
7. 云上用的機(jī)型是超線程的?還是物理核的?
大多數(shù)云廠商支持開啟關(guān)閉超線程。
8. 你們和超算有什么區(qū)別?云和超算有什么區(qū)別?
看這篇國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手
9. 你們和云廠商有什么區(qū)別?
我們是從應(yīng)用出發(fā),為應(yīng)用定義的云平臺。
而云廠商主要在IaaS層,距離用戶的實(shí)際應(yīng)用還有非常長的距離。
在云的基礎(chǔ)架構(gòu)和應(yīng)用之間,需要借助應(yīng)用優(yōu)化、多云環(huán)境支持等方式來滿足用戶需求。
10. 我直接和云廠商合作是不是就行了?
參考答案9。
我們已經(jīng)對接了眾多主流云廠商的API,可以用統(tǒng)一的方式方法完成自動化部署,簡化用戶使用云資源的方式,降低學(xué)習(xí)成本,幫助用戶高效地用好云。
11. 你們跟云管理平臺有什么不同?
我們更貼近應(yīng)用,在云管平臺之上。
具體可查看靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥
12. 支持哪些EDA工具?
支持主流EDA廠商工具,比如Innovus、Spectre、HSPICE、OPC Proteus、Calibre、VCS、Xcelium、Redhawk、PT 、StarRC 、Tmax2 、Skipper、ALPS等等。
13. EDA應(yīng)用優(yōu)化指的是什么?
根據(jù)特定用戶需求自定義EDA Flow,規(guī)范化EDA作業(yè)流程,加速EDA多任務(wù)的調(diào)度。
用戶在云端可選擇的機(jī)型有幾百種,配置、價格差異極大,我們能根據(jù)用戶的EDA應(yīng)用需求推薦最適配的資源。
14. EDA應(yīng)用在云上能正常跑嗎?
能。
15. License在云上能正常用嗎?
能。
EDA云實(shí)證Vol.1:從30天到17小時,如何讓HSPICE仿真效率提升42倍?
EDA云實(shí)證Vol.4: 5000核大規(guī)模OPC上云,效率提升53倍
16. 云上的EDA應(yīng)用怎么部署?是不是每個軟件CAD都要去配置?
我們協(xié)助用戶完成云上EDA應(yīng)用自動化配置,一次配置,以后自動啟用。
17. 腳本每日都有變動,云上要增加工作量?工作腳本如何更新?
可以延續(xù)之前的使用方式,也可以使用我們提供的方式自動化完成腳本更新。
18. 云上EDA無縫銜接怎么做到的?
云上用戶體驗(yàn)無差異。
19. 你們的自動化部署有什么好處?
關(guān)于我們在云端部署自動化模式VS傳統(tǒng)手動模式間的巨大差異可查看:從30天到17小時,如何讓HSPICE仿真效率提升42倍?
20. 支持哪些調(diào)度器?
我們支持Slurm/LSF/SGE/PBS。
億萬打工人的夢:16萬個CPU隨你用里,我們基于這四家主流調(diào)度器:LSF/SGE/Slurm/PBS以及它們的9個演化版本進(jìn)行了梳理和盤點(diǎn)。
21. 開源的調(diào)度器你們怎么提供商業(yè)支持?
我們是開源Slurm調(diào)度器的代碼貢獻(xiàn)者,特別是跟云相關(guān)的功能點(diǎn)。
我們提供Slurm配置/優(yōu)化/調(diào)試/應(yīng)用對接的最佳實(shí)踐。
22. 你們就是個調(diào)度器嗎?
調(diào)度器是我們平臺的一個重要組件。
23. 你們說的智能調(diào)度是什么?
我們是基于用戶策略的雙層智能調(diào)度。
上層調(diào)度程序支持靈活的用戶策略:
-基于位置
-基于性能
-基于成本
-基于團(tuán)隊(duì)/組織目標(biāo)……
下層調(diào)度程序滿足應(yīng)用要求:
-基于Slurm/LSF/SGE/PBS的工作任務(wù)
-基于容器的K8S工作任務(wù)…
智能調(diào)度用戶策略詳情看這個:生信云實(shí)證Vol.3:提速2920倍!用AutoDockVina對接2800萬個分子
24. 為什么要Auto-Scale自動伸縮?
省錢,省心。
我們的Auto-Scale功能自動監(jiān)控用戶提交的任務(wù)數(shù)量和資源的需求,動態(tài)按需地開啟和關(guān)閉所需算力資源,在不夠的時候,還能根據(jù)不同的用戶策略,自動化調(diào)度本區(qū)域及其他區(qū)域的目標(biāo)類型或相似類型實(shí)例資源。
所有操作都是自動化完成,無需用戶干預(yù)。
劃個重點(diǎn),這里的關(guān)機(jī)對于成本的節(jié)約極其有幫助。
25. 數(shù)據(jù)怎么做到云上、線下同步?
我們有專門的數(shù)據(jù)傳輸工具,提高傳輸效率。支持全自動化數(shù)據(jù)上傳,可充分利用帶寬,幫助用戶快速上傳、下載海量數(shù)據(jù)。同時,利用fastone自主研發(fā)的分段上傳、高并發(fā)、斷點(diǎn)續(xù)傳等數(shù)據(jù)傳輸技術(shù),優(yōu)化海量數(shù)據(jù)的傳輸效率。
也支持VPN/專線接入。
26. 很多PDK,就有幾十T,怎么到云上,而且需要持續(xù)更新?
離線傳輸方式可以初始化傳輸大量數(shù)據(jù)。
很多PDK廠商也提供了在云上的訪問方式。
27. 改變我們現(xiàn)在研發(fā)人員的使用習(xí)慣和體驗(yàn)嗎?
基本沒有改變。
我們支持桌面接入和SSH接入。
28. 任務(wù)和集群的區(qū)別是什么?
任務(wù)更適用于流程固定并且經(jīng)常有運(yùn)行需求的任務(wù),全程圖形化界面。
集群相對于任務(wù),屬于更高級的用法,用戶可以直接SSH到云上的集群使用,可以直接進(jìn)行應(yīng)用的開發(fā)和調(diào)試。使用方式和本地?zé)o差別。
29. 我能直接創(chuàng)建云上HPC集群嗎?
可以。
我們支持普通用戶模式和高級用戶模式。
高級用戶,比如本身對應(yīng)用工作流的理解和編程能力超強(qiáng),可以不用走普通用戶通過應(yīng)用向?qū)教峤坏穆窂剑梢灾苯痈鶕?jù)自己寫的腳本,通過Web瀏覽器選擇新建集群,然后按需動態(tài)地在云端創(chuàng)建HPC集群,包括權(quán)限,計算資源,存儲資源等。
30. 怎么監(jiān)控、管理任務(wù)與集群的運(yùn)行情況?
提交任務(wù)后,可以在監(jiān)控界面中查看任務(wù)和集群運(yùn)行情況。
31. 支持混合云模式嗎?
支持。
我們支持本地資源不足的時候,自動溢出到云上。
下圖是一個混合云模式架構(gòu)圖。
32. 增加一套云環(huán)境,對于IT管理會不會帶來額外的負(fù)擔(dān)?
通過我們可以在不增加負(fù)擔(dān)的情況下對接多云,減少IT管理壓力。
我們易用的自動化管理平臺對IT人員來說很容易上手,對提升工作效率和資源利用率都有很大幫助。
33. 如何云上保護(hù)我們的IP資產(chǎn)?
可以延續(xù)公司原有的安全流程、工具,結(jié)合云上完整的審計、監(jiān)控和權(quán)限管理功能。
我們有豐富的安全實(shí)踐。
34. 云上云下的安全?
安全是一個立體的概念,包括系統(tǒng)安全、應(yīng)用安全、流程安全、數(shù)據(jù)安全等很多方面。
云的基礎(chǔ)架構(gòu)和傳統(tǒng)IT架構(gòu)在安全方面并沒有本質(zhì)上的區(qū)別,依然是利用計算節(jié)點(diǎn)和存儲資源。很多人覺得這兩者之間存在差異,我們認(rèn)為這取決于個人的認(rèn)知。
35. 支持純云模式嗎?
支持,文末可以直接注冊免費(fèi)試用。
36. 關(guān)于選擇哪種上云模式你們有什么建議?
從我們接觸的企業(yè)看來,既有老牌企業(yè)從純本地逐漸過渡到本地+云的混合云模式的,也有初創(chuàng)公司直接從云端起步,逐漸添加本地機(jī)器,最后形成混合云模式的。
對于國內(nèi)企業(yè)來說,混合云應(yīng)該是各種企業(yè)類型最終能接受的完成形態(tài),既保留有本地的私密性,也時刻享有云端的靈活性。
37. 用云是不是很貴/便宜?
企業(yè)上云是否便宜取決于具體應(yīng)用場景,云的成本結(jié)構(gòu)高度依賴于自動化和智能化的運(yùn)營能力,效率的提升帶來TCO的降低才是計算云成本的正確思路。
幫助CXO解惑上云成本的迷思,看這篇就夠了
38. 你們有優(yōu)化成本的方案嗎?
三個層面:
從應(yīng)用適配層面,我們會在多云里選擇最適合用戶應(yīng)用場景的最具性價比資源;
從IT部署方面,通過自動化按需部署和資源實(shí)時監(jiān)控管理進(jìn)行成本優(yōu)化;
從任務(wù)運(yùn)行層面,我們根據(jù)用戶不同策略進(jìn)行智能調(diào)度。當(dāng)以成本優(yōu)先策略為第一優(yōu)先策略時,資源選擇以SPOT實(shí)例為主,并在滿足用戶成本要求的前提下使用OD按需實(shí)例來優(yōu)化時間效率,相比時間優(yōu)先策略,成本降幅最多可達(dá)67%-90%。
39. 跨國團(tuán)隊(duì)研發(fā)協(xié)同你們有解決方案嗎?
跨國協(xié)同面臨的IT挑戰(zhàn),一個是數(shù)據(jù)傳輸,一個是網(wǎng)絡(luò)質(zhì)量。
我們有支持多本地的IT一體化落地案例。
再來幾個具體點(diǎn)兒的:
40. HSPICE任務(wù)能否在云端運(yùn)行?
41. 云端資源是否能適配HSPICE任務(wù)需求?
42. fastone平臺能否有效解決目前業(yè)務(wù)問題?
43. 相比傳統(tǒng)手動模式,云端計算集群的自動化部署,有哪些好處?
44. OPC任務(wù)能否在云端有效運(yùn)行?
45. fastone平臺能否滿足業(yè)務(wù)彈性資源需求,有效減少OPC運(yùn)行時間?
46. License Server配置在本地和云端對計算性能/一致性/穩(wěn)定性是否有影響?
47. fastone能否支持不同調(diào)度器SGE/Slurm?
48. 使用不同調(diào)度器對計算性能/一致性/穩(wěn)定性是否有影響?
49. fastone平臺的云端輸出計算結(jié)果是否與本地完全一致?
- END -
我們有個【在線體驗(yàn)版】
平臺集成多種應(yīng)用,大量任務(wù)多節(jié)點(diǎn)并行
應(yīng)對短時間爆發(fā)性需求,連網(wǎng)即用
跑任務(wù)快,原來幾個月甚至幾年,現(xiàn)在只需幾小時
5分鐘快速上手,拖拉點(diǎn)選可視化界面,無需代碼
支持高級用戶直接在云端創(chuàng)建集群
點(diǎn)擊下圖免費(fèi)試用,送200元體驗(yàn)金,入股不虧~
你也許想了解具體的落地場景:
怎么把需要45天的突發(fā)性Fluent仿真計算縮短到4天之內(nèi)?
5000核大規(guī)模OPC上云,效率提升53倍
提速2920倍!用AutoDock Vina對接2800萬個分子
從4天到1.75小時,如何讓Bladed仿真效率提升55倍?
從30天到17小時,如何讓HSPICE仿真效率提升42倍?
關(guān)于云端高性能計算平臺:
國內(nèi)超算發(fā)展近40年,終于遇到了一個像樣的對手
幫助CXO解惑上云成本的迷思,看這篇就夠了
靈魂畫師,在線科普多云平臺/CMP云管平臺/中間件/虛擬化/容器是個啥
花費(fèi)4小時5500美元,速石科技躋身全球超算TOP500
IT資源~~得不到的永遠(yuǎn)在騷動~~要么花更長時間,要么降低對質(zhì)量的追求,這種無奈的取舍是半導(dǎo)體行業(yè)一直以來的痛。
如果說EDA工具的出現(xiàn)是半導(dǎo)體行業(yè)的第一次革命,幫助芯片設(shè)計人員用更簡單的方法從事設(shè)計工作,以縮短研發(fā)周期,降低設(shè)計成本。
那么,云計算可能是第二次產(chǎn)業(yè)革命的開端。雖然云計算本身已經(jīng)出現(xiàn)十年之久,但直到現(xiàn)在,也許才能看出一些端倪。 我們看一下現(xiàn)在的全球半導(dǎo)體行業(yè)上云格局一覽圖(基于最新公開資料整理):
1、 整個半導(dǎo)體產(chǎn)業(yè)鏈核心角色:EDA供應(yīng)商/ Foundry/Fabless無一缺席,都已經(jīng)開始上云的步伐。
2、 全球各大云廠商不僅積極擁抱半導(dǎo)體產(chǎn)業(yè),甚至自己主導(dǎo)設(shè)計開發(fā)云端AI芯片,在產(chǎn)業(yè)鏈中扮演雙重角色。
3、 圖上只是根據(jù)公開資料整理出來的半導(dǎo)體云玩家,更多公司還在冰山之下。這意味著,不光是上云企業(yè)與本地企業(yè)之間,云上企業(yè)之間的競爭也已經(jīng)暗流涌動。
如果下面這張圖代表整個半導(dǎo)體行業(yè)對云的接受度,也許我們已經(jīng)站在跨越鴻溝的邊緣:
云有一個奇妙的特性:花同樣的錢,你可以讓100臺機(jī)器跑1個小時,也可以讓1臺機(jī)器跑100個小時,但是不同時間消耗帶來的結(jié)果完全不一樣,可能事關(guān)生死。
半導(dǎo)體企業(yè)上云并不是直接把本地數(shù)據(jù)中心生態(tài)系統(tǒng)搬到另一個地方,是一個涉及資產(chǎn)與成本,當(dāng)下與未來的綜合決策。
而在這場生死之戰(zhàn)中,在半導(dǎo)體企業(yè)到一朵云或者多云服務(wù)之間,速石的角色是什么?
我們辛總給我打了個樸實(shí)的比方:假如你要打掃家里,以前你買的是N把掃把,現(xiàn)在你買的是一個智能掃地機(jī)器人。地是云服務(wù)商掃的,我們主要是智能機(jī)器那部分。嗯,話說得有點(diǎn)糙,而且簡化得有點(diǎn)過分,大家意會~~
拒絕意會的,歡迎文末掃碼聯(lián)系小F,我們用五個詳細(xì)案例告訴你我們是怎么解決半導(dǎo)體行業(yè)三種模式(純云SaaS/混合云+多區(qū)域/EDA云平臺)下不同企業(yè)用云需求的。
DAC是集成電路設(shè)計界的大聚會,是全球EDA、Foundry、IP提供商的盛會,今年是第35屆了。從去年開始,DAC有了專門的“design on cloud” 部分。
如果說去年是云廠商(AWS/Azure/Googlecloud,包括阿里云)和眾多IT服務(wù)商張開懷抱對芯片公司說:我可以。
過去一年,有了明顯變化。
今年6月,我們看到了不少芯片設(shè)計公司的身影,他們作為過來人出來現(xiàn)身說法,講自己上云的那點(diǎn)事兒。
1家Foundry,1家EDA,4家Fabless。
上云的模式是什么?
最開始,為什么選擇上云?
上云的挑戰(zhàn)主要有哪些?
你覺得EDA供應(yīng)商準(zhǔn)備好上云了嗎?
上云的缺點(diǎn)是什么?
對于芯片設(shè)計,云廠商已經(jīng)準(zhǔn)備好了嗎?
在云上,一切都需要付錢。怎么控制云上的成本?
你覺得在云上設(shè)計安全嗎?
目前為止,上云的成果是什么?
對后來的上云實(shí)踐者有什么建議?
上云的模式是什么?
QST:純公有云模式+AWS為主
AFRL:純公有云模式+AWS為主
TSMC:OIP VDE虛擬設(shè)計環(huán)境+ AWS+ Google Cloud+Azure
Cadence:Cadence Cloud Portfolio+AWS+ Google Cloud+Azure
eSilicon:混合云模式逐漸過渡到純公有云模式+Google Cloud
Astera Labs:純公有云模式+AWS
最開始,為什么選擇上云?
QST:
我們公司是2018年8月成立的,主要做基于MEMS傳感器的解決方案。剛成立的時候接到一個客戶需求,只有6個月的時間就要Tapeout,根本沒有給我們時間搭本地基礎(chǔ)架構(gòu),所以直接選擇了上云。當(dāng)然,結(jié)果非常好,我們成功在規(guī)定期限前完成了任務(wù)。
AFRL:
不要覺得AFRL是一個大公司,其實(shí)我們就是一個獨(dú)立的小組,更像一個小公司。我在做的這個項(xiàng)目其實(shí)是個DOD(國防部)的項(xiàng)目,我們空軍這塊只是整個芯片項(xiàng)目的PoC。
我們選擇云的原因主要原因是完全搭一套本地設(shè)計環(huán)境周期太長,流程又長又復(fù)雜;另一個原因是我們的人員包括了海軍、軍隊(duì)、空軍研究員和小組,分散各地,搭建一套本地的IT合作環(huán)境讓所有外部人員遠(yuǎn)程登錄非常麻煩,最好可以有一套無視大家地理位置的解決方案,讓所有人盡管分散在各地也能在一起順利完成任務(wù)。
TSMC:
我們2018年宣布OIP云端聯(lián)盟成立。一方面是受AI/5G等大環(huán)境驅(qū)動,另一方面,我們不可能永遠(yuǎn)有足夠的本地計算資源,內(nèi)部我們開始用云端方案來協(xié)助芯片設(shè)計,既然我們用了,我們就覺得也應(yīng)該開放給我們的用戶用,讓他們能受益,不用受資源所限,能更快完成他們的設(shè)計。
聯(lián)系小F(ID:imfastone),獲取某Foundry EDA設(shè)計云平臺模式解決方案
Cadence:
2018年發(fā)布Cadence Cloud Portfolio,臺積電、亞馬遜、微軟和谷歌都是合作伙伴。2019年4月,我們發(fā)布了CloudBurst平臺,6月又發(fā)布了Cloud Passport合作伙伴項(xiàng)目。
以前跟我的用戶們聊云,基本上一聊到安全就聊不下去了。但現(xiàn)在這個行業(yè)的新公司大量涌現(xiàn),都在認(rèn)真考慮云這件事,因?yàn)榈拇_幫他們省了一大堆麻煩和注意力,不用考慮搭建一套工作流,也不用考慮搭建設(shè)計環(huán)境等等。
所以現(xiàn)在我感覺趨勢是:小公司正在考慮把整個基本架構(gòu)都換成云,而大一些的公司,正在評估接下來到底怎么走。是做一個單獨(dú)項(xiàng)目,還是把某項(xiàng)功能放在云上運(yùn)行,平衡本地和云的資源,這是一個謹(jǐn)慎的決策。
我聊的每一個人都表示對云感興趣,所以我覺得現(xiàn)在的問題在于什么時候上云,而不在于上不上云這件事。
eSilicon:
2000年成立,在用傳統(tǒng)方法做了20年ASIC芯片后,eSilicon決定放棄本地,把整個芯片設(shè)計都搬到云上。
我們的轉(zhuǎn)變開始于2014年,當(dāng)CEO Jack Harding問了一個問題:計算硬件設(shè)施到底給我們帶來了什么?那時候我們是租的數(shù)據(jù)中心的機(jī)器,設(shè)計一枚芯片的過程中,我們至少需要把租用的機(jī)器數(shù)量翻一倍,這我們實(shí)在有點(diǎn)沒法接受。那時候,我們的團(tuán)隊(duì)才真正開始研究到底要怎樣才可以有效使用云資源。
我們現(xiàn)在的目標(biāo)是:到2020年前,全面上云,我們將成為一個Serverless的公司,不擁有任何硬件。
Astera Labs:
我們公司2017年成立的。關(guān)于上不上云,做決定前,我們有三個決策原則:
1、我們想把所有的資源放在創(chuàng)造價值上;
2、本地沒有專門的IT團(tuán)隊(duì),這也不是我們的強(qiáng)項(xiàng);
3、隨著公司的成長,我們需要快速迭代。
所以對我們來說,其實(shí)選擇很簡單:
本地+云混合模式:第一時間否決,既要管本地,還要管云,雙重頭疼
完全本地模式:專業(yè)的IT團(tuán)隊(duì),大量的前期投入,只能不斷擴(kuò)張(不能減少),同樣否決
Synopsys/Cadence平臺:EDA供應(yīng)商限制了我的工具使用范圍,有限的計算架構(gòu)
純公有云模式:同時具備規(guī)模擴(kuò)張性和彈性,外包支持服務(wù)最后,我們選了AWS,外包IT團(tuán)隊(duì),免去所有頭疼的事情。
聯(lián)系小F(ID:imfastone),獲取芯片設(shè)計公司混合云+SaaS模式上云解決方案
上云的挑戰(zhàn)主要有哪些?
QST:
6個月的時間就要Tapeout,時間非常緊。
AFRL:
希望可以有一套不用考慮大家地理位置的解決方案,讓分散在各地的小組成員能在一個環(huán)境下共同順利完成工作。
TSMC:
安全是一切的基礎(chǔ)。我們花了兩年多時間專心于安全問題,和我們公司的IT部門一起研究怎么和云廠商合作,檢測所有細(xì)節(jié)。現(xiàn)在我們有了云安全資質(zhì)計劃,還有一些安全方面的合作伙伴在我們的云聯(lián)盟里。
Cadence:
云一種全新的架構(gòu)。我們在努力朝這個方向前進(jìn)。
eSilicon:
1、對本地芯片設(shè)計工作流最小影響,最好不影響
2、降低IP開發(fā)工作負(fù)載的成本
3、運(yùn)行更多的IP仿真
4、云上的集成和運(yùn)維問題
5、IP安全:公有云上的IP存儲
Astera Labs:
1、本地沒有IT團(tuán)隊(duì),不想把重心放在核心業(yè)務(wù)之外的工作任務(wù)上
2、最頭疼的是在云上管理排隊(duì)任務(wù)。
3、大量并行工作任務(wù)意味著大量數(shù)據(jù)管理,技術(shù)資源成為最大的瓶頸
聯(lián)系小F(ID:imfastone),了解我們怎么幫你智能調(diào)度本地及云上資源
你覺得EDA供應(yīng)商準(zhǔn)備好上云了嗎?
TSMC:
我們既和各大云廠商合作,也跟EDA供應(yīng)商合作.當(dāng)我們嘗試在云上做一些互動式的任務(wù),因?yàn)槲覀冊谂_灣,最近的數(shù)據(jù)中心可能在新加坡,距離有3000公里,不管你怎么優(yōu)化路由,都會有50-60分鐘延遲,這會給EDA工具帶來一些壓力。但積極的一面在于在過去的9個月時間,EDA合作伙伴都非常配合,找出問題在哪,怎么優(yōu)化。
我覺得,以前并沒有所謂的云使用范式或者標(biāo)準(zhǔn),所以EDA廠商現(xiàn)在沒必要針對云端使用做全面優(yōu)化。直到有一天大家都在用了,自然就會做了。整體來說,現(xiàn)在使用上沒什么問題。這將是我們接下來幾年的共同未來目標(biāo)。
Astera Labs:
EDA工具在云上使用很順利,當(dāng)然,也有一些改進(jìn)的空間。比如,基于云上架構(gòu)做優(yōu)化,能夠更好地利用云上的各種計算資源,存儲服務(wù)等。重點(diǎn)提醒:出錯容忍度低的應(yīng)用可以使用云端可被搶占實(shí)例。
上云的缺點(diǎn)是什么?
QST:
因?yàn)榘踩脑颍械臇|西必須經(jīng)過cadence,一切問題都必須提交一個工單,不能直接打個電話或者走到辦公室的另一頭找IT部門,這會增加一些時間成本。但另一方面這又非常有用,因?yàn)橐磺惺虑槎伎梢粤炕m然花了一點(diǎn)時間,但問題總是會及時得到解決。這花了我們團(tuán)隊(duì)幾個月時間來適應(yīng),但現(xiàn)在一切都很好。
第二個問題在于,如果你試圖評估到底在云上需要多少資源,多少用戶,怎么彈性擴(kuò)張的,這是一個嘗試和學(xué)習(xí)的過程。
你需要增加你的運(yùn)維團(tuán)隊(duì),你需要在不同的國家做擴(kuò)張。我們有團(tuán)隊(duì)在臺灣,有團(tuán)隊(duì)在上海,還有外包團(tuán)隊(duì)在印度,硅谷也有員工,一直在加人。怎么讓這些人在線,你有多少個接口登陸,開了多少個服務(wù)器,這中間有很多要權(quán)衡的東西。
當(dāng)你有一大堆驗(yàn)證要做,你能用多少個license,你能有多少計算資源,你是全部都本地?fù)碛校€是考慮成本的原因,減少本地資源,在云上做彈性擴(kuò)張。這些都需要花時間。
哪怕你有一個好的IT部門和通過VPN連接的彈性計算資源,也會遇到同樣的問題。
AFRL:
整體來說,上云是一個積極的體驗(yàn)。如果你的IT部門不熟悉云架構(gòu),不了解云的運(yùn)行方式,這個跨越可能會有點(diǎn)痛苦。它跟在本地完全不一樣。云的運(yùn)行方式不一樣,計費(fèi)模式不一樣,存儲模式不一樣。所以你可能可以在云上運(yùn)行起來,但如果你只是在云上復(fù)制在本地的一切,你可能沒辦法最大化利用云的價值。
我建議你最好確保有一個不錯的懂云的團(tuán)隊(duì)。
聯(lián)系小F(ID:imfastone),了解為什么我們能幫你最大化利用云的價值
對于芯片設(shè)計,云廠商已經(jīng)準(zhǔn)備好了嗎?
TSMC:
所有的云廠商都針對EDA工作任務(wù)推出了新的VM類型,我們不說CPU有多快,我們還要考慮內(nèi)存有多大,存儲IO有多快多有效,我們看的是整個服務(wù)包。我們已經(jīng)對外公布了要在云上做5nm芯片,這給我們云合作伙伴帶來了很大的壓力,包括EDA合作伙伴。我們和產(chǎn)業(yè)內(nèi)其他伙伴都在一個生態(tài)系統(tǒng)里,大家明白我們都需要對方,所以我們的合作從理解各自的需求,在哪里可以增加價值開始。現(xiàn)在我們半導(dǎo)體行業(yè)已經(jīng)吸引了云廠商的關(guān)注,我們開始試圖與對方合作,提供一些解決方案讓芯片設(shè)計從業(yè)者能夠從中受益。
在云上,一切都需要付錢。怎么控制成本?
Cadence:
我們內(nèi)部也有這樣的經(jīng)歷,因?yàn)槲覀円苍谠粕献鲆恍╅_發(fā)工作。我曾經(jīng)和IT部門的同事討論過,他們通常低估了跟蹤誰在什么時候用了什么服務(wù)這件事,而當(dāng)賬單來臨的時候,一個工程師可能跑了上千個任務(wù),他們可能也記不清自己用了些什么。這是個值得注意的問題。
關(guān)于這個問題,如果只從成本支出的角度來考慮這個問題,很可能會得出這個結(jié)論,最具性價比的方式是在本地?fù)碛心愕姆?wù)器并且100%地使用他們。而我們應(yīng)該要考慮的是成本和收益的平衡問題。通常,我們都從云上獲得了一些商業(yè)好處,更快占領(lǐng)市場,獲取更多客戶等等。這不是一個完全的替換關(guān)系,你看看靜態(tài)的歷史數(shù)據(jù),就能比較出結(jié)果。
eSilicon:
在ASIC芯片的商業(yè)世界里,成本就是一切。過去,當(dāng)你的工程師要用大量的資源,都是按照過去預(yù)計未來用量。現(xiàn)在用了云,很簡單,我們就直接規(guī)定某個人這次只能用一定量的資源。
聯(lián)系小F(ID:imfastone),了解我們怎么幫你優(yōu)化及控制云上成本
你覺得在云上設(shè)計安全嗎?
QST:
作為一家創(chuàng)業(yè)公司,我對安全的定義有些不一樣。我們大部分時間是和AWS合作。作為一家做創(chuàng)意設(shè)計和IP的公司,你希望保障自己的全部。但現(xiàn)實(shí)情況是,你不可能確保擁有最優(yōu)秀的IT和最好的安全人員。
如果你在本地搭建你的整個設(shè)計系統(tǒng)和環(huán)境,服務(wù)器都在本地,我可以跟你保證你的安全措施肯定是很差的,很容易被外部破解。如果你的IP在云上開發(fā)和存儲,比如AWS,比如cadence,你知道AWS在云上遵循的安全準(zhǔn)則,肯定比在本地要安全多了。
目前階段,我們完全不擔(dān)心安全這個問題,但這不意味著如果有一天我們成長壯大之后我們不會改變。
AFRL:
盡管我們是云懷疑論者。但大的云廠商在云安全上的控制是對外公開的,每個人都知道你能得到什么,你能夠?qū)徲嬕磺邪踩募?/strong>
像我們這個項(xiàng)目,不同的研究人員分散在不同的地方,還有外包商等等,鬼知道他們的IT情況怎么樣,我們把大家拉到一起,能確保大家在同一個系統(tǒng)里,遵守了同一套準(zhǔn)則。而不是制定一套準(zhǔn)則,寄希望于他們能按這個標(biāo)準(zhǔn)實(shí)施。誰知道結(jié)果會怎么樣?
目前為止,上云的成果是什么?
TSMC:
臺積電的OIP 云端聯(lián)盟現(xiàn)在已經(jīng)跟三大EDA供應(yīng)商:Synopsys/Cadence/Mentor,以及云廠商AWS/Azure/GoogleCloud正式合作,運(yùn)用云端技術(shù)輔助芯片開發(fā)。
已經(jīng)擁有臺積電云端平臺使用經(jīng)驗(yàn)的SiFive位于美國硅谷與印度Bangalore的團(tuán)隊(duì),通過云端進(jìn)行設(shè)計,在不到三個月時間就完成了整套前后端設(shè)計,創(chuàng)下速度上的新高記錄。
eSilicon:
1、經(jīng)過測試,云上的資源比原來本地硬件設(shè)備表現(xiàn)提升了15%,同時能跑的任務(wù)比原來多了一倍。
2、云運(yùn)維成本跟原來相比大大降低,我們估計了一下如果有一個類似的本地解決方案達(dá)到現(xiàn)在的效果,大概要花公司幾百萬美元。
3、沒有閑置資源,可以使用更多彈性資源,無限檔案存儲
4、加速芯片設(shè)計完成周期,能完成更多客戶需求
5、不受本地資源限制,避免硬件投資
6、縮短推出市場的時間,提升設(shè)計結(jié)果質(zhì)量
7、云上有天然自帶監(jiān)控系統(tǒng)的架構(gòu),更容易追蹤記錄,進(jìn)行用戶管理和監(jiān)控
8、未來發(fā)展機(jī)器學(xué)習(xí)的可能性
Astera Labs:
1、過去存儲怎么使用都不夠,現(xiàn)在可以無限擴(kuò)展
2、工作安排可以排得比以前更多
3、我們充分利用了云資源的可擴(kuò)展性和最新型的實(shí)例類型
4、可以根據(jù)不同任務(wù)使用獨(dú)立的云資源
5、我們可以做出更高質(zhì)量的芯片
聯(lián)系小F(ID:imfastone),了解我們用戶案例的上云表現(xiàn)
對后來的上云實(shí)踐者有什么建議?
eSilicon:
1、把PDK、EDA工具和管理服務(wù)在云端做備份,減少本地和云端數(shù)據(jù)傳輸
2、只選取數(shù)據(jù)結(jié)果的一小部分在云端和本地同步
3、為了安全,云上的數(shù)據(jù)暫存區(qū)需要更高頻的清理
4、多云/多區(qū)域的資源整合和調(diào)度,對使用云上的可被搶占實(shí)例很重要,能降低成本
5、在云上必須使用SSD和高速存儲,提供足夠的擴(kuò)展性和性能
6、不同的任務(wù)有獨(dú)占的分布式文件系統(tǒng),提供必要的性能和服務(wù)質(zhì)量
7、擁抱云上的彈性資源,不要用原來使用本地數(shù)據(jù)中心的方式來用云
8、根據(jù)不同的任務(wù)類型選擇更優(yōu)化的云上資源
9、如果本地就有l(wèi)icense不夠,任務(wù)排隊(duì)的問題,這會在云上花更多的錢(排隊(duì)也花錢)
10、善于使用可被搶占實(shí)例等折扣
11、對數(shù)據(jù)分層,選擇不同存儲方式:SSD、HD和云上存儲
12、注意:不同賬戶在云上使用資源是有限額的
Astera Labs:
1、一定要用可被搶占實(shí)例
2、使用成本是一定會被低估的,所以在快/好/便宜三個標(biāo)準(zhǔn)之間,按自己的情況,選擇兩個就夠了
《六家云廠商價格比較:AWS、阿里云、Azure、Google Cloud、華為云、騰訊云》的下篇就講六大云廠商的可被搶占實(shí)例,建議關(guān)注一下我們,大約下期發(fā)~~
Cadence:
1、花足夠的時間理清楚,公司用云的優(yōu)先級是什么,這些討論/分析/研究接下來會節(jié)約你很多時間。因?yàn)椴煌藢υ频钠诖赡懿灰粯樱绻麤]有達(dá)成一致,會浪費(fèi)很多時間。
2、確定你的使用模式是什么,是一個完整的項(xiàng)目,還是一個功能,還是為了合作。明確這一點(diǎn),你能用正確的架構(gòu)來解決你的問題。
3、不只是在你的公司內(nèi)部,包括Foundry,包括工具提供商,第三方IP供應(yīng)商,會涉及到大量協(xié)作。
作為半導(dǎo)體行業(yè)從業(yè)者你對云的接受度在哪個區(qū)域呢?
- END -
關(guān)于我們:
速石科技專為有高算力需求的企業(yè)級用戶提供一站式算力運(yùn)營解決方案,幫助用戶提升10-20倍業(yè)務(wù)運(yùn)算效率,降低成本達(dá)到75%以上,加快市場響應(yīng)速度。目前主要應(yīng)用領(lǐng)域包括藥物研發(fā)、基因測序分析、半導(dǎo)體行業(yè)的EDA仿真及電路設(shè)計、汽車行業(yè)的自動駕駛開發(fā)、虛擬碰撞試驗(yàn)以及AI人工智能。
想了解更多,可添加小F微信(ID:imfastone)
文章推薦:
>>AWS、阿里云、Azure、Google Cloud、華為云、騰訊云 各種云服務(wù)器價格收費(fèi)對比(上)
The post 全球半導(dǎo)體行業(yè)上云格局一覽和十個上云實(shí)踐問題的過來人解答 appeared first on 速石科技BLOG.]]>