大禹智芯云化裸金屬方案,協(xié)助企業(yè)實現(xiàn)物理機快速上云

責任編輯:yang

2023-07-26 17:08:17

摘自:西盟科技資訊

近一兩年來,大禹智芯在專注于做DPU產(chǎn)品研發(fā)的同時,也接觸了很多企業(yè)客戶,與客戶做深入合作交流的過程讓我們有更多機會切身了解到他們在使用DPU過程中面臨的挑戰(zhàn),以及思考DPU如何才能發(fā)揮真正的價值。大禹智芯借鑒或參考客戶給予的反饋,也不斷對產(chǎn)品規(guī)劃和技術(shù)實現(xiàn)路線進行更加貼合客戶實際需求的調(diào)整。

  一直以來,大禹智芯從未停止過思考如何用DPU幫助企業(yè)打破技術(shù)壁壘以滿足業(yè)務需求,以及如何解決企業(yè)在使用DPU過程中所遇到的實際問題,從而幫助客戶真正享受DPU在基礎設施層面發(fā)揮的技術(shù)紅利。這些思考也正推動著大禹智芯更好地對產(chǎn)品進行定義和研發(fā)以及對解決方案的打磨。今天將這些思考分享給大家,希望對大家有一些啟發(fā)和幫助。

  以下內(nèi)容源自大禹智芯解決方案負責人余曦老師今年5月在蘇州DPU線下Meetup的分享。

  大禹智芯成立于2020年,是國內(nèi)最早一批專注于做 DPU產(chǎn)品和研發(fā)的科技初創(chuàng)公司,致力于向廣泛用戶提供包括芯片、硬件產(chǎn)品、系統(tǒng)軟件、應用集成等一整套圍繞DPU/智能網(wǎng)卡的軟硬件產(chǎn)品及服務。目前,大禹智芯已經(jīng)推出了多款DPU產(chǎn)品。

  大禹智芯以DPU作為基礎設施服務底座的產(chǎn)品化實現(xiàn)和解決方案的打造,是緊密圍繞云化裸金屬的形式來呈現(xiàn)的,這是由技術(shù)總體發(fā)展趨勢和路線決定的。云計算的發(fā)展初始是使用虛擬機,隨后在發(fā)現(xiàn)企業(yè)上云過程中面臨很多重載業(yè)務無法上云的問題,當時應對這種問題的方法有不少,有的是給用戶提供一臺物理機去承載那些重載業(yè)務,有的是采用虛擬機一虛一的方式供用戶承載相對較重的業(yè)務,這樣可以把一臺物理機性能最大化地釋放給虛擬機,但虛擬化所帶來的性能損失,導致仍然無法完全滿足重載應用的部署要求。隨著云計算的逐漸普及,為了滿足靈活性和可拓展性等需求,裸金屬云服務出現(xiàn)并得到廣泛應用,裸金屬是為了解決企業(yè)上云過程中的產(chǎn)品化問題。

  為了滿足市場對運行效率,彈性及性能的不斷提升的要求,基于云化裸金屬狀態(tài)去做虛擬化和容器,可獲得比傳統(tǒng)模式更好的性能和更高的效率。云化裸金屬從原先的一種云計算產(chǎn)品形態(tài),逐漸變?yōu)榱嗽朴嬎慊A設施服務的基座,基于此基座構(gòu)建多種形式的算力服務輸出,是當前云計算發(fā)展的一個重要趨勢。

  因此,大禹智芯的產(chǎn)品和服務緊密圍繞以云化裸金屬作為基座,把虛擬化的網(wǎng)絡、虛擬化存儲以及云管控平面全部放到 DPU 上實現(xiàn),形成云化裸金屬狀態(tài),基于此構(gòu)建虛擬機和容器的服務,同時向上層提供三種服務能力。

  首先,我們將傳統(tǒng)存算一體的HCI(Hyper Converged Infrastructure)結(jié)構(gòu)向存算分離的CDI(Composable Disaggregated Infrastructure)結(jié)構(gòu)轉(zhuǎn)變。在CDI 結(jié)構(gòu)中,物理機上沒有本地存儲單元,即不存在任何物理介質(zhì)盤,所有的物理介質(zhì)是存在于數(shù)據(jù)中心內(nèi)的云盤狀態(tài)資源池內(nèi)。這個云盤為整個計算側(cè)節(jié)點提供通過網(wǎng)絡遠程訪問塊存儲的服務。通過DPU,將位于整個塊存儲服務上操作系統(tǒng)和數(shù)據(jù)拉到本地,在剝離網(wǎng)絡部分后向主機側(cè)暴露本地的塊存儲設備,對于本地應用或操作系統(tǒng)來說,所使用到的存儲均為“本地存儲,但實質(zhì)上這是經(jīng)過了一層網(wǎng)絡協(xié)議卸載或網(wǎng)絡處理來實現(xiàn)將網(wǎng)絡存儲轉(zhuǎn)換成本地存儲的,因為這部分工作是由DPU來“無感知”地完成的。

  第二個就是虛擬網(wǎng)絡能力,包括物理機邏輯組上或者容器、虛擬機上運行應用,所使用的網(wǎng)絡接口全部由DPU來暴露,網(wǎng)絡接口在DPU上可呈現(xiàn)出多種豐富的overlay網(wǎng)絡能力。再基于此,我們實現(xiàn)了一系列虛擬機網(wǎng)絡高級功能,例如QoS、CT等。

  接下來非常重要的是云平臺組件的卸載。隨著網(wǎng)絡功能和存儲功能從主機側(cè)下沉到DPU,跟網(wǎng)絡和存儲相關(guān)功能組件的控制單元也要隨之下沉。同時,計算資源管控也會有下沉到DPU的需求,大禹智芯也聯(lián)合合作伙伴通過DPU實現(xiàn)了這樣的功能。在4月21日上海舉辦的2023 openEuler開發(fā)者日,大禹智芯受邀與OpenInfra基金會、openEuler社區(qū)聯(lián)合對外發(fā)布了DPU無感卸載的Demo。在Demo呈現(xiàn)的演示環(huán)境中,主機側(cè)和DPU側(cè)分別運行著openEuler操作系統(tǒng),利用openEuler自身在兩個操作系統(tǒng)后端的通路,將libvirtd虛擬化上計算側(cè)資源控制組件下沉到DPU上。虛擬機開通和銷毀等操作可全部在DPU上完成,不需要延伸到客戶的操作系統(tǒng)上去實現(xiàn)。如此一來,網(wǎng)絡存儲和計算側(cè)控制的完整上云組件可完全卸載至DPU,由DPU全權(quán)承載,通過DPU提供的額外算力單元(或算力組件)承載所有上云系統(tǒng)和實現(xiàn)上云組件的部署,同時還能夠保持DPU與上層主機側(cè)之間的隔離和獨立性。

  基于以上特性,大禹智芯可通過DPU及配套組件為企業(yè)用戶提供快速搭建云化裸金屬平臺的服務??蛻艨稍跇?gòu)建的平臺上根據(jù)自己需求實現(xiàn)虛擬化或容器化工作,實現(xiàn)Anystack功能。這是目前大禹智芯做的存算分離架構(gòu)的集中化體現(xiàn)。

  而說到存算分離架構(gòu)的優(yōu)勢業(yè)界有目共睹也深有體會,這個架構(gòu)對未來基礎設施層面結(jié)構(gòu)的發(fā)展具有深遠影響。目前,國內(nèi)眾多存儲廠商也正擁抱這個趨勢,逐漸向存算分離架構(gòu)演進方向去更新迭代存儲產(chǎn)品。

  存算分離架構(gòu)中需要重點解決的問題是如何充分利用額外算力單元從而不過多占用計算側(cè)算力資源。這就是涉及到從計算側(cè)到存儲資源側(cè)的打通,DPU可以在當中作為紐帶將計算側(cè)的節(jié)點和存儲資源中的存儲資源單位建立有機連接,操作系統(tǒng)或數(shù)據(jù)均可放到遠端云盤體系之內(nèi),再按需通過DPU拉到本地提供給上層主機側(cè)使用。

  這樣可帶來飛躍式優(yōu)勢:一方面可真正實現(xiàn)存儲資源的彈性使用,并大幅提升存儲物理介質(zhì)的利用率,提升投資回報率;另一方面,在遇到計算側(cè)界面的故障時可實現(xiàn)分鐘級的業(yè)務恢復,大幅度顯著提高企業(yè)用戶的運維效率。而在傳統(tǒng)存算一體架構(gòu)中是要實現(xiàn)快速的業(yè)務恢復是非常困難的,因為數(shù)據(jù)、操作系統(tǒng)和應用都在本地,設備故障之后,需要找相同配置的設備把操作系統(tǒng)、數(shù)據(jù)和應用都分別恢復,這個過程往往對于業(yè)務感知來說是漫長和復雜的。

  基于云化裸金屬方案,大禹智芯可助力企業(yè)級用戶實現(xiàn)虛擬云和容器云/云原生的應用。一方面,為傳統(tǒng)數(shù)據(jù)中心提供云化裸金屬服務能力,借助該服務傳統(tǒng)數(shù)據(jù)中心可搭建一套完整的裸金屬服務平臺,從而助力其提供比擬公有云部署方式和交互體驗的云服務,以滿足其客戶對IDC服務的更高服務需求。另一方面,對于擁有物理位置零散、物理配置不統(tǒng)一的眾多服務器,但希望高效統(tǒng)一納管這些服務器并快速上云的企業(yè)級用戶,大禹智芯云化裸金屬解決方案可提供物理機上云的一站式服務,通過DPU和管控平臺相結(jié)合,讓企業(yè)快速實現(xiàn)分散的物理服務器資源統(tǒng)一納管,實現(xiàn)中心與邊緣、新舊IT設備的整合,快速完成全面“上云”。

  大禹智芯以交鑰匙模式向企業(yè)用戶提供完整的云化裸金屬服務,讓企業(yè)用戶簡單快捷地享受DPU技術(shù)紅利,更高效靈活搭建滿足自身業(yè)務需求的云平臺。

  大禹智芯產(chǎn)品介紹

  一、大禹智芯DPU產(chǎn)品

  為滿足不同客戶及不同場景的DPU使用需求,大禹智芯堅持從貼近用戶需求的場景出發(fā),遵循明確的產(chǎn)品規(guī)劃路線,提供Paratus系列DPU產(chǎn)品,目前已推出2個產(chǎn)品序列:

  1.0序列產(chǎn)品——Paratus 1.0、Paratus 1.5

  Paratus 1.0和Paratus 1.5是大禹智芯的第一款DPU產(chǎn)品。通過運行在ARM SoC上的Linux操作系統(tǒng)及DPDK、SPDK開發(fā)套件,用戶可將原先運行在主機側(cè)的功能方便的下沉到DPU上運行,實現(xiàn)主機側(cè)算力資源的釋放?;谙嗤腄PU開發(fā)運行環(huán)境,大禹智芯也提供了虛擬化網(wǎng)絡組件,存儲客戶端組件以及與開源云管平臺Openstack和Kubernetes集成所必要的相關(guān)組件。用戶通過Paratus1.0構(gòu)建高性能的裸金屬云、虛擬機云及容器云等服務。Paratus 1.0可廣泛應用于公有云,邊緣云,企事業(yè)內(nèi)部私有云及其他復雜網(wǎng)絡流量處理等場景。

  2.0序列產(chǎn)品——Paratus 2.0

  Paratus 2.0是大禹智芯在1.0序列產(chǎn)品基礎上,通過增加FPGA組件而打造的全新DPU產(chǎn)品。采用ARM SoC + FPGA的硬件架構(gòu),在保持了與第一款DPU產(chǎn)品相同的軟件開發(fā)運行環(huán)境的同時,提供了基于FPGA的網(wǎng)絡數(shù)據(jù)處理通路,大幅提升了網(wǎng)絡流量處理能力。

  在此基礎上,Paratus 2.0還具有一些獨特的功能:大禹智芯自研高性能網(wǎng)絡協(xié)議HPRT™的實現(xiàn)可充分釋放RDMA應用的潛力;無感知端到端網(wǎng)絡數(shù)據(jù)加密功能可最大化保證數(shù)據(jù)網(wǎng)絡傳輸可靠性,其功能及性能均為業(yè)界領(lǐng)先水平;網(wǎng)絡上層應用行為分析功能可為網(wǎng)絡入侵行為判斷提供實時可靠的數(shù)據(jù)支撐。

  二、大禹智芯裸金屬服務管理平臺

  大禹智芯通過對數(shù)據(jù)中心基礎設施能力進一步分析與整合,針對企業(yè)上云過程中遇到的難點、痛點,與大禹智芯自研云管平臺相結(jié)合,推出完整的以DPU為底座的云化裸金屬方案,該方案面向廣泛行業(yè)用戶,加速企業(yè)自有IT系統(tǒng)上云進程,為企業(yè)數(shù)字化轉(zhuǎn)型提供基礎設施層服務支撐。

  其中,大禹智芯自研裸金屬云服務管理平臺具備完整的計算資源管理,存儲資源管理,網(wǎng)絡資源管理功能,允許用戶按需創(chuàng)建、配置和管理裸金屬服務器資源。

  - 用戶可以根據(jù)應用程序的性能要求和資源需求選擇合適的計算實例類型,并隨時調(diào)整資源分配。

  - 允許用戶創(chuàng)建和管理虛擬網(wǎng)絡資源,這些網(wǎng)絡資源使用戶能夠在云上構(gòu)建復雜的網(wǎng)絡架構(gòu),實現(xiàn)安全的資源隔離和訪問控制。

  - 云平臺為用戶提供多種存儲選項,包括普通云盤和SSD云盤等。這些存儲服務旨在滿足不同類型的應用程序和數(shù)據(jù)存儲需求。用戶可以根據(jù)性能、可靠性和成本要求選擇合適的存儲服務,并隨時擴展或縮小存儲容量。

鏈接已復制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號