金山云輕舟智問知識助手 為客戶提供多項原子能力

責(zé)任編輯:lijing

2024-01-05 10:20:45

摘自:金山

與人工智能的結(jié)合,給了云更多的想象空間,也給各行業(yè)都帶來了新的生產(chǎn)力。隨著技術(shù)的進一步完善和落地,云計算將迎來更強更久的生命力。金山云將持續(xù)圍繞客戶需求“練內(nèi)功”,攜手生態(tài)伙伴以差異化打法布局未來。

隨著云原生、AIGC、大模型等新興技術(shù)的迅速發(fā)展,智能化時代開啟。云計算也正全面步入3.0時代,即云計算和人工智能深度融合的階段。在這個階段,人工智能技術(shù)成為云計算進一步釋放潛力的核心推動力。

1月4日,金山云舉辦了「云+人工智能·時代新機遇」媒體溝通會,金山云副總裁錢一峰、金山云公有云產(chǎn)品中心負責(zé)人孫曉、金山云人工智能與大數(shù)據(jù)產(chǎn)品中心負責(zé)人徐寅斐在會上分享了金山云在基礎(chǔ)能力、平臺能力和模型服務(wù)等方面的技術(shù)歷程和落地實踐。通過技術(shù)自研和升級,金山云已初步建成人工智能時代民用領(lǐng)域全棧的云計算體系。

夯實基礎(chǔ) 全面升級人工智能服務(wù)能力

全球數(shù)字化浪潮風(fēng)起云涌,云計算作為數(shù)字經(jīng)濟重要的支撐基礎(chǔ),正發(fā)揮越來越重要的作用。其中,智能化作為云計算3.0時代的重要理念,已成為數(shù)字基礎(chǔ)設(shè)施升級的重要驅(qū)動力。知名調(diào)研機構(gòu)IDC于2023年發(fā)布的報告顯示,未來5年,以大模型、生成式人工智能驅(qū)動的下一代人工智能有望帶動整體云產(chǎn)業(yè)穿過下行階段,重回高增長時代。

順應(yīng)趨勢,金山云深入探索前沿技術(shù),圍繞AIGC升級核心計算、存儲、網(wǎng)絡(luò)等產(chǎn)品,從多個維度全面擁抱人工智能。在計算方面,金山云第七代云服務(wù)器X7搭載第四代英特爾® 至強® 可擴展處理器、支持英特爾® AMX原生加速能力,CPU性能較上代最高提升60%,內(nèi)存升級至DDR5,頻率較上一代性能提升50%。融合金山云自主創(chuàng)新的加速技術(shù),云服務(wù)器X7可有效提升模型推理性能。

根據(jù)數(shù)據(jù)從極熱到極冷的不同熱度,金山云對象存儲已覆蓋標(biāo)準(zhǔn)存儲、低頻存儲、深度低頻存儲、歸檔存儲、深度冷歸檔存儲和全閃存儲等不同訪問熱度的存儲產(chǎn)品。其中,金山云對象存儲KS3極速型最高可提供1Tbps/PB的兌付帶寬,相較基于機械硬盤(HDD)的對象存儲性能提升了上百倍,能為AIGC、存算分離和高性能計算等場景提供強有力的存儲解決方案。

面向大模型應(yīng)用場景,金山云推出互信虛擬私有網(wǎng)絡(luò)(簡稱“互信VPC”)。相對于標(biāo)準(zhǔn)VPC,互信VPC對進出VPC的通信行為有著更為嚴(yán)格的控制,幫助客戶解決合規(guī)和互信問題。針對HTTP、HTTPS等應(yīng)用層負載場景,公司推出應(yīng)用型負載均衡ALB(Application Load Balancer),單實例最大支持100萬QPS。與云原生場景融合,客戶在使用金山云容器服務(wù)KCE產(chǎn)品或自建K8S集群時,ALB都可作為Ingress部署,為業(yè)務(wù)提供網(wǎng)絡(luò)流量調(diào)度服務(wù)。

當(dāng)前,金山云全棧技術(shù)體系已形成以云產(chǎn)品基礎(chǔ)設(shè)施為底座能力,云產(chǎn)品平臺服務(wù)為核心技術(shù)能力,并通過MaaS互信推理專區(qū)方案和金山云輕舟智問為人工智能客戶提供助力。

加速技術(shù)轉(zhuǎn)化 做大模型助力者

2023年被稱為大模型“元年”。公開數(shù)據(jù)顯示,從年初到年末,國內(nèi)大模型數(shù)量超過200個。與“大模型”數(shù)量呈倍數(shù)級增長相反的是,真正被調(diào)用的大模型卻相對較少。在本次大模型浪潮中,金山云堅持中立定位,充分發(fā)揮自身的底座和平臺能力,做大模型的助力者。

在洞察到模型供需方的痛點后,金山云于去年6月率先推出MaaS互信推理專區(qū)方案(以下簡稱“MaaS 1.0”),在大模型廠商、用戶和金山云之間建立互信,以解決模型及數(shù)據(jù)的互信問題。本次溝通會上,金山云發(fā)布MaaS互信推理專區(qū)方案2.0(以下簡稱“MaaS 2.0”)。

在MaaS 1.0基礎(chǔ)上,MaaS互信推理專區(qū)方案2.0以金山云IaaS和PaaS為底座,可實現(xiàn)云上LangChain的一鍵部署,默認(rèn)對接多個生態(tài)合作商業(yè)大模型和開源大模型。同時支持包括BGE、Bert等在內(nèi)的Embedding模型,能無縫對接金山云全托管向量數(shù)據(jù)庫Milvus,提供面向企業(yè)開發(fā)者的簡單易用、安全可信的一站式推理應(yīng)用部署平臺。此外,MaaS 2.0支持通過標(biāo)準(zhǔn)化的API接口和Web前端界面,實現(xiàn)包括模型推理和知識庫搭建的RAG大模型場景應(yīng)用。為進一步增強云上運行的安全性,MaaS 2.0還提供容器服務(wù)加密鏡像解決方案,依托金山云裸金屬服務(wù),實現(xiàn)在金山云容器服務(wù)中從鏡像加密、加密鏡像上傳、解密鏡像運行的全流程模型安全運行。

同時,為滿足行業(yè)客戶的需求,金山云探索大模型時代企業(yè)賦能新機遇,圍繞企業(yè)級知識助手場景制定了“一三一四”產(chǎn)品全景規(guī)劃,即一套能力(金山云輕舟智問)、三個模型(行業(yè)語言模型、文本分片和Embedding模型)、一個平臺(金山云瀚海平臺)及四大功能(微調(diào)推理、數(shù)據(jù)加速、智能檢索和文檔智能),圍繞生成式人工智能構(gòu)建應(yīng)用落地、模型訓(xùn)練微調(diào)、平臺支撐的全棧能力。基于“一三一四”規(guī)劃,金山云將分別針對應(yīng)用型客戶和平臺型客戶輸出多項原子能力。目前,金山云輕舟智問知識助手產(chǎn)品已完成應(yīng)用以及Embedding模型、多路召回算法和智能數(shù)據(jù)切片模型等核心技術(shù)的建設(shè),計劃優(yōu)先在公共服務(wù)和法律場景落地。

與人工智能的結(jié)合,給了云更多的想象空間,也給各行業(yè)都帶來了新的生產(chǎn)力。隨著技術(shù)的進一步完善和落地,云計算將迎來更強更久的生命力。金山云將持續(xù)圍繞客戶需求“練內(nèi)功”,攜手生態(tài)伙伴以差異化打法布局未來。

鏈接已復(fù)制,快去分享吧

企業(yè)網(wǎng)版權(quán)所有?2010-2024 京ICP備09108050號-6京公網(wǎng)安備 11010502049343號