內(nèi)卷
釋義:原指社會文化模式發(fā)展過程中的停滯,現(xiàn)引申為非理性的內(nèi)部競爭或“被自愿”競爭。
eg.某培訓機構(gòu)標語:您來,我們培養(yǎng)您孩子;您不來,我們培養(yǎng)您孩子的競爭對手。
內(nèi)卷導致加班文化盛行,工作完不成?加班來解決。
然而美國國家稅務(wù)局的數(shù)據(jù)科學家黛博拉·泰勒,卻用實際經(jīng)歷告訴我們,加班這顆萬靈藥,也有失效的時候。
美國國稅局的故事
泰勒接到一項任務(wù),她需要從國稅局的數(shù)據(jù)庫中,歸納出識別身份盜竊及其他欺詐行為的規(guī)律。這個數(shù)據(jù)庫相當龐大,里面躺的數(shù)據(jù)超過300 TB。
300TB什么概念?
如果將一部畫質(zhì)1080P、時長120分鐘的電影,以1G大小計算,300TB等于307,200部電影。一個人不眠不休、正常速度觀影的話,約70年能看完。
可憐的泰勒,讓一堆CPU服務(wù)器連夜加班,都沒能把這項艱巨的數(shù)據(jù)整理任務(wù)整利索。
焦頭爛額之際,Cloudera的工程師來了,將自帶GPU加速Apache Spark 3.0軟件的Cloudera Data Platform(CDP)推薦給國稅局團隊。在沒有修改代碼的情況下,僅對軟件進行快速測試后,泰勒的工作進度立馬得到5倍提升。
針對幾塊滯后的地方,NVIDIA數(shù)據(jù)科學家團隊出手將一些非常復雜的在CPU中處理的任務(wù),遷移到其插入Spark的RAPIDS軟件接口中,從而使這些任務(wù)的所有代碼都在分布式Spark集群的GPU上順利運行。
最終,Cloudera和NVIDIA的這項技術(shù)整合,為美國國稅局的數(shù)據(jù)工程和數(shù)據(jù)科學工作流程,帶來了10倍的速度提升和一半的成本節(jié)約。
【CPU與GPU的碎碎念】:我們都知道,CPU是個統(tǒng)籌全局的大計算家,可處理大量重復數(shù)據(jù)時它也捉襟見肘。這時就要請出擅長并行運算的GPU了,在ETL(數(shù)據(jù)的提取/轉(zhuǎn)換/加載)和加速海量數(shù)據(jù)分析方面,GPU向來不辱使命。
強強聯(lián)合
NVIDIA的專長在于通過GPU加速AI運算,而Cloudera數(shù)據(jù)平臺作為業(yè)界首個企業(yè)數(shù)據(jù)云,提供了從邊緣到人工智能的全方位分析能力。
NVIDIA GPU加速Apache Spark 3.0軟件的Cloudera數(shù)據(jù)平臺的推出,將打破大量數(shù)據(jù)和緩慢計算造成的瓶頸,大幅加速云中數(shù)據(jù)分析和AI工作負載。
如何看待二者的合作呢?就好比美隊合作鋼鐵俠,楊戩拉攏孫悟空,馬龍聯(lián)手樊振東,一個字,強!
如今,這個強者之師又迎來了他們的第三位猛士——戴爾易安信。
戴爾科技宣布,NVIDIA GPU加速的Cloudera數(shù)據(jù)平臺,可以在戴爾易安信的NVIDIA認證系統(tǒng)上使用了。
這意味著,從研發(fā)到生產(chǎn)的HPC、AI和數(shù)據(jù)科學需求,將進一步自硬件層面汲取能量,并獲得可觀的基礎(chǔ)設(shè)施花銷節(jié)約。
至此,NVIDIA+Cloudera+戴爾易安信的強大隊伍,已集結(jié)完畢,迎接他們的,將是廣闊的HPC/AI舞臺。
戴爾易安信的HPC/AI表現(xiàn)
曾經(jīng)看起來無比高大上的HPC和AI正飛入尋常百姓家。
8月初,IDC公布了全球半年度人工智能市場追蹤報告:
預計2021年,AI市場全球收入將同比增長15.2%達到3418億美元,預計2024年有望達到5000億美元;
在硬件、軟件、服務(wù)這三個人工智能類別中,硬件將在未來幾年保持最快的增速。
人工智能服務(wù)器市場,2020年戴爾易安信作為頂級玩家,營收超過5億美元;
人工智能存儲市場,2020年戴爾易安信依然位居前茅,營收超過1億美元。
廣闊的市場前景,反映了數(shù)據(jù)、技術(shù)驅(qū)動下的業(yè)務(wù)格局變化。
想當年HPC/AI初面世,超算昂貴,專家獨攬,高科技神秘,可望不可即;如今,計算、網(wǎng)絡(luò)、存儲技術(shù)進步了,小型集群和工作站,亦可撐起HPC/AI一片天。
隨之而來的,傳統(tǒng)游戲規(guī)則被打破,門檻降低,更廣泛的用戶可以在業(yè)務(wù)中使用HPC/ AI。只要有需求,各個規(guī)模的企業(yè)都可以利用HPC/AI進行數(shù)據(jù)分析,以獲得市場洞察、提高效率,并為數(shù)據(jù)驅(qū)動的投資追求更高的回報 (ROI)。
打個比方,基于數(shù)據(jù)獲取洞察的工序,含數(shù)據(jù)的清洗、集成、轉(zhuǎn)換、歸約,這好比開火前的食材處理——摘菜、洗菜、分類、裝碟,共同點是取其精華,去其糟粕,在盡可能少的時間內(nèi)又快又好地整理好所有數(shù)據(jù)(食材),是二者一致的追求。
那么如何擺脫赤膊上陣的原始粗獷,向集群化、精細化、多元化邁進呢?
戴爾易安信可以提供這些工序的一站式解決方案。
作為業(yè)界少有的提供HPC打包方案的供應(yīng)商,戴爾易安信擁有廣泛的產(chǎn)品組合,涵蓋就緒解決方案、工作站、服務(wù)器、網(wǎng)絡(luò)、存儲、服務(wù),提供數(shù)據(jù)分析和人工智能所需的HPC性能及效率,并降低復雜性。
這些方案,已經(jīng)得到全球多個行業(yè)客戶的蓋章認證:
作為全球最大銀行卡發(fā)卡公司之一,萬事達卡借助防欺詐引擎打擊全球信用卡欺詐,該引擎通過基于戴爾易安信高性能計算系統(tǒng)的Apache™Hadoop® 集群來實現(xiàn)。
Medacist,藥物轉(zhuǎn)移分析領(lǐng)域的創(chuàng)新者,基于PowerEdge服務(wù)器和PowerScale H500存儲所提供的數(shù)據(jù)分析和人工智能技術(shù),將數(shù)據(jù)計算延遲從24小時降低至5分鐘,從而獲得運營洞察,確?;颊吆歪t(yī)院安全。
西蒙弗雷澤大學推出Cedar超級計算機,采用PowerEdge C4130和C6320服務(wù)器,為加拿大各地研究人員提供領(lǐng)先的超算性能。
所以,難題當?shù)?,你還陷在加班的內(nèi)卷中無法自拔嗎?
打破內(nèi)耗,拒絕人才、資源低效應(yīng)用,孜孜不倦探索科技,認認真真謀求價值創(chuàng)新,這才應(yīng)該是內(nèi)卷的正確打開方式。
另外,如果您所在企業(yè)有HPC/AI方面的“卷需”,歡迎訪問戴爾易安信官網(wǎng)或撥打電話(戴爾官方企采網(wǎng)采購咨詢專線:400-884-6610),與戴爾易安信攜手,以數(shù)據(jù)驅(qū)動業(yè)務(wù)創(chuàng)新,用科技打造可持續(xù)的“護城河”。