久久国产精品_国产精品,久久精品国产亚洲av蜜臀

首頁資訊中心財經(jīng)頻道娛樂頻道體育頻道房產(chǎn)頻道教育頻道科技頻道行業(yè)頻道

首頁 > 彩票

每日消息!大模型改變算力，新華三加碼算力集群能力

來源：鈦媒體APP 時間：2023-06-23 12:31:29

算力與應用的發(fā)展，是一個不斷上升、循環(huán)往復的過程，每當算力提升到一個新高度，總是會催生新的應用，新應用出現(xiàn)又需要更高的算力來支持。大模型就是算力發(fā)展歷史上的一個關鍵節(jié)點。

“大家可以把‘算力自由’想象成第二次工業(yè)革命，電氣化時代，愛迪生發(fā)明燈泡是一個標志性時刻，但最關鍵的是誰能夠把產(chǎn)品做出來，普惠大眾?！毙氯A三集團副總裁、計算存儲產(chǎn)品線總裁徐潤安表示。

(資料圖片)

大模型對算力的改變才剛剛開始，大模型將來會消耗多少算力，或者說產(chǎn)生大模型算力的方法會有多少種，現(xiàn)在都是未知數(shù)。

“我相信在不遠的將來，整個算力市場都會帶來新一輪的革命，不論是硬件還是軟件，所有的目的都是為了源源不斷地提供算力給AI，當然我也相信，AI也會創(chuàng)造出更多新的方法，提高算力使用的效率”，徐潤安補充表示。

而目前，大模型對算力的改變已經(jīng)有跡可循。

算力走向全局化

傳統(tǒng)計算以集中式架構為主，一定程度上存在復雜、低效、僵化的問題，但隨著分布式架構重塑算力形態(tài)，需要在擴展性、管理性、安全性等方面實現(xiàn)全面升級，并將向著高效、低碳、智能的方向加速發(fā)展。

新華三集團計算存儲產(chǎn)品線副總裁劉宏程表示，“大模型到來之后，今天談到的算力，更多是計算、存儲、網(wǎng)絡一體化解決方案的融合。我們從客戶那了解到，只賣GPU不夠，建立一個全方位的解決方案，需要把服務器、存儲和網(wǎng)絡綜合形成一個整體解決方案，才能幫助用戶建立大模型環(huán)境，最終落實到行業(yè)應用中?！?/p>

上游芯片廠商每一次的產(chǎn)品更新，都意味著下游服務器廠商需要重新做一次研發(fā)，例如英偉達GPU從Ampere架構更新到Hopper架構，新華三的服務器R5500 G5也隨之更新到R5500 G6。

其中，除了GPU的變化，CPU也更新到下一代， PCle從過去的Gen4到Gen5，網(wǎng)絡從過去的100G和200G為主，升級為200G和400G為主。此外，新的網(wǎng)絡互聯(lián)、xPU、DPU等技術也變得越來越成熟，這就要求服務器廠商有相對完善的儲備。

服務器本身就是系統(tǒng)級工程，大模型的改變是將服務器集群視作整體，需要在更大范圍做系統(tǒng)級別優(yōu)化。

劉宏程介紹，“從我們現(xiàn)在看到的用戶實踐，客戶要求無損網(wǎng)絡，RDMA也好，RoCE也好，不能丟一個數(shù)據(jù)包。丟一個數(shù)據(jù)包，有可能前面幾十個小時訓練的數(shù)據(jù)要重算，用戶算力的利用率會降到非常低的水平，我們見過客戶因為調度不靈活，算力甚至只用了5%、10%，服務器就在那空轉?！?/p>

“每跨一臺服務器，性能就會有一定的削減，這個削減來源于服務器之間互聯(lián)和數(shù)據(jù)之間的調度，比如存儲數(shù)據(jù)怎么獲得，兩臺不同的服務器之間網(wǎng)絡帶寬和延遲是多少，這些都是整個AIGC解決方案里面需要綜合考慮的部分。”他說。

此外，高能耗也是大模型算力的一個客觀限制，很多客戶一個機柜里只放一臺GPU服務器，甚至兩個機柜放一臺，就是因為能耗問題。根據(jù)ODCC的數(shù)據(jù)顯示，2020年我國數(shù)據(jù)中心能耗總量為939億千瓦時，碳排放量為6464萬噸。預計到2030 年，能耗總量將達到3800億千瓦時左右，碳排放增長率將超過 300%。如何做到綠色低碳，也是大模型算力的一個瓶頸。

“一體·兩中樞”，新華三補短板

以云計算為代表的廠商，在大模型算力集群方面刷足了存在感，這就要求服務器廠商補充相應的能力，近年來已有跡象，例如云服務商和服務器廠商在私有云領域直接競爭，大模型則將這一競爭推到更深層次，新華三于去年底推出的“一體·兩中樞”智慧計算體系，增加了競爭籌碼。

“一體”是指新華三以CPU、GPU和xPU為核心，構造出的覆蓋通用計算、異構計算等全場景的多元計算體系，并在近年通過液冷等低碳技術的融合，構建起高效、低碳數(shù)據(jù)中心的算力基石；

“兩中樞”分別對應智能算力中樞（傲飛）和智能管理中樞，新華三智能算力中樞（傲飛）能實現(xiàn)傳統(tǒng)科學計算與AI計算深度融合，同步實現(xiàn)科學計算批量作業(yè)和AI容器作業(yè)的調度編排，滿足教育、科學、能源、制造等高性能計算場景需求。

智能管理中樞提供部署、調優(yōu)、節(jié)能、診斷、退役都能能力，為數(shù)據(jù)中心服務器提供全生命周期智能管理，能幫助企業(yè)提高運維效率，降低運維成本，客戶可根據(jù)具體的業(yè)務需求對服務器進行靈活的配置部署，從而打造自己專屬的運維環(huán)境。

可以理解“一體”是新華三的算力基礎，而“兩中樞”拓展了智算算力的集群能力，對應的是服務器集群的管理。

譬如ChatGPT參數(shù)達到了1750億，每個參數(shù)如果只算2個字節(jié)，意味著需要8塊最高端的GPU卡，才能容下所有的參數(shù)，實現(xiàn)靈活的應用，進一步驅動算力從通用轉向GPU、NPU或者xPU等綜合算力，高并發(fā)的情況需要更多差異化算力單元來滿足。

“我們看到調度比較有效率的就是64卡和128卡，再往高其實已經(jīng)開始有衰減，需要跨另外一個網(wǎng)絡做調度?！眲⒑瓿陶f。

據(jù)了解，新華三大部分客戶所使用的GPU集群數(shù)量在64、128和256卡級別，衰減相對比較弱，現(xiàn)有的網(wǎng)絡限制比較接近128卡的算力限制。舉例來看，現(xiàn)在網(wǎng)絡架構可能8000個端口，一般一個計算模塊對一個網(wǎng)絡端口進行調度，8000個端口對應128個GPU，超過這個數(shù)量，就跨入另外一個網(wǎng)絡，需要兩臺交換機。

“當前GPU市場較為火熱，但是NPU和xPU的技術在中間也起到了非常關鍵的作用”，劉宏程說，“一體”就是多元算力，新華三之前提出的觀點得到了驗證，讓用戶根據(jù)場景來選擇不同的算力單元，滿足不同的計算需求。

（本文首發(fā)鈦媒體APP 作者｜張帥，歡迎添加作者微信mr3right交流）

相關稿件

每日消息!大模型改變算力，新華三加碼算力集群能力

菠蘿是怎么種出來的(菠蘿種植菠蘿的種植過程)

國家防總辦公室、應急管理部會商調度端午節(jié)及梅雨期防汛工作-天天熱訊

環(huán)球報道:形容武松的詞語

EDG再次被零封，教練在干嘛？賽后采訪出現(xiàn)重大事故，hz暴力開團

一夜10大轉會動態(tài)：大巴黎最后通牒姆巴佩，曼城領跑賴斯爭奪戰(zhàn) 要聞速遞

伊能靜罕曬兒女同框照，哈利從美國放假回國，夢想當導演拒當藝人

日本6月Markit服務業(yè)PMI為54.2，前值55.9

基金委2學部召開國家杰出青年科學基金項目評審會-環(huán)球最新