● 本報記者 楊潔
在9月27日-29日召開的2024中國算力大會上,一系列關于我國算力基礎設施運行情況的數據和措施發布。工業和信息化部總工程師趙志國在開幕式上介紹,全國在用算力中心機架總規模超過830萬標準機架,算力總規模達246EFLOPS,位居世界前列。
智算成為行業重要驅動力。中國信息通信研究院院長余曉暉表示,相比美國,我國算力芯片生態比較“碎片化”,給建設萬卡級大型算力集群帶來諸多挑戰。
趙志國表示,接下來將通過強化規劃設計、創新驅動、應用培育等手段,進一步提升算力產業綜合實力和賦能實效。
全球科技角逐主賽道
在此次大會上,《中國綜合算力指數報告(2024)》發布。余曉暉介紹,截至2023年底,全球算力基礎設施總規模達到910EFLOPS,同比增長40%。截至2024年6月底,我國在用算力中心機架總規模超過830萬標準機架,算力總規模達246EFLOPS,其中智算算力同比增速超過65%。
紫光股份董事長、新華三集團總裁兼CEO于英濤表示,智算已成為繼水、電、氣、路、網之后,匹配社會生產力發展的新型基礎設施,是全球科技角逐的主賽道。
多地加大力度支持智算中心建設。在此次算力大會上,河南投資集團總經理朱紅兵宣布,河南將設立總規模100億元的算力基金,通過“算力支付+基金投資”的方式,培育各類算力應用企業,打造算力生態。河南將打造中部最大的萬卡智算集群,明年年底實現2000P的算力供給。
生態“碎片化”難題待解
余曉暉表示,與美國相比,我國算力芯片生態比較“碎片化”,有幾十款算力芯片,不同的芯片對應不同的開發框架、軟件棧以及算子庫等,“異構算力之間的協同穩定問題亟待解決”。
百度集團執行副總裁、百度智能云事業群總裁沈抖此前介紹,GPU算力集群有三個特征——極致規模、極致高密和極致互聯,建設一個萬卡集群,僅GPU的采購成本就高達幾十億元。沈抖表示,構建算力集群,并不是簡單地買來GPU連接好就可以,而是需要很多技術,“GPU芯片型號越多樣,管理越復雜;GPU需要執行大量并行計算”。
于英濤表示,要持續構建算力協同創新突破的格局,加快推進GPU橫向、縱向聯接標準建設,進一步降低算力部署和應用的復雜度;積極推進軟件生態相關標準的統一,降低應用適配成本,賦能產業升級;與全球先進企業開展交流互動,持續促進GPU產業的理念和技術創新。
余曉暉坦言,當前,算力需求和供給之間存在很多錯位,不能完全精準適配,算力互聯成網是下一步需要推動的重點工作。此外,算力中心的能耗問題愈發受到關注,未來需要將算力和電力進行統籌規劃。
今年9月,南方電網發布《電力算力協同行動計劃》,將開展“電算協同”十大行動,加速構建電力與算力協同規劃、建設、調度、交易的新基建模式,進一步推動電力與算力深度融合,服務數字經濟高質量發展。
加快核心技術攻關
趙志國在會上表示,將從強化規劃設計、創新驅動、應用培育、安全保障四個方面,穩步提升我國算力產業綜合實力,持續提升算力的賦能成效,構建適應中國式現代化發展所需要的算力產業體系。
在規劃設計方面,趙志國表示,要統籌好“量的增長”和“質的提升”,面向重大區域發展戰略制定規劃,促進東西部算力高效互補和協同聯動;完善多元配置機制,面向人工智能等新興產業制定發展規劃,建設一批智算中心;完善互聯互通機制,構建算力互聯程序規則、市場規則、質量檢測規則。
在創新驅動方面,趙志國表示,要統籌好技術創新和產業創新,加快關鍵核心技術攻關,推動高端芯片、架構設計、大模型算法、高速傳輸協議等基礎軟硬件技術實現更大突破,建立健全算力產業標準體系;加快創新成果產業轉化,組織實施產業鏈強鏈補鏈行動,開展“算力強基揭榜掛帥”,建設一批可滿足各類創新主體進行算力研發、驗證、調度、應用的載體平臺,探索形成科技創新和產業創新深度融合的發展路徑。
于英濤建議,聚焦應用導向,深化大模型在垂直行業的應用探索,打造更多“殺手級應用”。
在應用培育方面,趙志國表示,要加快推進算力賦能新型工業化建設,在工業企業研發設計、生產制造、倉儲物流、營銷服務等重點環節,培育一批典型應用場景和解決方案;打造算力服務體系,重點面向中小企業培育一批算力應用解決方案提供商,建設一批集成多方資源、開放多項能力的服務平臺,在工業、教育、交通、能源等重點領域形成可復制的發展模式。