電子發(fā)燒友網報道(文/李彎彎)目前談到GPU,大家首先想到的應該就是英偉達了。近一年多時間來,隨著大模型的發(fā)展,英偉達GPU的強大實力可謂無人不知。而相比之下,國產GPU的聲勢就小了許多。事實上,近些年國內也有不少GPU企業(yè)在逐步成長,雖然在大模型的訓練和推理方面,與英偉達GPU差距極大,但是不可忽視的是,不少國產GPU企業(yè)也在AI的訓練和推理應用上找到位置。

景嘉微
景嘉微是國產GPU市場的主要參與者,目前已經完成JM5、JM7和JM9系列三代圖形處理芯片的研發(fā),并成功實現產業(yè)化。
2024年3月12日,該公司發(fā)布公告稱,其面向AI 訓練、AI推理、科學計算等應用領域的景宏系列高性能智算模塊及整機產品研發(fā)成功,并將盡快面向市場推廣。
根據公告,景宏系列支持INT8、FP16、FP32、FP64等混合精度運算,支持全新的多卡互聯技術進行算力擴展,適配國內外主流CPU、操作系統(tǒng)及服務器廠商,能夠支持當前主流的計算生態(tài)、深度學習框架和算法模型庫,大幅縮短用戶適配驗證周期。
海光信息
海光信息的產品包括海光通用處理器(CPU)和海光協處理器(DCU)。海光DCU屬于GPGPU 的一種,采用“類CUDA”通用并行計算架構,能夠較好地適配、適應國際主流商業(yè)計算軟件和人工智能軟件。
海光8000系列具有全精度浮點數據和各種常見整型數據計算能力,具有最多64個計算單元,能夠充分挖掘應用的并行性,發(fā)揮其大規(guī)模并行計算的能力,快速開發(fā)高能效的應用程序。
海光DCU主要部署在服務器集群或數據中心,為應用程序提供性能高、能效比高的算力,支撐高復雜度和高吞吐量的數據處理任務。在AIGC持續(xù)快速發(fā)展的時代背景下,海光DCU 能夠完整支持大模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應用,與國內包括文心一言等大模型全面適配,達到國內領先水平。
瀚博半導體
瀚博半導體成立于2018年12月,是一家GPU芯片提供商,致力于為人工智能核心算力和圖形渲染、內容生成、AIGC提供全棧式芯片解決方案。瀚博目前擁有自主研發(fā)的核心IP以及兩代GPU芯片,并衍生AI、渲染、視頻三大產品線。
據介紹,其2023年推出的第二代GPU SG100芯片,采用7nm先進制程,具備業(yè)界一流的渲染性能,同時兼具低延時高吞吐的AI算力和強大的視頻處理能力,可廣泛支持數字孿生、數字人、云桌面、云手機、云游戲、云渲染、工業(yè)軟件等多領域應用。
同時針對大模型時代算力需求,瀚博還首發(fā)了LLM大模型AI加速卡VA1L,具備200 TOPS INT8/72 TFLOPS FP16算力,并支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網絡模型。同時,瀚博更重磅推出AIGC大模型一體機,共使用8張LLM大模型AI加速卡VA1L,支持512GB顯存,進而支持1750億參數的大模型。
摩爾線程
摩爾線程成立于2020年10月,是一家以全功能GPU芯片設計為主的集成電路公司。該公司已經發(fā)布兩款自主研發(fā)的GPU芯片產品,2022年3月發(fā)布GPU產品“蘇堤”,11月又發(fā)布了第二款GPU芯片“春曉”。
“春曉”內置MUSA架構通用計算核心以及張量計算核心,可支持FP32、FP16和INT8三種計算精度;相較于其首款自研的GPU“蘇堤”,“春曉”內置的四大計算引擎都進行了全面升級,性能顯著提升,AI計算加速平均提升4倍。
沐曦集成
沐曦成立于2020年9月,致力于為異構計算提供全棧GPU芯片及解決方案,可廣泛應用于智算、智慧城市、云計算、自動駕駛、數字孿生、元宇宙等前沿領域。
沐曦集成目前有三條產品線規(guī)劃,曦思N系列GPU產品用于智算推理,曦云C系列GPU產品用于通用計算,曦彩G系列GPU產品用于圖形渲染。據沐曦此前對外透露,公司N系列云端推理芯片已經量產出貨,C系列于2023年6月13日回片并完成測試。
沐曦產品均采用完全自主研發(fā)的GPU IP,擁有完全自主知識產權的指令集和架構,配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢,能夠為客戶構建軟硬件一體的全面生態(tài)解決方案。
天數智芯
天數智芯致力于開發(fā)自主可控、國際領先的高性能通用GPU產品,探索通用GPU趕超發(fā)展道路,加快建設自主產業(yè)生態(tài),為全產業(yè)提供高端算力解決方案。
天數智芯2018年正式啟動通用GPU芯片設計,在2021年發(fā)布了其通用GPU“天垓100”芯片及天垓100加速卡,2021年10月宣布天垓100正式進入量產環(huán)節(jié)。2022年9月,又發(fā)布了首款7nm制程的云端推理通用GPU產品“智鎧100”。
智鎧 100 芯片支持 FP32、FP16、INT8 等多精度混合計算,實現了指令集增強、算力密度提升、計算存儲再平衡,支持多種視頻規(guī)格解碼。
燧原科技
燧原科技專注人工智能領域云端和邊緣算力產品,致力為通用人工智能打造算力底座,提供原始創(chuàng)新、具備自主知識產權的AI加速卡、系統(tǒng)集群和軟硬件解決方案。產品可廣泛應用于泛互聯網、智算中心、智慧城市,智慧金融、科學計算、自動駕駛等多個行業(yè)和場景。
該公司于2018年3月成立,僅用18個月時間,即發(fā)布第一代AI芯片邃思1.0,又于2021年7月發(fā)布邃思2.0。到現在,該公司已經在兩款芯片的基礎上迭代了兩代訓練和推理產品,第三代產品也已經在研發(fā)中。并且,燧原科技已經在科研領域和智慧城市的應用中落地了訓練和推理的超千卡算力集群。
登臨科技
登臨科技專注于芯片研發(fā)與技術創(chuàng)新,致力于打造云邊端一體、軟硬件協同的前沿芯片產品和平臺化基礎系統(tǒng)軟件。公司自主創(chuàng)新的GPU+(基于GPGPU的軟件定義的片內異構計算架構),在兼容CUDA/OpenCL在內的編程模型和軟件生態(tài)的基礎上,通過架構創(chuàng)新,完美解決了通用性和高效率的雙重難題。
登臨首款基于GPU+的創(chuàng)新AI計算加速器Goldwasser已規(guī)?;\用在各個應用場景。未來將繼續(xù)秉承核心IP全自研的架構實現,以AI計算為主線,以創(chuàng)新為靈魂,加強核心IP自主研發(fā),加速產品在高級自動駕駛,圖形加速等相關領域的開拓創(chuàng)新和商業(yè)化進程。
寫在最后
GPU最初是為解決CPU在圖形處理領域性能不足的問題而誕生的,早期它多用于圖形處理,而如今大家談到用于AI訓練和推理多是通用計算GPGPU,它脫胎于早期的圖形處理器。
上述談到的GPU企業(yè),有些既有用于AI計算的GPU產品,也有用于圖形處理的產品,如景嘉微,是國內較早入局GPU市場的企業(yè),之前已經發(fā)布過多個系列的產品,主要用于圖形處理。近期才公布面向AI 訓練、AI推理、科學計算等應用領域的GPU產品研發(fā)成功。
如沐曦入局GPU市場較晚,像用于AI訓練、推理的產品,以及用于圖形渲染的產品都有規(guī)劃,不過它是先推出了用于AI計算的GPU芯片,而用于圖形渲染的產品預計要到2025年才發(fā)布。像瀚博半導體、摩爾線程等也是面向圖形渲染和AI計算都有產品。
面對現在關注比較多的大模型的訓練和推理,國產GPU企業(yè)也在積極跟進,如海光DCU就能夠完整支持大模型訓練,實現LLaMa、GPT、Bloom、ChatGLM、悟道、紫東太初等為代表的大模型的全面應用;瀚博基于新一代GPU芯片首發(fā)了LLM大模型AI加速卡VA1L,能支持ChatGPT、LLaMA、Stable Diffusion等主流AIGC網絡模型。天數智芯、燧原科技等也都在支持大模型的應用上取得進展。
-
gpu
+關注
關注
28文章
5067瀏覽量
134134 -
大模型
+關注
關注
2文章
3396瀏覽量
4872
發(fā)布評論請先 登錄
首款全國產通用GPU芯片發(fā)布 沐曦集成推出曦云C600
為什么無法在GPU上使用INT8 和 INT4量化模型獲得輸出?
Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)
壁仞科技完成Qwen3旗艦模型適配
摩爾線程GPU率先支持Qwen3全系列模型
摩爾線程GPU原生FP8計算助力AI訓練
國產AI芯片破局:國產TCB設備首次完成CoWoS封裝工藝測試

盤點國產GPU在支持大模型應用方面的進展
評論