狠狠躁18三区二区一区?-?百度,久久国产Av无码一区二区老太,最近免费中文字幕大全高清大全10

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）近日，一家由哈佛輟學(xué)生成立的初創(chuàng)公司Etched，宣布了他們在打造的一款“專用”AI芯片Sohu。據(jù)其聲稱該芯片的速度將是英偉達(dá)H100的20倍，但只能跑transformer架構(gòu)的模型。

Sohu，比H100快上20倍

之所以打算Sohu這一自研ASIC AI芯片，是因?yàn)镋tched認(rèn)為GPU在性能升級上的速度太慢了。如果以H100的單位面積算力和交期作為參考，那么從2022年到2025年，英偉達(dá)的H100迭代至B200，2.5年的時(shí)間內(nèi)性能只有15%的提升。所以要想有效提高性能的方式，只有走特化的ASIC芯片一途。

現(xiàn)在發(fā)布的任何AI芯片，在提到性能時(shí)，無疑都會(huì)把英偉達(dá)的H100作為對比參照，Etched的Sohu也不例外。根據(jù)Etched提供的數(shù)據(jù)，單個(gè)Sohu服務(wù)器運(yùn)行Llama 70B時(shí)可以做到50萬Tokens每秒，這一速度是單個(gè)H100服務(wù)器的20倍以上，也是單個(gè)B200服務(wù)器的10倍以上。

在服務(wù)器的配置上，Sohu服務(wù)器和H100服務(wù)器均采用的8卡的配置，所以Etched強(qiáng)調(diào)一個(gè)8xSohu的服務(wù)器就可以替換掉至少160個(gè)H100，大大降低成本的同時(shí)，也不會(huì)有性能損失。

由于Sohu僅支持一種算法，所以絕大多數(shù)的控制流模塊都可以被剔除，芯片可以集成更多的數(shù)學(xué)計(jì)算單元，在算力利用率上可以達(dá)到90%以上，而GPU卻只能做到30%。這也是因?yàn)樵贕PU的電路設(shè)計(jì)上，用于矩陣乘法的晶體管數(shù)量甚至沒有占到10%。不過Etched對于英偉達(dá)的設(shè)計(jì)還是相當(dāng)佩服的，指出如果同時(shí)想支持CNN、LSTM、SSM等其他模型，確實(shí)很難做得比英偉達(dá)更好。

當(dāng)然了，這里的測試條件也必須做一個(gè)說明，測試標(biāo)準(zhǔn)為FP8精度的Llama 70B，無稀疏，其中H100是基于最新版本的TensorRT-LLM測試的，而B200由于還未交付，所以其性能是預(yù)估的。

為何專攻Transformer模型

市面上的AI芯片和GPU產(chǎn)品為了覆蓋更靈活的客戶需求，盡管不少都采用了ASIC的設(shè)計(jì)方案，但支持的模型卻不會(huì)局限在一類。Etched也在其官網(wǎng)列出了市面上一些競品方案，包括英偉達(dá)的GPU、谷歌的TPU、亞馬遜的Trainium、Graphcore的IPU、Tenstorrent的Grayskull和英特爾的Gaudi等等，這些方案無一不對廣泛的AI模型提供了支持。

但我們從市面上頭部的模型來看，幾乎占據(jù)主導(dǎo)地位的都是transformer架構(gòu)的模型，比如GPT、Sora、Gemini和Stable Diffusion。Etched很大方地表示，如果哪一天transformer被SSM、RWKV或其他新的架構(gòu)替代了，他們的芯片將變得一無是處，對于千變?nèi)f化的AI市場而言，絕大多數(shù)廠商都不敢沒法做出這樣的預(yù)測。

而Etched從2022年底，就賭transformer模型將會(huì)統(tǒng)治整個(gè)市場。這在當(dāng)時(shí)還沒有ChatGPT的年代，是一個(gè)大膽的預(yù)測，畢竟當(dāng)時(shí)圖像生成還有基于CNN的U-Net，不少自動(dòng)駕駛的視覺處理也還在廣泛使用CNN。而且對于一個(gè)規(guī)模不算大的設(shè)計(jì)團(tuán)隊(duì)而言，維護(hù)單一架構(gòu)的軟件棧明顯壓力更小一些，他們只需要為transformer編寫驅(qū)動(dòng)、內(nèi)核即可。

寫在最后

至于Etched的這場豪賭是否能成功，還得看芯片的成品表現(xiàn)如何。雖然他們嘗試的這條路線沒人走過，但財(cái)力和研發(fā)能力均在他們之上的廠商也沒能打造出超過英偉達(dá)GPU的競品，硅谷的VC們能否造出新神，依然不能過早下定論。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

Transformer

Transformer

+關(guān)注

關(guān)注
0

文章
153

瀏覽量
6771
AI芯片

AI芯片

+關(guān)注

關(guān)注
17

文章
2042

瀏覽量
36474

亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

搜索歷史

只能跑Transformer的AI芯片，卻號稱全球最快？

評論

搜索歷史

只能跑Transformer的AI芯片，卻號稱全球最快？

評論

只能跑Transformer的AI芯片，卻號稱全球最快？