亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展

沐曦MetaX ? 來源:沐曦MetaX ? 2023-06-20 10:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2023年6月17日,由紹興市人民政府主辦的 2023 中國(guó)(紹興)集成電路產(chǎn)業(yè)峰會(huì)隆重舉行,“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇及集成電路項(xiàng)目路演也同期舉行,為百余位產(chǎn)業(yè)從業(yè)者提供深入了解行業(yè)發(fā)展動(dòng)態(tài)和交流合作的機(jī)會(huì)。沐曦首席解決方案架構(gòu)師付軒受邀參會(huì)并發(fā)表演講。

付軒在“ChatGPT風(fēng)向下的集成電路新趨勢(shì)”論壇中發(fā)表主題為《蹄急而步穩(wěn):ChatGPT與高性能GPU戰(zhàn)略概覽》的主題演講,分析了ChatGPT的應(yīng)用特點(diǎn)及軟硬件需求,指出以ChatGPT為代表的大模型發(fā)展需要大的通用算力與矩陣算力作為支撐,并且作為基于GPU生態(tài)發(fā)展起來的模型,對(duì)GPU顯存、GPU間互聯(lián)通信、通用GPU編程框架及軟件生態(tài)等多方面均有很高的要求。因此,作為算力底座的GPU不僅需要算得快,還要算得準(zhǔn)、算得穩(wěn),不僅要提供高效計(jì)算,還要保證結(jié)果準(zhǔn)確,并且靈活可靠。

對(duì)此,可以采取以下策略:首先,針對(duì)ChatGPT大模型訓(xùn)練,大集群3D并行是一種有效方式,能夠集張量并行、流水并行和數(shù)據(jù)并行為一體,與只有數(shù)據(jù)并行的小模型相比,是一種完全不同的復(fù)雜并行結(jié)構(gòu)。在大模型推理方面,推理精度要求高,延遲容忍度高,帶來越來越多的云端高算力推理需求,更適合在數(shù)據(jù)中心中運(yùn)行,也符合“東數(shù)西算”的戰(zhàn)略規(guī)劃。同時(shí),基于高性能GPU生態(tài)的算法創(chuàng)新實(shí)現(xiàn)算子提速并極大減少顯存消耗,通用算力與矩陣算力的高效協(xié)作實(shí)現(xiàn)算子融合加速,穩(wěn)定可靠的千卡大集群、GPU軟硬件結(jié)合、“訓(xùn)推一體”優(yōu)化保障訓(xùn)練和推理的精度,均是能夠使大模型計(jì)算實(shí)現(xiàn)快、準(zhǔn)、穩(wěn)的可行性措施。

沐曦作為一家提供全棧GPU芯片及解決方案的企業(yè),其旗艦產(chǎn)品曦云C500系列通用GPU采用沐曦自研IP,能夠提供強(qiáng)大的多精度混合算力,同時(shí)配以大容量存儲(chǔ)和新一代高速IO接口及多卡互聯(lián)技術(shù),不論在矩陣算力、通用算力還是顯存規(guī)格方面均可全面支持大模型推理和訓(xùn)練,并廣泛應(yīng)用于人工智能、數(shù)據(jù)中心以及教育和科研等多種場(chǎng)景。同時(shí),沐曦自主研發(fā)的MXMACA軟件棧能夠全面兼容主流GPU生態(tài),為客戶提供軟硬件一體的應(yīng)用解決方案。目前,曦云MXC500芯片已于2023年6月13日成功回片點(diǎn)亮,預(yù)計(jì)將于今年年底實(shí)現(xiàn)量產(chǎn)。

總的來說,ChatGPT對(duì)于硬件和軟件均有需求,我們要更好地利用現(xiàn)有的GPU生態(tài),發(fā)揮通用算力與矩陣算力的全面優(yōu)勢(shì),做好算子的算法創(chuàng)新和加速。同時(shí),在做千卡大集群時(shí),單節(jié)點(diǎn)內(nèi)的多GPU互聯(lián)也是必須的。此外,當(dāng)前各種大模型創(chuàng)新層出不窮,我們要把各種各樣的大模型遷移到曦云C500上來,因此生態(tài)兼容也至關(guān)重要。做到以上幾點(diǎn),大模型就能夠更好地在國(guó)內(nèi)實(shí)現(xiàn)高效迭代與應(yīng)用落地。

關(guān)于沐曦

沐曦致力于為異構(gòu)計(jì)算提供安全可靠的GPU芯片及解決方案,打造全棧GPU芯片產(chǎn)品,推出MXN系列GPU(曦思)用于AI推理,MXC系列GPU(曦云)用于AI訓(xùn)練及通用計(jì)算,以及MXG系列GPU(曦彩)用于圖形渲染,滿足數(shù)據(jù)中心對(duì)“高能效”及“高通用性”的算力需求。沐曦產(chǎn)品均采用完全自主研發(fā)的GPU IP,擁有完全自主的指令集和架構(gòu),配以兼容主流GPU生態(tài)的完整軟件棧(MXMACA),具備高能效和高通用性的天然優(yōu)勢(shì),能夠?yàn)榭蛻魳?gòu)建軟硬件一體的全面生態(tài)解決方案,是“雙碳”背景下推動(dòng)數(shù)據(jù)中心建設(shè)和產(chǎn)業(yè)數(shù)字化、智能化轉(zhuǎn)型升級(jí)的算力基石。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集成電路
    +關(guān)注

    關(guān)注

    5443

    文章

    12354

    瀏覽量

    371895
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5065

    瀏覽量

    134095
  • ChatGPT
    +關(guān)注

    關(guān)注

    30

    文章

    1595

    瀏覽量

    9985

原文標(biāo)題:沐曦付軒:蹄急而步穩(wěn),GPU助力ChatGPT快、準(zhǔn)、穩(wěn)全面發(fā)展

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    股份與上海電信完成首期GPU生態(tài)專家認(rèn)證培訓(xùn)

    近期,集成電路(上海)股份有限公司(以下簡(jiǎn)稱“股份”)攜手上海電信天翼云能力運(yùn)營(yíng)中心(以下簡(jiǎn)稱“云能力運(yùn)營(yíng)中心”)順利完成了首期GPU
    的頭像 發(fā)表于 10-31 10:33 ?144次閱讀

    強(qiáng)強(qiáng)聯(lián)合:之江實(shí)驗(yàn)室與股份共建智算集群聯(lián)合實(shí)驗(yàn)室

    2025年10月22日, 之江實(shí)驗(yàn)室與集成電路(上海)股份有限公司(以下簡(jiǎn)稱“股份”)正式簽署合作協(xié)議,共同組建“智算集群聯(lián)合實(shí)驗(yàn)室”,攜手推進(jìn)人工智能算力基礎(chǔ)設(shè)施創(chuàng)新
    的頭像 發(fā)表于 10-23 10:50 ?816次閱讀

    首款全國(guó)產(chǎn)通用GPU芯片發(fā)布 集成推出云C600

    集成電路(南京)有限公司近日正式發(fā)布了首款全國(guó)產(chǎn)通用GPU——云C600,這標(biāo)志著國(guó)產(chǎn)高性能GPU實(shí)現(xiàn)歷史性突破。 據(jù)新華日?qǐng)?bào)報(bào)道顯示
    的頭像 發(fā)表于 10-19 20:04 ?2.3w次閱讀

    GPU與龍蜥操作系統(tǒng)完成適配

    集成電路(上海)股份有限公司(以下簡(jiǎn)稱"")于 2020 年 9 月成立于上海,其擁有技術(shù)完備、設(shè)計(jì)和產(chǎn)業(yè)化經(jīng)驗(yàn)豐富的團(tuán)隊(duì),曾主導(dǎo)過十多款世界主流高性能
    的頭像 發(fā)表于 10-17 15:06 ?593次閱讀

    云C系列產(chǎn)品已支持TileLang

    近日,DeepSeek宣布在其新版本中擁抱國(guó)產(chǎn)GPU語言TileLang,引發(fā)業(yè)界廣泛關(guān)注。作為國(guó)產(chǎn)高性能GPU的代表,云C系列產(chǎn)品已
    的頭像 發(fā)表于 10-14 09:25 ?339次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C系列產(chǎn)品已支持TileLang

    書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng)MeetUP精彩回顧

    近日,由書生大模型社區(qū)、、魔樂社區(qū)、算豐和 DaoCloud 道客等聯(lián)合打造的「書生大模型實(shí)戰(zhàn)營(yíng)魔樂專場(chǎng) MeetUP 暨頒獎(jiǎng)儀式」在上海漕河涇國(guó)際孵化中心圓滿落幕。
    的頭像 發(fā)表于 08-20 11:33 ?757次閱讀

    液冷算力新標(biāo)桿!科華數(shù)據(jù)聯(lián)合股份在世界人工智能大會(huì)首發(fā)高密度液冷算力POD

    ,科華數(shù)據(jù)與股份聯(lián)合推出的高密度液冷算力POD首次亮相,吸引了大量參會(huì)者駐足交流。該產(chǎn)品是科華數(shù)據(jù)專為高性能GPU服務(wù)器集群自主研發(fā)
    的頭像 發(fā)表于 07-29 15:57 ?569次閱讀
    液冷算力新標(biāo)桿!科華數(shù)據(jù)聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>股份在世界人工智能大會(huì)首發(fā)高密度液冷算力POD

    亮相2025世界人工智能大會(huì)

    近日,2025世界人工智能大會(huì)(WAIC)核心分論壇在上海世博中心盛大啟幕。集成電路(上海)股份有限公司(以下簡(jiǎn)稱“”)以“芯聚算力開芯局,源引AI共未來”為主題,聯(lián)合中國(guó)電
    的頭像 發(fā)表于 07-28 18:08 ?4305次閱讀

    硅基流動(dòng)攜手首發(fā)基于云的Kimi K2推理服務(wù)

    天網(wǎng)絡(luò)”)運(yùn)營(yíng)的云C550 三千卡通用 GPU 國(guó)產(chǎn)集群。此次合作標(biāo)志著硅基流動(dòng)正式將該國(guó)產(chǎn)集群納入算力網(wǎng)絡(luò),進(jìn)一為大模型產(chǎn)業(yè)落地提
    的頭像 發(fā)表于 07-23 17:33 ?1446次閱讀

    PaddleScience完成與AI芯片適配

    當(dāng)前,PaddleScience已與展開深度合作,涵蓋智能仿真、高性能計(jì)算、科學(xué)建模等多個(gè)方向。這一趨勢(shì)正加速形成面向"Al for Science"的國(guó)產(chǎn)智算生態(tài)新格局。
    的頭像 發(fā)表于 05-06 14:49 ?1167次閱讀

    云C500通用計(jì)算GPU與百度飛槳完成Ⅱ級(jí)兼容性測(cè)試

    近日,云C500通用計(jì)算GPU與百度飛槳已完成Ⅱ級(jí)兼容性測(cè)試。測(cè)試結(jié)果顯示,雙方兼容性表現(xiàn)良好,整體運(yùn)行穩(wěn)定。這是
    的頭像 發(fā)表于 03-31 14:22 ?1342次閱讀

    加速DeepSeek滿血版單卡C500異構(gòu)推理

    近日,基于開源KTransformers架構(gòu)的 CPU/GPU 異構(gòu)推理能力,云C500單卡GPU上成功實(shí)現(xiàn)DeepSeek-R1-
    的頭像 發(fā)表于 03-20 15:52 ?1755次閱讀

    Gitee AI 聯(lián)合首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費(fèi)體驗(yàn)!

    、DeepSeek-R1-Distill-Qwen-14B、DeepSeek-R1-Distill-Qwen-32B四個(gè)較小尺寸的 DeepSeek 模型。值得關(guān)注的是, 本次上線的四個(gè)模型均部署在國(guó)產(chǎn)
    的頭像 發(fā)表于 02-10 09:56 ?1026次閱讀
    Gitee AI 聯(lián)合<b class='flag-5'>沐</b><b class='flag-5'>曦</b>首發(fā)全套 DeepSeek R1 千問蒸餾模型,全免費(fèi)體驗(yàn)!

    澎峰科技與完成聯(lián)合測(cè)試,實(shí)現(xiàn)全面兼容

    實(shí)現(xiàn)了全面兼容,為用戶提供了更為高效、穩(wěn)定的解決方案。 在測(cè)試過程中,澎峰科技與科技的技術(shù)團(tuán)隊(duì)緊密協(xié)作,對(duì)PerfXLM和PerfXCloud在云系列
    的頭像 發(fā)表于 01-21 15:20 ?912次閱讀

    澎峰科技計(jì)算軟件棧與GPU完成適配和互認(rèn)證

    ?近期,澎峰科技與完成了對(duì)PerfXLM(推理引擎)、PerfXCloud(大模型服務(wù)平臺(tái))與云系列通用計(jì)算
    的頭像 發(fā)表于 01-21 09:51 ?1080次閱讀