亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

杭州靈汐類(lèi)腦智算集群實(shí)現(xiàn)大模型快速推理

北京靈汐科技有限公司 ? 來(lái)源:腦啟社區(qū) ? 2025-08-18 16:06 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來(lái)源于腦啟社區(qū),作者腦啟社區(qū)

據(jù)悉,“杭州靈汐類(lèi)腦智算集群”已于7月底實(shí)現(xiàn)了大模型快速推理API的企業(yè)服務(wù)試運(yùn)行。該集群由杭州靈汐類(lèi)腦科技有限公司牽頭搭建運(yùn)營(yíng),中國(guó)電信、中國(guó)電子科技南湖研究院以及腦啟社區(qū)作為合作方參與,由杭州電信具體承擔(dān)集成建設(shè)。該集群部署在中國(guó)電信杭州智算中心,算力規(guī)模超200POPS。這也是類(lèi)腦智算集群在全球范圍內(nèi),首次以支持大模型快速推理的方式,走向商用試運(yùn)行。

作為類(lèi)腦智能技術(shù)的創(chuàng)新應(yīng)用成果,該智算集群具有”存算一體、眾核并行、稀疏計(jì)算、事件驅(qū)動(dòng)”的特性,可顯著提升計(jì)算效率、大幅降低能耗,實(shí)現(xiàn)大語(yǔ)言模型推理的“一快、一低、一降”:一是推理速度快,單用戶(hù)的推理延遲控制在毫秒級(jí)別,速度性能相對(duì)于傳統(tǒng)方案有明顯優(yōu)勢(shì)(可流暢響應(yīng)實(shí)時(shí)交互及長(zhǎng)本文深度推理),告別卡頓;二是首token延遲低,可降至百毫秒乃至十毫秒級(jí);三是智算集群的功耗大幅下降,較業(yè)界同等推理算力水平可降低功耗二分之一至三分之二以上。異構(gòu)融合類(lèi)腦芯片具有兼容PyTorch框架的類(lèi)CUDA軟件棧,可直接服務(wù)于多類(lèi)開(kāi)源大模型的快速推理、而不需要轉(zhuǎn)換類(lèi)腦算法。

當(dāng)前,大模型推理普遍存在吞吐速度慢(每秒十到幾十詞輸出)和高延遲問(wèn)題(常常超過(guò)1秒甚至數(shù)秒),對(duì)眾多行業(yè)場(chǎng)景構(gòu)成了制約。在此背景下,靈汐科技基于類(lèi)腦智能技術(shù)給出了“高實(shí)時(shí)、高吞吐、低延遲”的推理服務(wù)解決方案,將在金融應(yīng)用、情感陪聊、快速導(dǎo)覽、大規(guī)模數(shù)據(jù)標(biāo)注以及無(wú)人機(jī)實(shí)時(shí)航拍處理、災(zāi)害預(yù)警與應(yīng)急處置等領(lǐng)域場(chǎng)景逐步落地。據(jù)介紹,該智算集群(中心)將持續(xù)升級(jí),新一代類(lèi)腦智算高密度計(jì)算平臺(tái)也將在近期正式發(fā)布推出,集群能效比預(yù)計(jì)將進(jìn)一步提升。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 集群
    +關(guān)注

    關(guān)注

    0

    文章

    129

    瀏覽量

    17579
  • 靈汐科技
    +關(guān)注

    關(guān)注

    0

    文章

    17

    瀏覽量

    1434
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3387

    瀏覽量

    4855

原文標(biāo)題:首次商用試運(yùn)行,類(lèi)腦智算集群支持大模型快速推理服務(wù)

文章出處:【微信號(hào):北京靈汐科技有限公司,微信公眾號(hào):北京靈汐科技有限公司】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+神經(jīng)形態(tài)計(jì)算、類(lèi)芯片

    。是實(shí)現(xiàn)類(lèi)芯片的基本模型。SNN中的神經(jīng)元通過(guò)短的電脈沖相互溝通,脈沖之間的時(shí)間間隔起著重要作用。 最有利于硬件實(shí)現(xiàn)的脈沖神經(jīng)元
    發(fā)表于 09-17 16:43

    啟社區(qū)第二屆類(lèi)智能創(chuàng)新大賽正式啟動(dòng)

    機(jī)智能全國(guó)重點(diǎn)實(shí)驗(yàn)室、北京科技、中國(guó)電信杭州中心協(xié)辦。旨在挖掘類(lèi)剛需應(yīng)用,形成一批可規(guī)
    的頭像 發(fā)表于 08-18 16:11 ?850次閱讀

    科技與廣電五舟達(dá)成戰(zhàn)略合作

    2025年8月15日,北京科技有限公司與廣州廣電五舟科技股份有限公司經(jīng)友好協(xié)商,現(xiàn)已達(dá)成戰(zhàn)略合作協(xié)議。雙方結(jié)合各自?xún)?yōu)勢(shì),進(jìn)一步聚焦國(guó)產(chǎn)力底座構(gòu)建、行業(yè)解決方案優(yōu)化,在類(lèi)
    的頭像 發(fā)表于 08-18 16:05 ?721次閱讀

    科技斬獲第三屆“華彩杯”力大賽東區(qū)決賽二等獎(jiǎng)

    2025年7月10-11日,第三屆“華彩杯”力大賽東區(qū)決賽專(zhuān)題賽暨頒獎(jiǎng)典禮在杭州舉行?!?b class='flag-5'>靈科技類(lèi)
    的頭像 發(fā)表于 08-04 14:45 ?1027次閱讀

    科技上線(xiàn)赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型

    模型輕量化部署方案。用戶(hù)通過(guò)遠(yuǎn)程力平臺(tái)預(yù)置的模型鏡像與AI工具,僅需50%的GPU力即可解鎖大模型
    的頭像 發(fā)表于 07-30 21:44 ?604次閱讀

    一文看懂AI集群

    最近這幾年,AI浪潮席卷全球,成為整個(gè)社會(huì)的關(guān)注焦點(diǎn)。大家在討論AI的時(shí)候,經(jīng)常會(huì)提到AI集群。AI的三要素,是力、算法和數(shù)據(jù)。而AI集群
    的頭像 發(fā)表于 07-23 12:18 ?680次閱讀
    一文看懂AI<b class='flag-5'>算</b>力<b class='flag-5'>集群</b>

    模型推理顯存和計(jì)算量估計(jì)方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個(gè)領(lǐng)域得到了廣泛應(yīng)用。然而,大模型推理過(guò)程對(duì)顯存和計(jì)算資源的需求較高,給實(shí)際應(yīng)用帶來(lái)了挑戰(zhàn)。為了解決這一問(wèn)題,本文將探討大模型
    發(fā)表于 07-03 19:43

    億鑄科技入圍工信部力強(qiáng)基揭榜行動(dòng)

    、網(wǎng)絡(luò)、計(jì)算的協(xié)同優(yōu)化,旨在通過(guò)模型加速與調(diào)度加速等創(chuàng)新方法,實(shí)現(xiàn)大規(guī)模異構(gòu)集群在大模型推理
    的頭像 發(fā)表于 06-30 14:57 ?773次閱讀

    DeepSeek推動(dòng)AI力需求:800G光模塊的關(guān)鍵作用

    限制力提升的瓶頸。800G光模塊通過(guò)更高的傳輸速率,能夠支持大規(guī)模GPU集群間的數(shù)據(jù)傳輸,保證各節(jié)點(diǎn)之間的快速互聯(lián)和低延遲通信,從而提升整個(gè)系統(tǒng)的計(jì)算效率與吞吐量。對(duì)于DeepSeek等超大
    發(fā)表于 03-25 12:00

    YOLOv5類(lèi)中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎?一致會(huì)達(dá)到更好的效果?

    YOLOv5類(lèi)中rgb888p_size這個(gè)參數(shù)要與模型推理和訓(xùn)練的尺寸一致嗎,一致會(huì)達(dá)到更好的效果
    發(fā)表于 03-11 08:12

    科技開(kāi)源類(lèi)深度學(xué)習(xí)應(yīng)用開(kāi)發(fā)平臺(tái)BIDL

    富案例等問(wèn)題,一直制約著其廣泛應(yīng)用。為了突破這一瓶頸,科技聯(lián)合啟社區(qū)正式宣布開(kāi)源類(lèi)深度學(xué)習(xí)應(yīng)用開(kāi)發(fā)平臺(tái)BIDL(Brain-insp
    的頭像 發(fā)表于 03-05 09:13 ?1340次閱讀
    <b class='flag-5'>靈</b><b class='flag-5'>汐</b>科技開(kāi)源<b class='flag-5'>類(lèi)</b><b class='flag-5'>腦</b>深度學(xué)習(xí)應(yīng)用開(kāi)發(fā)平臺(tái)BIDL

    浪潮信息發(fā)布元R1推理服務(wù)器

    近日,浪潮信息正式推出了其創(chuàng)新的元R1推理服務(wù)器。這款服務(wù)器通過(guò)系統(tǒng)的創(chuàng)新與軟硬件的協(xié)同優(yōu)化,實(shí)現(xiàn)了對(duì)DeepSeek R1 671B模型的單機(jī)部署與運(yùn)行,為客戶(hù)在智能應(yīng)用部署方面帶
    的頭像 發(fā)表于 02-17 10:32 ?959次閱讀

    KA200芯片完成DeepSeek-R1系列模型適配

    節(jié)后開(kāi)工第一天,科技團(tuán)隊(duì)聯(lián)合類(lèi)技術(shù)社區(qū)(“啟社區(qū)“)的開(kāi)發(fā)者,僅用半天時(shí)間就完成了DeepSeek-R1系列
    的頭像 發(fā)表于 02-06 15:40 ?1796次閱讀

    SynSense時(shí)識(shí)科技亮相CES,展現(xiàn)類(lèi)智能“芯”實(shí)力

    了一系列前沿的芯片產(chǎn)品,包括類(lèi)感存一體動(dòng)態(tài)視覺(jué)智能SoC Speck?系列、類(lèi)感知DVS事件相機(jī)系列以及
    的頭像 發(fā)表于 01-13 15:37 ?902次閱讀

    杭州伴科技推動(dòng)AR+AI產(chǎn)業(yè)新格局

    2024年12月4日,由“力小鎮(zhèn)杯”Create@力應(yīng)用創(chuàng)新大賽在杭州成功舉辦。以“大力時(shí)代下的AI應(yīng)用挑戰(zhàn)”為主題的圓桌對(duì)話(huà),更是匯聚了多位AI領(lǐng)域領(lǐng)軍人物,共同探討AI技術(shù)商
    的頭像 發(fā)表于 12-06 09:33 ?2044次閱讀