亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

富士通使用富岳超級計算機訓練LLM

冬至配餃子 ? 來源:網(wǎng)絡整理 ? 作者:網(wǎng)絡整理 ? 2024-05-13 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

盡管富士通的富岳超級計算機不再是超級計算機500強名單中最快的機器,但它仍然是一個非常強大的系統(tǒng),A64FX處理器的多功能性允許將其用于各種工作負載,例如AI。本周,富士通發(fā)布了Fugaku-LLM,這是一個具有高級日語處理能力的大型語言模型,專為研究和商業(yè)應用而設計。

富士通的Fugaku-LLM在富岳超級計算機的13,824個節(jié)點上使用3800億個符記進行訓練,該超級計算機基于A64FX處理器,支持FP64、FP32、FP16和INT8模式,適用于各種AI和傳統(tǒng)超級計算機應用。Fugaku-LLM的訓練利用了針對超級計算機架構和互連優(yōu)化的分布式并行學習技術。

Fugaku-LLM 有 130 億個參數(shù),與 GPT-4 的 1750 億個參數(shù)相比顯得蒼白無力,不過,F(xiàn)ugaku-LLM是日本有史以來訓練量的最大 LLM。富士通表示,其130億參數(shù)的LLM不需要大量的計算資源來推理,這對日本的企業(yè)和研究人員來說是最佳選擇。大約 60% 的訓練數(shù)據(jù)是日語,40% 的數(shù)據(jù)是英語、數(shù)學和代碼數(shù)據(jù)。

這種廣泛的以日語為中心的訓練使其有別于其它主要在英語數(shù)據(jù)集上訓練的日語模型。因此,F(xiàn)ugaku-LLM擁有卓越的日語水平,在日語MT-Bench上獲得了5.5的平均分,這是使用日本原始數(shù)據(jù)訓練的公開可用模型中的最高分。根據(jù)富士通的數(shù)據(jù),它在人文和社會科學方面尤其出色,取得了令人印象深刻的 9.18 分的基準分數(shù)。

Fugaku-LLM計劃是由東京工業(yè)大學、東北大學、富士通株式會社、RIKEN、名古屋大學、CyberAgent和Kotoba Technologies等日本領先機構之間的合作推動的。他們合作的原因之一是通常用于訓練和推理 AI 模型的 GPU 短缺。另一個原因是,該模型可以與富士通的下一代 150 核 Monaka 數(shù)據(jù)中心 CPU 一起使用,該 CPU 針對 AI 和 HPC 工作負載進行了優(yōu)化。

Fugaku-LLM現(xiàn)在可以在GitHub和Hugging Face的指定許可條款下用于學術和商業(yè)目的(盡管富士通沒有提供任何鏈接)。此外,它從2024年5月10日起通過富士通研究門戶網(wǎng)站提供。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20113

    瀏覽量

    244495
  • 超級計算機
    +關注

    關注

    2

    文章

    478

    瀏覽量

    43053
  • 富士通
    +關注

    關注

    2

    文章

    207

    瀏覽量

    55755
  • LLM
    LLM
    +關注

    關注

    1

    文章

    340

    瀏覽量

    1223
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    奧士康召開DGX Spark AI超級計算機項目表彰大會

    2025年9月22日,奧士康科技股份有限公司隆重召開DGXSparkAI超級計算機項目表彰大會,以表彰在客戶開發(fā)、產(chǎn)品研發(fā)、工程設計和批量生產(chǎn)等方面作出突出貢獻的核心團隊。
    的頭像 發(fā)表于 09-24 10:51 ?475次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 算力達到了 21 ExaFLOPS,不僅是英國最快的系統(tǒng),同時也是全球能效最高的系統(tǒng)之一。
    的頭像 發(fā)表于 07-28 15:07 ?749次閱讀

    富士通發(fā)布2025年技術與服務愿景

    富士通株式會社發(fā)布了《Technology and Service Vision 2025(富士通技術與服務愿景2025)》,對商業(yè)與社會的未來愿景進行了總結與展望。借助人機智能協(xié)作驅(qū)動的跨行業(yè)
    的頭像 發(fā)表于 06-28 10:15 ?959次閱讀

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學發(fā)展

    現(xiàn)代高性能計算不僅使得更快的計算成為可能,它正驅(qū)動著 AI 系統(tǒng)解鎖更多領域的科學突破。 高性能計算經(jīng)歷了多次迭代,每一次都源于對技術的創(chuàng)造性再利用。例如,早期的超級
    的頭像 發(fā)表于 06-26 19:39 ?852次閱讀
    NVIDIA驅(qū)動的現(xiàn)代<b class='flag-5'>超級</b><b class='flag-5'>計算機</b>如何突破速度極限并推動科學發(fā)展

    Blue Lion超級計算機將在NVIDIA Vera Rubin上運行

    德國萊布尼茨超算中心(LRZ)將迎來全新超級計算機 Blue Lion,其算力比該中心現(xiàn)有的 SuperMUC-NG 高性能計算機提升了約 30 倍。這臺新的超級
    的頭像 發(fā)表于 06-12 15:39 ?734次閱讀

    NVIDIA技術賦能歐洲最快超級計算機JUPITER

    NVIDIA 宣布,搭載 NVIDIA Grace Hopper 平臺的 JUPITER 超級計算機成為歐洲最快超級計算機,其運行 HPC 和 AI 工作負載的速度是第二名的兩倍以上。
    的頭像 發(fā)表于 06-12 15:33 ?921次閱讀

    NVIDIA助力全球最大量子研究超級計算機

    NVIDIA 宣布將開設量子-AI 技術商業(yè)應用全球研發(fā)中心(G-QuAT),該中心部署了全球最大量子計算研究專用超級計算機 ABCI-Q。
    的頭像 發(fā)表于 05-22 09:44 ?573次閱讀

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?440次閱讀
       NVIDIA 宣布推出 DGX Spark 個人 AI <b class='flag-5'>計算機</b>

    NVIDIA推出個人AI超級計算機Project DIGITS

    NVIDIA 推出個人 AI 超級計算機 NVIDIA Project DIGITS,全球的 AI 研究員、數(shù)據(jù)科學家和學生都可獲取 NVIDIA Grace Blackwell 平臺的強大功能。
    的頭像 發(fā)表于 01-08 11:03 ?1078次閱讀

    云端超級計算機使用教程

    云端超級計算機是一種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在一起,通過網(wǎng)絡向用戶提供按需的
    的頭像 發(fā)表于 12-17 10:19 ?765次閱讀

    富士通綜合報告(Fujitsu Integrated Report 2024)》帶你全面了解富士通

    ? 今年10月,富士通發(fā)布了 《富士通綜合報告(Fujitsu Integrated Report 2024)》 。這份報告詳細介紹了有關富士通的業(yè)務經(jīng)營情況,以及創(chuàng)新的價值創(chuàng)造舉措,旨在與所有
    的頭像 發(fā)表于 12-11 17:31 ?1692次閱讀
    《<b class='flag-5'>富士通</b>綜合報告(Fujitsu Integrated Report 2024)》帶你全面了解<b class='flag-5'>富士通</b>

    工業(yè)中使用哪種計算機?

    在工業(yè)環(huán)境中,工控機被廣泛使用。這些計算機的設計可承受極端溫度、灰塵和振動等惡劣條件。它們比標準消費類計算機更耐用、更可靠。工業(yè)計算機可控制機器、監(jiān)控流程并實時收集數(shù)據(jù)。其堅固的結構和專業(yè)功能
    的頭像 發(fā)表于 11-29 14:07 ?945次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計算機</b>?

    量子計算機與普通計算機工作原理的區(qū)別

    超越世界上最強大的超級計算機,完成以前不可想象的任務!這意味著量子計算機可能會徹底改變我們的生活。 在本文中,我們將先了解普通計算機的工作原理,再深入探討量子
    的頭像 發(fā)表于 11-24 11:00 ?2332次閱讀
    量子<b class='flag-5'>計算機</b>與普通<b class='flag-5'>計算機</b>工作原理的區(qū)別

    如何訓練自己的LLM模型

    訓練自己的大型語言模型(LLM)是一個復雜且資源密集的過程,涉及到大量的數(shù)據(jù)、計算資源和專業(yè)知識。以下是訓練LLM模型的一般步驟,以及一些關
    的頭像 發(fā)表于 11-08 09:30 ?1903次閱讀

    使用LLM進行自然語言處理的優(yōu)缺點

    自然語言處理(NLP)是人工智能和語言學領域的一個分支,它致力于使計算機能夠理解、解釋和生成人類語言。大型語言模型(LLM)是NLP領域的一項重要技術,它們通過深度學習和大量的數(shù)據(jù)訓練,能夠執(zhí)行各種
    的頭像 發(fā)表于 11-08 09:27 ?3496次閱讀