• <tr id="iu0wb"></tr>
    <pre id="iu0wb"></pre>
    1. <tfoot id="iu0wb"><span id="iu0wb"></span></tfoot>
            1. 青草内射中出高潮,国产在线一区二区在线视频,亚洲伊人天堂,日本爽爽爽爽爽爽在线观看免,亚洲av午夜福利大精品,在线国产三级,久久国产精品久久久久久,av亚洲在线一区二区
              歡迎訪問深圳市中小企業公共服務平臺電子信息窗口

              融資30億后,曦望發布新一代推理GPU芯片啟望S3

              2026-01-28 來源:電子工程專輯
              1255

              關鍵詞: 曦望 啟望S3芯片 推理GPU

              隨著大模型進入規?;瘧秒A段,AI產業正從“訓練驅動”轉向“推理驅動”。相比一次性投入巨大的訓練,推理更強調長期交付能力、單位成本和系統穩定性。誰能持續降低推理成本,誰就掌握了AI產業的成本曲線。

              1月27日,國產GPU廠商曦望(Sunrise)在杭州舉辦了首屆Sunrise GPU Summit,正式發布了新一代推理GPU芯片——啟望S3。截至2025年,曦望芯片的交付量已突破萬片,標志著其"All-in推理"戰略完成從工程驗證到規模化交付的關鍵跨越。

              在發布會前不久,曦望宣布完成近30億元的戰略融資,投資方陣容豪華,涵蓋了產業投資方、知名VC/PE機構以及國資背景資本。具體投資方包括三一集團旗下華胥基金、范式智能、杭州數據集團、正大機器人、協鑫科技等產業投資方,IDG資本、高榕創投、無極資本、中金資本、普華資本、松禾資本、易方達資本、工銀投資、心資本等知名VC/PE機構,以及誠通混改基金等國資背景資本。這筆資金將主要用于下一代推理GPU的研發、規?;慨a及生態共建。

              啟望S3發布,推理算力性能躍升

              曦望成立于2020年,前身為商湯科技大芯片部門。團隊規模約300人,成員主要來自NVIDIA、AMD、昆侖芯、商湯等企業,核心技術骨干平均擁有15年行業經驗。聯席CEO王勇為前AMD、昆侖芯核心架構師,擁有20年芯片研發經驗;另一位聯席CEO王湛為百度創始團隊成員、原集團副總裁,曾帶領8000人團隊負責百度搜索業務,2025年初加入曦望負責產品化和商業化。

              與行業普遍沿用的"訓推一體GPU"路線不同,曦望本次選擇了一條差異化路徑——不追求峰值訓練性能,而是聚焦推理效率與單位成本。

              啟望S3是曦望面向大模型推理市場推出的定制化GPGPU芯片。據王勇介紹,該芯片圍繞真實推理負載,對芯片架構、存儲體系與互聯方式進行了系統級設計,旨在提供高效、低成本的推理算力解決方案。

              在算力與存儲設計上,啟望S3支持從FP16到FP4的精度自由切換,能夠在保證模型效果的前提下,顯著提升低精度推理效率。同時,該芯片率先在國內GPGPU產品中采用LPDDR6顯存方案,顯存容量較上一代提升4倍,有效緩解了大模型推理中常見的顯存瓶頸問題。

              性能方面,啟望S3在典型推理場景下的整體性價比較上一代產品提升超過10倍。在DeepSeek V3/R1滿血版等主流大模型推理場景中,單位Token推理成本較上一代降低約90%,實現了“百萬Token一分錢”的工程能力,為大模型推理的商業化應用提供了強有力的支持。

              全棧自研,構建推理算力生態

              公開信息顯示,曦望歷經數年研發投入累計20億元,已形成三代芯片產品矩陣:

              • 2020年量產的S1芯片,作為國內首款視覺推理芯片,適配千余種CV模型,已實現IP授權索尼、小米等頭部客戶;

              • 2024年量產的S2芯片,對標主流A/H系列GPU,兼容CUDA生態,已成功適配DeepSeek、Qwen等主流模型;

              • 2026年推出的S3芯片,定位為"推理性價比之王",在單位Token成本、能耗上實現數量級降低。

              曦望不僅在芯片硬件上進行了深度優化,還在軟件層面構建了與CUDA兼容的基礎軟件體系,覆蓋驅動、運行時API、開發工具鏈、算子庫和通信庫,支持推理應用低成本遷移與持續優化。目前,該體系已適配ModelScope平臺90%以上的主流大模型形態,降低了模型適配和系統部署的復雜度。

              此外,曦望還同步發布了面向大模型推理的寰望SC3-256超節點方案。該方案可高效支撐PD分離架構與大規模專家并行(EP)部署,適配千億、萬億級參數的多模態MoE推理場景。

              在交付形態上,寰望SC3采用全液冷設計,具備極致PUE表現,并支持模塊化交付與快速部署。在同等推理能力量級下,該方案的整體系統交付成本從行業常見的億元級降低至千萬元級,實現了一個數量級的下降。

              推理云計劃,重構算力交付方式

              除了硬件和軟件的創新外,曦望還推出了共建推理云計劃。該計劃依托自研推理GPU,通過GPU池化與彈性調度,將分散的算力資源整合為統一的推理算力池,并以MaaS(Model as a Service)作為核心入口,向企業提供開箱即用的大模型推理服務。

              據曦望聯席CEO王湛介紹,共建推理云在千卡級集群場景下可用性達到99.95%,橫向擴展效率超過95%。這一計劃不僅解決了推理算力在實際落地中普遍存在的資源碎片化、運維復雜、成本不可預測等挑戰,還通過云化方式對算力交付模式進行了重構,使推理算力從“設備能力”轉化為可標準化、可規?;姆漳芰Α?/span>

              生態協同,推動推理算力商業化

              隨著推理算力競爭從單點技術走向系統工程能力比拼,產業協同的重要性日益凸顯。曦望在發布會上與浙江大學簽署了戰略合作協議,聯合成立“智能計算聯合研發中心”,圍繞光互連GPU超節點架構、半導體虛擬制造(計算光刻)以及AI高精度氣象預測等前沿方向展開協同研究。

              此外,曦望還與中交信科集團、杭鋼數字科技、浙江算力科技、三一集團、協鑫科技等企業達成了戰略合作,共同推動推理算力在交通、制造、醫療等行業的落地應用。曦望董事長徐冰表示,曦望并不希望只做一家賣芯片的公司,而是圍繞推理場景構建“芯片+系統+生態”的整體布局,讓推理算力真正成為可規?;?、可持續的基礎設施。




              主站蜘蛛池模板: 日本青青草在线| 国产首页一区二区不卡| 超碰人人摸| 在线v片免费观看视频| 亲爱的老师6免费观看全集电视剧| 蜜芽亚洲AV无码精品国产午夜| 国产69精品久久久久99尤物| 亚洲国产精品久久久天堂麻豆宅男| 亚洲交性网| 国产高清精品软件丝瓜软件| 国产成人AV男人的天堂| 久久精品国产无限资源| 77777熟女视频在线观看| 精品国产午夜福利伦理片| 丁香五月综合| 日本欧美大码a在线观看| ww欧美| 欧美性爱视频网| 久久精品国产久精国产果冻传媒| 国产xxxx做受性欧美88| yw尤物av无码国产在线观看| 无码中文字幕免费一区二区三区 | 曰韩一级| 美国特级A毛片免费网站| 国产乱色熟女一二三四区| 夜色爽爽影院18禁妓女影院| 日韩av激情在线| 久久国产乱子伦免费精品无码| AV天堂午夜精品一区二区三区| 国产精品无码Av在线播放小说| 不卡av一区二区| 日韩日韩日韩日韩日韩| 欧美 日韩 国产 成人 在线观看| 欧洲精品码一区二区三区免费看 | www.狠狠干| 亚洲av综合一区二区| 久久久久综合网久久| 无码一区二区三区亚洲人妻| 一本色道久久东京热| 国语字幕av| 人妻制服丝袜中文字幕|