日韩少妇无删减的电影在线视频观看-久久久伊人中文字幕-91成人在线视频观看-欧美日韩一区二区三区四区五区-激情五月天网站视频-欧美另类丰满熟妇xx-999re这里只有国产精品-国产蜜臀福利久久久av-人妻中文字幕av精,国产成人精品在线观看视频,69精品人妻久久久久久久,欧美日韩日欧美日韩中

Nvidia發(fā)布下一代GPU架構(gòu) 芯粒技術(shù)成為新亮點(diǎn)

來源:半導(dǎo)體行業(yè)觀察

Nvidia不久前發(fā)布了下一代GPU架構(gòu),架構(gòu)名字為“Hopper”(為了紀(jì)念計(jì)算機(jī)科學(xué)領(lǐng)域的先驅(qū)之一Grace Hopper)。

根據(jù)Nvidia發(fā)布的具體GPU規(guī)格,我們認(rèn)為Nvidia對于Hopper的主要定位是進(jìn)一步加強(qiáng)對于人工智能方面的算力,而其算力升級依靠的不僅僅是硬件部分,還有不少算法和軟件協(xié)同設(shè)計(jì)部分,本文將為讀者做詳細(xì)分析。

我們認(rèn)為,在Nvidia更下一代的GPU中,我們有望看到芯粒技術(shù)成為新的亮點(diǎn)來突破其瓶頸。

Hopper的能有多強(qiáng)

根據(jù)Nvidia公布的數(shù)據(jù),基于Hopper架構(gòu)的GPU(H100)使用TSMC的4nm工藝設(shè)計(jì),將會(huì)是Ampere架構(gòu)(使用TSMC 7nm工藝)之后的又一次重大升級,其16位浮點(diǎn)數(shù)峰值算力(FP16)將會(huì)由之前的312 TFLOPS增加到1000 TFLOPS,INT8峰值算力則由之前的624TOPS增加到2000TOPS。

由此可見FP16(常用于人工智能訓(xùn)練)和INT8(常用于人工智能推理)的峰值算力基本上都是翻了三倍,這個(gè)H100相對A100峰值算力提升的比例基本符合A100和再上一代GPU V100的提升數(shù)字。

而根據(jù)Nvidia官方公布的具體任務(wù)能提升,我們也可以看到大多數(shù)人工智能相關(guān)任務(wù)的能提升基本在2-4倍之間(尤其是使用transformer類模型的能提升較為突出,接4倍),初看也和峰值算力提升三倍基本吻合。

但是如果我們仔細(xì)分析Nvidia H100具體芯片指標(biāo),我們認(rèn)為在人工智能任務(wù)中,H100的提升不僅僅是來自于一些硬件指標(biāo)(例如核心數(shù)量,DRAM帶寬,片上存儲(chǔ)器)的提升,更是來自于Nvidia做了算法硬件協(xié)同設(shè)計(jì)。

例如,Nvidia在Hopper架構(gòu)中引入了為Transformer系列模型專門設(shè)計(jì)的八位浮點(diǎn)數(shù)(FP8)計(jì)算支持,并且還加入了專門的Transformer engine硬件模塊來確保transformer模型的運(yùn)行效率。因此,我們看到在Nvidia公布的人工智能任務(wù)能提升中,使用transformer的任務(wù)(如GPT-3)的能提升要高于傳統(tǒng)的基于CNN(如Mask R-CNN)的能提升。

存儲(chǔ)方面提升相對較小

在人工智能等高能計(jì)算中,存儲(chǔ)(包括DRAM接口帶寬和片上存儲(chǔ)容量)和計(jì)算單元一樣重要,在很多時(shí)候存儲(chǔ)甚至?xí)蔀檎w能的瓶頸,例如峰值算力無法持續(xù),導(dǎo)致均計(jì)算能力遠(yuǎn)低于峰值算力。

在Hopper架構(gòu)中,我們看到了峰值算力提升大約是Ampere的三倍,然而在DRAM帶寬和片上存儲(chǔ)方面,Hopper相對于Ampere的提升較小,只有1.5倍和1.25倍。

在DRAM帶寬方面,我們看到H100有兩個(gè)版本,其中使用最新一代HBM3的版本的內(nèi)存帶寬是3TB/s,相比于A100(2TB/s)的提升為1.5倍,相比峰值算力的三倍提升相對較小。

反觀A100相對更上一代V100的內(nèi)存帶寬提升為2.2倍,因此我們認(rèn)為H100的HBM3內(nèi)存帶寬提升幅度確實(shí)相對上一代來說較小。我們認(rèn)為,HBM3帶寬提升較小可能和功耗有關(guān)。

仔細(xì)分析Hopper發(fā)布的GPU,我們發(fā)現(xiàn)Hopper架構(gòu)的GPU目前有兩個(gè)品類,一個(gè)是使用HBM3內(nèi)存的版本,而另一個(gè)是仍然使用HBM2e的版本。

HBM3版本的H100相對于使用HBM2e版本的H100在其他芯片架構(gòu)上(包括計(jì)算單元)的差距不過10%(HBM3版本的計(jì)算單元較多),但是在功耗(TDP)上面,HBM3版本的H100的TDP比HBM2e版本H100整整高出兩倍(700W vs. 350W)。即使是相對于上一代使用7nm的Ampere架構(gòu),其功耗也提高了兩倍,因此能效比方面提升并不多,或者說即使更先進(jìn)的芯片工藝也沒法解決HBM3的功耗問題。

因此,我們認(rèn)為H100 HBM3版本DRAM內(nèi)存帶寬增加可能是受限于整體功耗。而當(dāng)DRAM帶寬提升較小時(shí),如何確保DRAM帶寬不成為能瓶頸就是一個(gè)重要的問題,因此Nvidia會(huì)提出FP4和Transformer Engine等算法-硬件協(xié)同設(shè)計(jì)的解決方案,來確保在執(zhí)行下游任務(wù)的時(shí)候仍然效率不會(huì)受限。

除了DRAM帶寬之外,另一個(gè)值得注意的點(diǎn)是Hopper GPU的片上存儲(chǔ)增長僅僅是從A100的40MB增長到了H100的50MB;相對來說,A100的片上存儲(chǔ)相對于更上一代V100則是增加了6倍。

我們目前尚不清楚H100上片上存儲(chǔ)增長這么少的主要原因,究竟是因?yàn)镹vidia認(rèn)為40-50MB對于絕大部分任務(wù)已經(jīng)夠用,還是因?yàn)楣に嚵悸实脑驅(qū)е略偌覵RAM會(huì)大大提升成本。

但是,無論如何,隨著人工智能模型越來越復(fù)雜, 對于片上存儲(chǔ)的需求越來越高,片上存儲(chǔ)容量較小就會(huì)需要有更好的人工智能模型編譯器和底層軟件庫來確保模型執(zhí)行過程中能有最高的效率(例如,確保能把模型數(shù)據(jù)更好地劃分以盡量在片上存儲(chǔ)中執(zhí)行,而盡可能少地使用DRAM)。

Nvidia在這一點(diǎn)上確實(shí)已經(jīng)有了很深厚的積累,各種高能相關(guān)的軟件庫已經(jīng)有很好的成熟度。

我們估計(jì)Nvidia有強(qiáng)大的軟件生態(tài)作為后盾也是它有能力在設(shè)計(jì)中放較少片上存儲(chǔ)(以及較小的DRAM帶寬)的重要原因。

這一點(diǎn)結(jié)合之前Nvidia在Hopper引入的新模型-芯片結(jié)合設(shè)計(jì)技術(shù),例如能大大降低內(nèi)存需求的FP4技術(shù),以及為了Transformer模型專門設(shè)計(jì)的Transformer Engine,這些其實(shí)從正反兩面論證了我們的觀點(diǎn),即Hopper架構(gòu)很多的能提升事實(shí)上是來自于軟硬件結(jié)合設(shè)計(jì),而并非僅僅是芯片/硬件能提升。

Nvidia下一步突破點(diǎn)在哪里?

如前所述,Nvidia的Hopper架構(gòu)GPU的芯片領(lǐng)域的突破相比上一代Ampere架構(gòu)并沒有特別大,而是主要由軟硬件結(jié)合設(shè)計(jì)實(shí)現(xiàn)能提升。

我們看到在存儲(chǔ)領(lǐng)域(包括DRAM接口和片上存儲(chǔ)容量)的提升尤其小,而這可能也會(huì)是Nvidia進(jìn)一步提升GPU能的一個(gè)重要瓶頸,當(dāng)然突破了之后也會(huì)成為一個(gè)重要的技術(shù)壁壘。

如前所述,HBM3的功耗可能是一個(gè)尚未解決的問題,而如何在芯片上放入更多的片上存儲(chǔ)器則將會(huì)被良率和成本所限制。

在存儲(chǔ)成為瓶頸的時(shí)候,芯片粒(chiplet)將會(huì)成為突破瓶頸的重要技術(shù)。正如之前所討論的,當(dāng)片上存儲(chǔ)容量更大時(shí),GPU對于DRAM等片外存儲(chǔ)的需求就會(huì)越來越少,而片上存儲(chǔ)的瓶頸則是良率和成本。

一般來說,芯片的良率和其芯片面積成負(fù)相關(guān),當(dāng)芯片面積越大時(shí),則芯片良率會(huì)相應(yīng)下降,尤其是在先進(jìn)工藝中,良率更是一個(gè)重要考量。

而芯片粒則是可以大大改善這個(gè)問題:芯片粒技術(shù)并不是簡單地增加芯片的面積(例如更多片上存儲(chǔ)),而是把這些模塊分散在不同的芯片粒中,這樣一來整個(gè)芯片粒的芯片面積就會(huì)大大下降,從而改善良率。

此外,隨著GPU規(guī)模越來越大,為了能更好地控制整體良率,使用芯片粒技術(shù)也是一個(gè)自然地選擇。

我們認(rèn)為,在今天HBM3技術(shù)的功耗遇到瓶頸的時(shí)候,或者說HBM技術(shù)整體從功耗上遇到挑戰(zhàn)的時(shí)候,下一步的重要方向一定是從簡單地增加DRAM帶寬和在單個(gè)芯片上放更多晶體管變到更精細(xì)地設(shè)計(jì)架構(gòu)和片上存儲(chǔ),這也就讓芯片粒占到了舞臺中央

事實(shí)上芯片粒和GPU的結(jié)合對于業(yè)界來說并不陌生。事實(shí)上Nvidia最有力地競爭對手AMD已經(jīng)把芯片粒技術(shù)使用在GPU上,此外在片上存儲(chǔ)部分AMD也發(fā)布了3D V-Cache,可望成為下一代繼續(xù)增加片上存儲(chǔ)的重要技術(shù)。

Nvidia在芯片粒方面也有相關(guān)布局,這次與Hopper同時(shí)間發(fā)布的用于芯片?;ヂ?lián)的UCIe標(biāo)準(zhǔn)也意味著Nvidia在芯片粒領(lǐng)域的投資。

我們認(rèn)為,在Nvidia未來公布的GPU中,非常有可能可以看到芯片粒技術(shù)的大量應(yīng)用,而這結(jié)合Nvidia的軟硬件協(xié)同優(yōu)化技術(shù)有可能會(huì)成為下一代Nvidia GPU的最大亮點(diǎn)。

標(biāo)簽: 高端顯卡 游戲玩家 性能提升

推薦

財(cái)富更多》

動(dòng)態(tài)更多》

熱點(diǎn)

亚洲AV无码精品国产电视剧-欧美疯狂做受XXXX富婆-国产美女做爱-在线日本人www. | 91麻豆糖心vlog出品淑怡熟女亚洲一区精品久久-国产精品一区无码专区-欧美V亚洲V日韩v国产Vv∨-日韩精品久久久久久久电影99爱 | 99久久精品国产一区二区三区-China中国老熟女piCS-日韩传媒大乱交-97人人操人人乐 | 少妇口述玌伦经过全文阅读-大奶骚影院-国产在线视频一区二区-强奸妞视频影视大全网站 | 色网操穴-摸奶插逼网站-国产操女老师视频-国产美女a做受大片在线观看 | 黄色电影首发站-精品欧美在线观看视频-社长玩人妻森泽佳奈-国产chinese男女 | 黑人九九剧场-荡乳尤物h窑子开张了视频-久久免费成人黄色-国产熟女自慰 | 妖精在线网站免费看-国产午夜福利精品一区二区三区-亚洲欧美日韩在线一区-日韩图色 | 亚洲 熟女 久久 国产-超碰综合-一本一道无码DⅴD专区-Chinese高潮videos叫床 | 夹住花蒂颤抖喷水调教H-露脸丰满浓密老熟女高潮对白-自偷自拍网-北京富婆泄欲对白 | 亚洲黄色录像-国产乱码精品一品二品 chinese老太交granny-寸止按摩.av-午夜福利视频 | 亚洲夫妻生活网-名器尤物销魂人妻1~5-北条麻妃中出视屏-扒开腿狂躁女人爽出白浆A片漫画 | 狠干老肥B-4k超清在线观看-国产亚洲精品精品精品-日BBB,操BBB | 淫熟交尾竹内纱里奈-长筒美女被操出白浆-性感小唯西川惊人的口交和性-日本xxxxxxx49 | 亚洲va中文字幕无码毛片久久-无码A级免费视频-日韩色情毛片-高清一区二区 | 最好的迅雷电影下载网,分享最新电影,高清电影、综艺、动漫、电视剧等下载!-丝袜av在线丝袜av天堂国产-日本少妇ⅩXXX无码妖精视频-DVD高清完整版播放 日韩欧美精品一区二区三区在线 | 偷拍 的搜索结果 - 91n-avchinese-东北女人999精品-又大又粗又黄又爽孕妇 | 越南肥老熟妇在线观看-中国老熟妇-沟沟裸体美女-黑人强制中出女优 | 日哭老师免费在线观看视频-国产一区二区不卡三区-DVD在线播放 国产自偷在线拍精品热-国产AV熟女 | 国产一区二区三区gay男同-神木麓无码巨乳在线-国产香蕉视频在线播放-亚洲中文字幕无码久久2017 | 亚洲夫妻生活网-名器尤物销魂人妻1~5-北条麻妃中出视屏-扒开腿狂躁女人爽出白浆A片漫画 | BD国语免费观看韩国 4314 4834 ** 国产做受XXX黑人XXⅩ-中日韩一区二区三区四区电影-大桥未久黑人mibd445-欧美老太黑人性爱影院 中文不卡av中文字幕-女人自慰免费观看网站-中国女人花心毛片视频网站-美艳嫩模呻吟啪啪呻吟 | 亚洲国产成人久久午夜-小莹好湿好紧太爽了电影在线-69XXXXXXXXXXX台湾-日日橹狠狠爱欧美超碰 | 蓝光在线观看完整版 日韩欧美精品在线观看-妃光莉三级中文字幕-裸体美女乱淫-波多野结衣之家座教师4 | 六十路七十路超熟无码-2019最新免费的一区二区-强行迷奷系列A片-中国女人真人真曰批 | 亚洲欧美一区二区三区国产另类-波多野结衣黄色-涩涩涩污污污-国产精品日韩欧美制服 | 另类综合欧美中文字幕-久久看片国产精品JIZZ-绯色av中文字幕一区二区-色xxxxx | 久久九九爱爱-四虎影院中文字幕-国产精品免费视频一区二区 -91熟女丨91老女人 | 国产在线观看免费播放电视剧美女图片-一区二区三区中文字幕脱狱者-91色久-gogogo高清免费观看完整版 | 黑森林毛茸茸熟女人妻-女人自慰网址-精品国产无套在线观看-日本睡熟迷奷系列A片 | 北条麻妃《邻居人妻》-熟妇24p-伊人网狼人干-美女在线干你 | 无码日逼视频-伊人大査蕉-日本肏屄网-美女簧片网站 | 中文字幕国产精品久久久-尤物久久99热国产综合-精品无码一区二区三区爱欲-欧韩日美黄色一级大片 美女被猛干网站-67194熟妇直接进入-东京狠狠干-色色色淫荡 | ヘンリー冢本HOK人妻-x8 x8 x8 av-亚洲欧美日韩精品在线免费观看-a欧美日韩高清 | jizzcccc中国-午夜无码鲁丝片久久成人18免费网站-精品国产一区二区三区免费久久网-后入美女在线 Japanese在线野狼视频-亚洲2020久久久久久久-干BBB-影音先锋伊人 | DVD免费电视剧 日韩欧美国产一区二区三区-残忍夹住肉核电击调教-欧美一级录相-白嫩粗长浓精futa熟女俱乐部 | 樱花影视 免费高清电影电视剧手机版在线观看-玩弄丰满人妻-极品美女想被c-2020最新国产精品视频 黑森林毛茸茸熟女人妻-女人自慰网址-精品国产无套在线观看-日本睡熟迷奷系列A片 | 北岛玲摸逼网视频-成人操屄HD-中出高潮视频-BD英语最新电影在线观看 欧美一级大片 | 免费女仆 又爽 又黄-国产精品无码一区二区左线天美-涩涩h-国产 一二三四五六 | 欧美老妇BB-HXXXXX-国产91高潮叫床ThePorn-量近2019中文字幕在线视频 | 日韩黑人AⅤ综合-印度性猛交BBBBBBBBB-JIZZJIZZ日本成熟丰满-中国老师69ⅩXXX老师258 |