Sora也好,ChatGPT也好,大模型訓(xùn)練的背后是由高算力芯片所組成的大規(guī)模運(yùn)算網(wǎng)絡(luò)。Meta等巨頭一出手就是幾十萬(wàn)個(gè)高算力芯片,近千億的投資來(lái)建設(shè)數(shù)據(jù)中心。而作為終端的AI產(chǎn)品,比如AI PC,AI手機(jī),AI汽車(chē),AI智能家居,依賴(lài)的就是終端產(chǎn)品內(nèi)的算力芯片。泰克的MSO6B系列示波器
Sora也好,ChatGPT也好,大模型訓(xùn)練的背后是由高算力芯片所組成的大規(guī)模運(yùn)算網(wǎng)絡(luò)。Meta等巨頭一出手就是幾十萬(wàn)個(gè)高算力芯片,近千億的投資來(lái)建設(shè)數(shù)據(jù)中心。而作為終端的AI產(chǎn)品,比如AI PC,AI手機(jī),AI汽車(chē),AI智能家居,依賴(lài)的就是終端產(chǎn)品內(nèi)的算力芯片。泰克MSO6B系列示波器
晶體管是芯片的基礎(chǔ)組成單元,晶體管的數(shù)量越多,芯片的性能越強(qiáng)。各大芯片設(shè)計(jì)廠家和晶圓廠,就是想方設(shè)法在有限的空間里,通過(guò)更小的工藝尺寸(如3nm),來(lái)堆積更多的晶體管。
晶體管工作的時(shí)候需要變化的電壓,代表邏輯1和邏輯0,進(jìn)而實(shí)現(xiàn)計(jì)算或控制。由于開(kāi)關(guān)損耗、短路功耗和漏電功耗的存在,晶體管在工作的時(shí)候會(huì)消耗掉電源功率,產(chǎn)生熱量。晶體管數(shù)量越來(lái)越龐大之后,散熱這個(gè)很現(xiàn)實(shí)的問(wèn)題就擺在芯片和系統(tǒng)設(shè)計(jì)師的面前。處理器芯片每平方厘米的面積上,就能產(chǎn)生300瓦的峰值功率,算下是150瓦/平方厘米,已經(jīng)超過(guò)了典型的核反應(yīng)堆的功率密度了。現(xiàn)在的數(shù)據(jù)中心很多都已經(jīng)使用浸沒(méi)式液冷來(lái)進(jìn)行散熱,把服務(wù)器和算力芯片浸沒(méi)在絕緣的、導(dǎo)熱性良好的液體里面,通過(guò)液體的流動(dòng)快速帶走熱量,比傳統(tǒng)的風(fēng)扇散熱效率更高,但這還遠(yuǎn)遠(yuǎn)不夠。泰克MSO6B系列示波器
散熱和工藝尺寸一樣,是制約晶體管的密度和規(guī)模增加的難題之一。
解決散熱的其中一個(gè)方案,就是從源頭想辦法,降低電壓。使用更低的工作電壓,將每一顆晶體管的功耗降下來(lái),就可以堆疊更多的晶體管了。
style="margin: 0px; padding: 0px; outline: 0px; max-width: 100%; box-sizing: border-box !important; overflow-wrap: break-word !important;">早期的算力芯片工作電壓是5V,慢慢演化到3.3V,1.8V,1.5V,到了今天,算力芯片和高速接口芯片的工作電壓基本都在1V左右,甚至更低。這就對(duì)電源設(shè)計(jì)和測(cè)量提出了更高的要求。泰克MSO6B系列示波器
低電壓條件下電源紋波
和噪聲的測(cè)試挑戰(zhàn)
電源是算力芯片的能量來(lái)源,是邏輯狀態(tài)的參考基準(zhǔn)。如果電源的紋波和噪聲過(guò)大,會(huì)給高速變化的邏輯信號(hào)上產(chǎn)生大量抖動(dòng),進(jìn)而產(chǎn)生誤碼(注: 誤碼即錯(cuò)誤的碼元, 將邏輯1當(dāng)成邏輯0, 或者將0當(dāng)成1),影響芯片的性能,甚至導(dǎo)致芯片無(wú)法正常工作。高速信號(hào)驗(yàn)證中非常重要的隨機(jī)抖動(dòng)和低頻的周期性抖動(dòng),就是由于電源的噪聲和紋波所引入的。泰克MSO6B系列示波器
電源的紋波和噪聲測(cè)量,一直都是電源工程師們最關(guān)注的問(wèn)題之一。算力芯片更低的工作電壓,導(dǎo)致電源留給紋波和噪聲的裕度變得更小了,給設(shè)計(jì)和測(cè)試都帶來(lái)了難題。
設(shè)計(jì)上,算力芯片普遍采用POL的降壓方式,將DC-DC變壓器盡可能靠近負(fù)載端,可以有效避免傳輸鏈路上引入的外部干擾。泰克MSO6B系列示波器
測(cè)試上,使用更高精度、更低底噪的示波器,和專(zhuān)用的電源紋波探頭,降低測(cè)量系統(tǒng)引入的噪聲,才能更準(zhǔn)確地測(cè)量電源紋波和噪聲。
電源紋波和噪聲測(cè)試解決方案
泰克的MSO6B系列示波器的底噪性能十分優(yōu)異,底噪的有效值在20MHZ帶寬下低至8.68uV,1G帶寬下低至51.5uV,是準(zhǔn)確測(cè)量電源紋波和噪聲的優(yōu)選之一。
如果電源電壓是1V,示波器的底噪稍微高一點(diǎn),裕量還有很大空間,是可行的嗎?這里需要了解兩個(gè)問(wèn)題:
1
儀器的底噪指標(biāo)用的都是有效值。而電源紋波和噪聲的測(cè)量規(guī)范,一般都是用峰峰值。峰峰值和測(cè)量樣本數(shù)相關(guān),測(cè)量的樣本數(shù)越多,峰峰值越大,我們可以近似的認(rèn)為峰峰值是有效值的10倍以上。
2
電源工程師測(cè)量底噪和紋波都會(huì)使用探頭,而探頭會(huì)引入額外的底噪。
為什么一定要用探頭呢?有幾個(gè)方面的原因,一是探頭使用便捷,二是探頭提供較高的輸入阻抗,對(duì)待測(cè)電路的影響小,三是探頭提供較大的偏置電壓,可以在測(cè)量噪聲和紋波的同時(shí),觀察到電源直流電壓的變化。尤其當(dāng)芯片的負(fù)載處于動(dòng)態(tài)變化時(shí),電源的直流電壓也會(huì)隨之改變。
示波器加上探頭,再去測(cè)量一下底噪的峰峰值,你會(huì)發(fā)現(xiàn)原來(lái)底噪并不小。手上有示波器和探頭的工程師不妨試試看,將示波器接上探頭,不接任何待測(cè)信號(hào)。在示波器上打開(kāi)峰峰值測(cè)量,測(cè)量結(jié)果就是系統(tǒng)底噪。
常規(guī)的示波器和探頭,系統(tǒng)底噪峰峰值在5mV以上。而有些算力芯片和通信芯片,要求電源噪聲的峰峰值必須小于3mV。測(cè)量系統(tǒng)的底噪都這么大,測(cè)量結(jié)果怎么可能Pass呢!
為了更準(zhǔn)確的測(cè)量電源紋波和噪聲,泰克推出了專(zhuān)用的電源軌探頭TPR系列,20MHZ帶寬下的底噪的峰峰值(注意是峰峰值)低至300uV,即便在4GHZ的全帶寬下,底噪的峰峰值依然只有1.3mV!而且TPR探頭還支持高達(dá)60V的偏置電壓,多種多樣的探頭附件,不僅測(cè)得準(zhǔn),用起來(lái)還很方便。
泰克MSO6B系列示波器
也許你手上的芯片或系統(tǒng)的電源設(shè)計(jì)得很不錯(cuò),但是紋波和噪聲測(cè)量結(jié)果卻老是超標(biāo),有沒(méi)有可能只是因?yàn)槟悻F(xiàn)在用的示波器和探頭不給力?泰克的MSO6B系列示波器
立即預(yù)約金凱博工程師上門(mén)演示,感受不一樣的電源噪聲和紋波測(cè)試體驗(yàn)!