2024年2月17日 星期六

黃仁勳和NVIDIA (中)

 

黃仁勳和NVIDIA ()

 

上篇談了黃仁勳和NVIDIA20年的故事,這篇來說最近的10年發生了什麼.

 

看完上篇你是不是很好奇, CPUGPU的差別在哪裡? 事實上NVIDIA 有做個一個影片解釋過. 它說CPU就像一個無所不懂的博士,但也因為它無所不會,什麼事都要做,所以速度慢、耗率高. GPU就像小學生,只會做一件事, 所以速度快耗率低,但當你把1000個小學生聚在一起,並分配每個學生只做一件事時,它的效率卻會非常驚人.

 

當時NVIDIA 的影片中,是用類似砲彈投射機說明,CPU是啪.....啪一點一點地畫出一幅畫. GPU是利用群發,啪一聲整幅畫就畫好了.

 

是不是真的那麼簡單我是不知道, 但至少我這個唸文組的是以為自己看懂了.

https://www.youtube.com/watch?v=-P28LKWTzrI&ab_channel=NVIDIA

 

重新接回上篇,談到INTELNVIDIA和解.

 

如果你是黃仁勳,回顧自己和公司這20年來的路,你會想到什麼?

很簡單,就是做為配件廠的悲哀嘛!

 

主機賣不好,你要配合砍價. 主機賣太好,人家也會挾量叫你砍價. 更慘的是,如果主機賣的非常非常好,大廠就跳下去自己研發了,反正只要有量和不違反專利,晶圓代工廠都會樂意接單製造. 例如今天APPLE裡的晶片就是如此.

 

要跳脫這種困局,一種方式當然是讓你的技術達到對手都追不上. 但這種事說的容易,在矽谷滿地是資訊天才再加上NVIDIA當時又不是什麼大咖的前提下,做起來卻是天方夜譚. 於是老黃走向了另一條路,那就是建一個平台,透過這個平台建構起各式各樣的運用,讓大家都習慣用NVIDIA的平台去開發相關的運用,這其實就像APPLE STORE的概念,藉此綁住客戶. 於是NIVIDIA的平台─CUDA2006年因應而生.

 

CUDA的概念並不是黃仁勳想的,而是NVIDIA的技術長DAVID KIRK提出的.

在此之前,NVIDIA的晶片主要做為遊戲和電腦系統的影像處理用.簡單地說,NVIDIA交付晶片和驅動程式給客戶後,後端的運用程式開發都是客戶端自己去處理.

DAVID KIRK認為要走出困局,就是要自家的晶片可以被更廣泛的運用到更多和更高階的影像相關處理上,如電影特效、影像模擬、醫療. 但問題是使用這些電影特效和醫療的工程師,他們的專長是在既有應用程式”(Photoshop)上再去發揮,他們不會寫NVIDIA這種底層的開發程式. 所以最好的方法就是建一個CUDA(Compute Unified Device Architecture)的平台,把這些底層的開發程式都寫好了,讓這些應用工程師可以透過這個平台,用他們熟悉的程式語言,直接驅動NVIDIA晶片去做更多的運用..

 於是,NVIDIA 投入了大量的資金和人力在開發CUDA平台.

 

然後? 沒錯,杯具又發生了。2007年爆發了著名的 NVIDIA 晶片瑕疵事件.

 

2007-2008年有多家的N/B品牌, HP, DELL….都出現了在高溫環境下螢幕閃爍、或是開不了機的情況. 經過調查發現,這些電腦的共同特色都是裝了NVIDIA新一代的顯示晶片. 消費者後來發現NVIDIA早就知道可能會有這種情況,所以向NVIDIA發起集體訴訟. 就和早年三星手機爆炸一樣, 當時NVIDIA晶片被稱為核彈VGA

https://www.zdnet.com/article/nvidia-in-defective-chip-class-action-suit/

 

為什麼會如此呢? 因為NVIDIA 在原有晶片加入了CUDA平台, 所以原本的晶片變大了,可是相關的散熱卻沒解決好, 所以問題就出來了. 不意外的,這個NVIDIA大家看好並投入大量金額的產品,不僅沒有為公司帶來更好的效益,反而拖累了公司原有的產品. 而且不只是終端消費者,HP, DELL, APPLE這些大客戶都開始質疑NVIDIA. 高額的研發成本再加上銷售的銳減,再加上2008年的金融風暴, 不意外地NVIDIA出現了巨額的虧損, 股價自然也重挫. 我查一下, 2008-2010, NVIDIA的股價大概都在$2-4/股左右.

 

當時市場罵聲一片,大家都在質疑為什麼Nvidia要花大錢做一個沒有人要用的東西,甚至把原來的產品拖下水? 但殊不知,就是這個才15~16年前被人幹譙到沒力的平台,才成就了今天NVIDIA過兆的市值.

 

2012年一個小事意外地帶動了今天的NVIDIA. 一位加拿大的教授帶著二個學生靠著發明的AlexNet”類神經網路拿下ImageNet的冠軍.

 

什麼是類神經網路? 或是ImageNet有多了不起? 歹勢, 請自行Google, 因為文組的我也不太了解.

但總而言之,這玩意開啟了近代AI的熱潮.

 

這和NVIDIA有什麼關係呢? 你們可能知道AI是需要學習的(或被訓練).

例如,我們要教一台電腦了解什麼是”?

以前的做法就是下一堆定義, 例如大小約20-70公分,二個眼睛,四條腳, 有一根尾巴,面部有鬍鬚, 叫聲是喵

問題是,定義下的愈多答案愈精準沒錯,可是也會錯失很多對的,例如有隻只有三隻腳的貓,或是叫聲不是喵的, 電腦可能就會判定它不是貓.

相反的,定義太廣,就可能電腦會把狗或是老虎都認為是貓.

 

再回頭想想,你自己是怎麼知道那是一隻貓的?

當看到一個動物,你其實並不會去回想定義1, 定義2, 定義3….是什麼? 你知道那是一隻貓,那是因為你從小到大看過了很多貓,所以看到類似的,你自然就會猜那是貓.

 

AI的訓練也是如此,它就是讓電腦自己去網路上看幾百萬張貓的照片,自然電腦就知道什麼是貓了. 所以AI要愈強,就是要讓它不停地學習各種知識.

 

OK, 所以這位教授的團隊發現,如果使用傳統的CPU去訓練AlexNet可能花上數個月,但用Nvidia的晶片才二週,就可以練習電腦看1400萬張圖片. 結果消息一出,不意外地,Nvidia成為了場外的最大贏家. Google, Amazon, 各大實驗室和學校開始瘋狂訂購Nvidia的晶片. 也讓黃仁勳終於吐了一口鳥氣.

 

事後有人訪問黃仁勳是如何高瞻遠矚地看到ai的未來. 黃說,他說早期根本不知道市場有多大,但他賭的是加速運算(Accelerated Computing). 也就是人類未來對於高速運算的需求.

 

不管如何,NVIDIA又從谷底爬起來了. 這時黃仁勳再白痴也知道AI的未來需求了. 所以他開始佈局從平台再向下延伸到硬體.

 

2016年,黃仁勳把NVIDIA開發的第一台裝有8顆GPU超級電腦” DGX-1送到了當時還未如今天有名的OpenAI. 象徵NVIDIA正式跨足電腦伺服器以及AI市場. 而當年簽收這台電腦的,就是目前火紅的Elon Musk.

 

但如果你以為NVIDIA從此一飛沖天,那真的是too young too simple. 畢竟那是7年前,而Ai熱浪是這1年多的事. 當時這種東西都只是賣給學校和一些研究室. 甚至今天熱門的OpenAi 當年也只是個非營利機構.

 

接下來NVIDIA的路還有得講. 至少還有挖礦機、手機晶片和自動駕駛. 我本以為上下二篇就可以講完, 看來要到第三篇了.

 

 

1 則留言: