Contact_

Request a
Business Customized Quotation

Phone

+886 2 8797 8337

HQ

12F-2, No.408, Ruiguang Rd., Neihu Dist., Taipei City 11492, Taiwan

BR

Center of Innovative Incubator R819, No. 101, Section 2, Kuang-Fu Road, Hsinchu, Taiwan

Submit

黃仁勳反抗軍來了!藏身竹科、內湖小廠,晶片效能比輝達強2倍

生成式AI狂潮下,輝達黃仁勳掌握最重要算力軍火GPU,然而王者之位,已經開始有人覬覦,從山腳下積極上攻。「反黃仁勳」的台灣戰隊,它們是誰?有機會分食輝達市場?

林永隆認為,未來資料中心伺服器的使用量會愈來愈大,這也是台灣投入AI運算晶片業者的機會。圖片來源:王建棟攝

文 黃亦筠 天下雜誌776期 發布時間:2023-06-27 原文轉錄自天下雜誌

站上生成式AI狂潮之巔的輝達(Nvidia)執行長黃仁勳,山腳下出現了年輕挑戰者,來自台灣。

4月5日,成員包括Google、微軟、臉書、亞馬遜等組成AI晶片產業測試基準的工程聯盟(MLCommons),舉辦AI奧林匹克級賽事MLPerf,公布一份數據。

小型晶片廠創鑫
首款晶片擊敗輝達最快GPU

來自台灣、成立4年,僅40多名員工的小型晶片廠創鑫智慧,以台積7奈米製程開發的首款晶片RecAccel N3000,在每瓦1060次查詢(queries)上,擊敗輝達最快速的GPU H100,效能為H100的1.67倍,拿下第一,在晶片圈掀起話題。

【小檔案】創鑫智慧
•成立/2019年
•董事長/林永隆
•主要業務/AI運算加速器IC設計
•資本額/13.5億

因為這意味著,創鑫的N3000晶片,能讓Meta、Google等雲端服務大咖的伺服器、數據中心,以更省電的方式,達成更好的查詢效率。

確實這波生成式AI,需要大量算力,輝達以CUDA運算平台,加上GPU軟硬體整合的絕佳優勢,以高達78%的寡佔之姿,站穩領導市場的地位。

誘人商機,吸引大型晶片廠超微(AMD)、英特爾及其他新創公司,甚至雲端服務業者,群起分食輝達這一塊肥美業務。

「大家都不想被輝達的CUDA+GPU綁住,想多個選擇,」一名系統廠高層表示。

這間挑戰黃仁勳的台灣戰隊,藏身在IC設計大廠聚集的新竹科學園區內,是由台灣設計服務大廠、台積持有股份的創意電子創辦人之一,清大資工系教授林永隆在2019年創辦;背後的主要投資者包括緯創旗下的鼎創、凌陽創投、力晶等。

「我們用小小團隊,做了這麼大的project,一次就成功。這證明台灣是做晶片的好地方,」創鑫董事長林永隆笑著說。

一家新創公司第一個產品就採用台積昂貴的7奈米先進製程,在台灣半導體業十分罕見。7奈米製程,是聯發科智慧型手機晶片投片的主要製程。

鎖定特用市場,吸引超微合作

「N公司(指輝達)製程已經走到4奈米,我們用7奈米製程已經落後1.5代,如果比他們製程再落後更多,產品成功機會就不大,」林永隆的學生、創鑫技術長高肇陽直言。以落後的製程,卻超越N公司晶片效能,凸顯這間小型精兵公司的潛力。

林永隆 (右)、高肇陽(左)領軍的創鑫,吸引超微合作,挑戰輝達王者地位。(王建棟攝)

短短4年,創鑫就做到這樣的成績,是因為林永隆選擇市場上極少人投入的伺服器用AI晶片,且專注在AI推論佔6成以上的推薦系統(recommendation),針對類似臉書、Google等社群平台推薦模型加速效能。

「我們和輝達走不同的路,」林永隆解釋,輝達是通用型GPU,需要涵蓋的範圍廣闊,從工程、氣象、遊戲都要能一體適用,但對許多特殊領域的企業而言,目前十分單純、昂貴、高規格的GPU不見得適用。

創鑫則鎖定特定用途,加速AI運算的ASIC(特定應用積體電路),一來也避開和輝達、超微、英特爾這些大咖晶片廠直接競爭,才可能有勝算。

林永隆表示,只要一個領域有大量計算和大量應用的需求,就會出現ASIC的需求。「資料中心伺服器的使用量會愈來愈大,算量的需求會大很多,你現在看到的只是冰山一角而已,」他十分看好。

創鑫在MLPerf賽事,將晶片放在超微上一代CPU的伺服器上,超越輝達H100效能的成績,立刻獲得超微的注目,預備一起合作AI解決方案。

編程器公司Skymizer
董事長、執行長身懷絕技

生成式AI帶動的加速晶片商機,輝達最強大頭號挑戰者,毫無疑問就是超微。

6月13日超微發布新一代內建8顆處理器的M1 300X,記憶體數量超越輝達,速度和效能直接挑戰輝達最高階H100。然而發布會後超微股價卻下跌3.6%。當時一名美系機構Tirias Research分析師克維爾就指出,是因為沒有大客戶採用。

「大家還是用輝達,因為有可承接高階程式語言的CUDA,」前述系統廠高層坦言,超微、英特爾就是少了CUDA這樣的軟體架構。

創鑫也想擺脫CUDA緊箍咒,關鍵就在晶片上由台灣一間同樣小型的軟體公司Skymizer,打造的編程器(compiler)。

內湖瑞光路上一棟商辦內,「台灣發展軟體科技公司」,簡稱台發科,寫在樓層牌上,和台灣IC設計龍頭聯發科僅一字之差,它就是同業都以英文名稱之的AI編程器公司Skymizer。

【小檔案】Skymizer
•成立/2013年
•董事長/賴俊豪
•執行長/唐文力
•主要業務/AI編程器
•資本額/2800萬


「每天睡覺起來,就覺得世界又變了,」Skymizer創辦人兼執行長唐文力說。他受訪這天是5月19日,Meta剛公布自家首顆推理晶片MTIA,這是一顆客製化晶片,搭配自己的PyTorch2.0介面。Open AI也推出機器學習模型Triton DSL,目的都是想削弱輝達的統治地位。

「這都是過去一個多月內發生的,」唐文力說,此刻是他當軟體工程師以來非常興奮的時刻。

賴俊豪(右)與唐文力(左)認為生成式AI為軟體業帶來興奮時刻。(王竹君攝)

Skymizer在2013年成立,目前約40人,有前英特爾副總裁王文漢的投資,現任董事長更是台灣IC設計界聞人──前創意電子總經理賴俊豪,創辦人兼執行長唐文力則待過晨星、Marvell,是當年聯發科成立編程器部門前二號員工。

Skymizer專門幫ASIC廠設計編程器,讓ASIC能和AI深度學習、高速運算整合,提升硬體性能。它還是世界第一個開源編程器設計廠,能夠支援AI主流深度學習框架,譬如TensorFlow,扮演的角色非常類似輝達的CUDA。

做非輝達陣營的CUDA架構
因此,一有AI新平台出現,Skymizer工程師們就得卯起來幫ASIC客戶「落地」,讓客戶的ASIC晶片和這些AI、機器學習平台的程式語言能溝通。

「我們最近追趕得有點難睡好覺,」唐文力笑著說,「近期來詢問我們的(ASIC)業者變多了,」他直言。

5月中,Google內部流出一份標題為「我們沒有護城河」的備忘錄,裡面提到,開源社群研究員善用免費線上資源開發模型,運算結果已足以媲美最大型的企業專屬語言模型(LLM)。

《經濟學人》認為,這意味現在只要100美元就能完成LLM的微調,取得AI技術,將比過去更加民主,「強大的LLM可在筆電上運行,且任何人都可以微調出自己的AI系統。」

賴俊豪表示,AI戰國時代,模型變化太快,開一顆晶片最快一年半,等開出來,AI已變了好幾代,讓ASIC廠很難落地。

「我們可以成為非N陣營的CUDA,幫在戰國時代的ASIC公司填補不足,合起來拿一點輝達的市場,」賴俊豪說。

面對巨人輝達,台灣戰隊毫無畏懼,已經在摩拳擦掌。

(雜誌原標題:晶片效能超越輝達 黃仁勳反抗軍來了/責任編輯:吳廷勻)

Share