可生成文本、繪制圖畫的人工智能(AI)工具已然成為芯片廠商的熱議話題。相比英偉達(dá)、谷歌、英特爾等傳統(tǒng)芯片巨頭,市場開始更多關(guān)注該領(lǐng)域的AI芯片初創(chuàng)公司。
近日,IDC亞太區(qū)研究總監(jiān)郭俊麗稱,以算力每一百天翻一番計算,預(yù)計5年之后,整體AI算力將增長超過一百萬倍,并推動相應(yīng)的算力、基礎(chǔ)設(shè)施和芯片市場增長。
(相關(guān)資料圖)
英國AI芯片獨角獸Graphcore正是此一輪風(fēng)口中的主要標(biāo)的公司。Graphcore提供專為AI計算設(shè)計的軟件和硬件,其AI芯片被稱為“IPU”,很適合那些通過消除不必要的參數(shù)來降低計算成本,提高計算速度的計算。
Graphcore總裁兼大中華區(qū)總經(jīng)理盧濤告訴界面新聞,對于AI芯片公司而言,大模型的意義在于兩點:一方面算力需求更大,無論是做計算機(jī)視覺還是自然語言理解,不同垂直領(lǐng)域的AI大模型之間技術(shù)會有相似性;另一方面計算范式正在發(fā)生遷移,從以CPU為核心變成AI計算為核心的時代,原有的芯片產(chǎn)業(yè)主導(dǎo)者將從舞臺中央退至邊緣。因此,所有半導(dǎo)體公司需要跟上AI的發(fā)展求新求變。
針對AIGC應(yīng)用,Graphcore已提出相應(yīng)解決方案,稱其IPU加速計算卡C600可保證較低的延遲和能耗,同時具有能夠快速遷移模型和軟件棧易用性特點,有利于提供更高效的服務(wù)、降低模型部署和運行成本。例如在GPT2-XL模型上,C600推理延時已經(jīng)達(dá)到1ms/token的水平,功耗僅為30瓦。也因此,降成本是其面向AI應(yīng)用的主要賣點。
Graphcore向界面新聞?wù)故镜募夹g(shù)Demo顯示,相比傳統(tǒng)ChatGPT聊天機(jī)器人一字一字“蹦”出文字回答,基于Graphcore IPU的ChatGLM-6B聊天回復(fù)更快,實現(xiàn)了幾百個字一秒內(nèi)顯示的“刷屏”式回復(fù)。
在如火如荼的AI計算市場上,英偉達(dá)憑借GPU(圖形處理器)最先把握住了機(jī)會,成為AI企業(yè)不可或缺的芯片供應(yīng)商,A100和H100系列GPU成為市場優(yōu)先選擇的AI芯片產(chǎn)品。
盧濤告訴界面新聞,IPU架構(gòu)與GPU不同,在芯片核心數(shù)、存儲和芯片帶寬上均有差別,在保證上千個處理核心同時工作上有自己的理解,這決定了應(yīng)用上最終會存在差異化表現(xiàn)。但他坦言,一個產(chǎn)品不可能在所有方面都領(lǐng)先,在一些功能特性上,客戶會更喜歡IPU。
盧濤稱對競爭對手充滿敬意,“即使我們每年100%擴(kuò)張資源,大公司增加1%的資源就比我們要多,所以想在大規(guī)模的全面PK中勝出基本是不可能的?!彼Q在目前競爭環(huán)境下,Graphcore需要保持的就是聚焦和定力,經(jīng)過一定時間后最后實現(xiàn)突破。
云服務(wù)商擁有廣泛客戶群,對新型芯片選擇持開放態(tài)度,但對于初創(chuàng)企業(yè)而言,與巨頭企業(yè)同處一個舞臺,競爭仍遍布荊棘?!翱蛻粢蠛芨撸纫笮阅芤惨笮詢r比,還要比英偉達(dá)有獨特的價值,”盧濤稱,“客戶總是對的,他就這樣期望,你必須要有這個認(rèn)知,認(rèn)可它才能想出解決辦法,不能總有抵觸心理?!?/p>
與英偉達(dá)力推AI云服務(wù)類似,Graphcore今年也轉(zhuǎn)變思路,通過云廠商向客戶提供算力。盧濤稱,目前Graphcore英國總部有幾家緊密合作的云廠商,以云產(chǎn)品形式來提供Graphcore實例,基本不再以單獨硬件產(chǎn)品對外銷售。
盧濤表示,在中國云端市場,Graphcore與金山云和騰訊云合作,目前與另一家大型云廠商公司也在進(jìn)行合作細(xì)節(jié)規(guī)劃中。但他強(qiáng)調(diào),Graphcore針對中國市場有獨立業(yè)務(wù)策略:“Graphcore在中國仍以一個算力產(chǎn)品的提供方出現(xiàn),主要策略還是聚焦在一些大型商業(yè)公司需求,即最終以銷售硬件,客戶自己安裝產(chǎn)品的形式來落地。”他表示,對于中國的廣大中小客戶,還是堅定走被集成策略。
(文章來源:界面新聞)
標(biāo)簽: