中國西藏網(wǎng) > 即時新聞 > 新聞

大模型興起導(dǎo)致算力緊張?專家呼吁:國產(chǎn)AI芯片系統(tǒng)應(yīng)練好“內(nèi)功”

發(fā)布時間:2023-12-21 14:44:00來源: 科技日報

  大模型興起導(dǎo)致算力緊張?專家呼吁——

  國產(chǎn)AI芯片系統(tǒng)應(yīng)練好“內(nèi)功”

  ◎本報記者 張佳星

  “大模型訓(xùn)練需要大量數(shù)據(jù),因此對算力的要求很高?!痹谌涨罢匍_的首屆“AI Tech Day(人工智能科技日)”峰會上,中國工程院院士、清華大學(xué)計算機(jī)科學(xué)與技術(shù)系教授鄭緯民介紹,自去年12月份以來,大模型需要的AI芯片漲價一倍,國外芯片“一卡難求”。盡管國內(nèi)數(shù)十家公司在AI芯片研制和生產(chǎn)方面取得了很大進(jìn)步,但國產(chǎn)芯片尚未受到市場的廣泛青睞。

  對此,與會專家呼吁,解決算力難題,應(yīng)重塑大模型算力生態(tài),助力國產(chǎn)AI芯片系統(tǒng)練好“內(nèi)功”。

  加強(qiáng)底層研發(fā),提升國產(chǎn)AI芯片“包容力”

  “如果基于國外芯片編寫的軟件能夠很容易移植到我們的國產(chǎn)芯片系統(tǒng)上來,用戶就會感覺到國產(chǎn)芯片好用。”鄭緯民認(rèn)為,但由于生態(tài)建設(shè)不完備,目前國產(chǎn)芯片在大模型訓(xùn)練相關(guān)軟件移植方面表現(xiàn)不太順暢,因此需要進(jìn)一步加強(qiáng)底層研發(fā),做好包括編程框架、并行加速、通信庫在內(nèi)的軟件研發(fā)工作。

  “為了發(fā)展AI芯片的生態(tài)體系,一些國際大企業(yè)甚至可以放棄一些高利潤的項目和方案?!庇⒉?shù)科CEO周韡韡介紹,營造生態(tài)需要發(fā)動整個行業(yè)的創(chuàng)新力量,例如國際企業(yè)曾通過主動開源部分軟件的底層代碼、讓利給基于芯片的軟件開發(fā)者,形成以AI芯片為核心的算力體系。

  相較于芯片本身的硬件性能提升,鄭緯民認(rèn)為,通過營造生態(tài),提升國產(chǎn)AI芯片的“包容力”更加急迫?!叭绻懔ι鷳B(tài)做得非常好,即使國產(chǎn)芯片的硬件性能只有國外性能的60%及以上,大家也會喜歡用。”鄭緯民說,但如果算力生態(tài)沒做好,新型軟件跑不起來、軟件移植不順暢,即便硬件性能達(dá)到國外的120%,照樣難以轉(zhuǎn)變?yōu)橛行懔Α?/p>

  為凝聚行業(yè)力量、改變當(dāng)前的大模型算力生態(tài),英博數(shù)科聯(lián)合百川智能、中國計算機(jī)學(xué)會、清華大學(xué)等單位共同成立北京AI創(chuàng)新賦能中心技術(shù)委員會。作為該技術(shù)委員會的顧問,清華大學(xué)電子工程系教授汪玉表示:“在大模型領(lǐng)域,我們將同時從軟件側(cè)和硬件側(cè)方面開展聯(lián)合優(yōu)化。在打造通用型人工智能服務(wù)平臺的同時,推動高性能計算領(lǐng)域智能芯片和高模態(tài)電路關(guān)鍵技術(shù)的研發(fā)?!?/p>

  共建基礎(chǔ)生態(tài),推動現(xiàn)有算力融合創(chuàng)新

  “大模型興起之前建設(shè)的算力,相對而言利用率較低,跟不上現(xiàn)階段大模型對算力指數(shù)級發(fā)展的需求。”艾瑞咨詢產(chǎn)業(yè)數(shù)字化研究院負(fù)責(zé)人徐樊磊介紹,為提升整體算力效率和滿足差異化需求,應(yīng)建立支撐大模型萬億量級參數(shù)計算的“智算中心”?!爸撬阒行摹笨衫矛F(xiàn)有高質(zhì)量數(shù)據(jù)中心,通過提升組網(wǎng)能力、協(xié)同能力、軟硬件適配能力等實現(xiàn)部署。當(dāng)前,“萬卡”級別的智算中心正在主要節(jié)點城市發(fā)展起來。

  與會專家認(rèn)為,推動現(xiàn)有算力融合創(chuàng)新將進(jìn)一步提升當(dāng)前算力使用效率?!?萬塊卡(AI芯片)應(yīng)該怎么連?是不是每塊卡和其他9999塊直連?如果這樣,中間的連接將需要1萬乘以9999個連接卡,成本將非常高。”鄭緯民說,通過最有效的連接支持模型并行、數(shù)據(jù)并行等不同的要求,是融合創(chuàng)新的關(guān)鍵。

  大模型背后運行的是更加復(fù)雜的網(wǎng)絡(luò)架構(gòu)和智能算法。如何在降本增效的同時,促進(jìn)大模型算力使用門檻的降低?“‘云’模式是打通供需不對稱、達(dá)成算力普惠的有效路徑?!敝茼|韡表示,通過共享、共融集結(jié)現(xiàn)有算力,萬卡平臺及配備高效網(wǎng)絡(luò)交互機(jī)制的大模型訓(xùn)練與推理平臺,可以開放給大企業(yè)、小微企業(yè)共用。通過搭載數(shù)據(jù)遷徙、訓(xùn)練數(shù)據(jù)庫等工具,云平臺等基礎(chǔ)生態(tài)的搭建有望讓算力像水和電一樣隨取隨用。(科技日報)

(責(zé)編:郭爽)

版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。

同德县| 尼玛县| 山东| 南陵县| 渭源县| 邮箱| 简阳市| 金川县| 稷山县| 常宁市| 华坪县| 杭锦后旗| 高安市| 兴业县| 温泉县| 深水埗区| 方正县| 天柱县| 南召县| 温州市| 黑河市| 泰州市| 辽中县| 伽师县| 巴中市| 张家界市| 资阳市| 河源市| 呼和浩特市| 高青县| 西宁市| 铜梁县| 平罗县| 广西| 遵义市| 桐乡市| 阿拉善盟| 耿马| 台山市| 镇巴县|