巨量模型加速形成“馬太效應(yīng)”,但浪潮的“源1.0”開始換了賽道

              2021-11-01 12:07:25    來源:略懂的小咖 微信號(hào)

              Hi

              財(cái)經(jīng)作家吳曉波曾經(jīng)給過去十年一個(gè)概括,用的就是“水大魚大”,所謂“沒有企業(yè)的時(shí)代”,只有“時(shí)代的企業(yè)”,正因?yàn)橹袊@汪大湖過去十年大水猛漲,中國公司的體量隨之膨脹。而“水大魚大”的比喻,在人工智能產(chǎn)業(yè)的發(fā)展來說,又極其的貼切。

              人工智能的每一步發(fā)展都是因?yàn)檫@個(gè)時(shí)代的環(huán)境使然。得益于數(shù)據(jù)量的爆炸式增長、計(jì)算能力的大幅提升、機(jī)器學(xué)習(xí)算法的持續(xù)優(yōu)化,人工智能產(chǎn)業(yè)正快速發(fā)展。IDC預(yù)測(cè):在2025年,全球數(shù)據(jù)量將達(dá)到史無前例的163ZB;同時(shí),5G和AI結(jié)合帶動(dòng)了全球算力爆炸式增長,從2016年開始到現(xiàn)在AI算力增長了約30萬倍。就算法來看,大模型成了AI產(chǎn)學(xué)界刷屏率頗高的詞匯,更大算力、更大數(shù)據(jù)集的大模型,或許才是未來AI最好的伙伴。

              在這樣一個(gè)人工智能的汪洋大海里,無論是AI芯片、AI服務(wù)器等領(lǐng)域,都已經(jīng)涌現(xiàn)出了一批巨頭。

              AI算法模型,更巨量者得天下?

              人工智能已經(jīng)從五六年前的“黑科技”變成了今天的“熱科技”,并與各個(gè)產(chǎn)業(yè)深度融合,加速推動(dòng)著智慧時(shí)代的到來。但同時(shí),人工智能的落地應(yīng)用從“可用”走向“好用”,還存在著諸多挑戰(zhàn)。

              就算法來說,深度學(xué)習(xí)技術(shù)興起的近10年間,AI模型基本上是針對(duì)特定應(yīng)用場景需求進(jìn)行訓(xùn)練的小模型。而在中國工程院院士、浪潮首席科學(xué)家王恩東看來,人工智能如何發(fā)展出像人類具備邏輯、意識(shí)和推理的認(rèn)知能力,是人工智能研究一直在探索的方向。“目前來看,通過大規(guī)模數(shù)據(jù)訓(xùn)練超大參數(shù)量的巨量模型,被認(rèn)為是非常有希望實(shí)現(xiàn)通用人工智能的一個(gè)重要方向。”王恩東院士認(rèn)為,隨著巨量模型的興起,巨量化已成為未來人工智能發(fā)展非常重要的一個(gè)趨勢(shì)。

              算法模型為什么要從“小”到“大”?浪潮信息(000977,股吧)人工智能研究院首席研究員吳韶華作了進(jìn)一步解釋,小模型用特定領(lǐng)域有標(biāo)注的數(shù)據(jù)訓(xùn)練,通用性差,換到另外一個(gè)應(yīng)用場景中往往不適用,這樣有一個(gè)很糟糕的結(jié)果就是,針對(duì)于任何一個(gè)任務(wù)都要微調(diào)出來一個(gè)有針對(duì)性的模型。極端的真實(shí)案例里,就有一家客戶產(chǎn)生了幾百種模型來支撐幾百種產(chǎn)品。另外,小模型的訓(xùn)練方式需要大規(guī)模的標(biāo)注數(shù)據(jù),如果某些應(yīng)用場景的數(shù)據(jù)量少,訓(xùn)練出的模型精度就會(huì)不理想。而大模型技術(shù)路線可有效解決這個(gè)問題。“大模型有非常突出的小樣本學(xué)習(xí),甚至零樣本學(xué)習(xí)的能力,很有希望去解決這種不同場景下模型繁多的問題,一個(gè)模型訓(xùn)練出來可以適用于不同的場景。“

              “巨量數(shù)據(jù)、巨量算法和巨量算力”正成為邁向通用人工智能的重要路徑,OpenAI、微軟、谷歌、英偉達(dá)、浪潮信息等科技巨頭紛紛發(fā)力“大模型”創(chuàng)新。更有研究預(yù)計(jì),大模型將在三到五年的時(shí)間里開始真正深刻影響產(chǎn)業(yè)的變革和智能化升級(jí)的方向。

              在“AICC 2021人工智能計(jì)算大會(huì)”期間,全球最大規(guī)模中文人工智能巨量模型“源1.0”首次亮相。“源1.0”的單體模型參數(shù)量達(dá)2457億,訓(xùn)練采用的中文數(shù)據(jù)集達(dá)5000GB,問鼎全球最大規(guī)模中文AI巨量模型。這也代表了國內(nèi)AI巨量模型的一個(gè)新高度。但從參數(shù)量的角度來看,“源1.0”還遠(yuǎn)沒有到盡頭,按照目前這種趨勢(shì),AI產(chǎn)業(yè)的玩家們對(duì)于更大體量模型的探索仍然會(huì)繼續(xù)下去。

              不止于大,從專用智能到通用智能

              最近,斯坦福大學(xué)數(shù)十位研究者聯(lián)名發(fā)表《基礎(chǔ)模型的機(jī)遇和風(fēng)險(xiǎn)》綜述文章,認(rèn)為大模型的特點(diǎn)之一是“同質(zhì)化”,好處在于大模型的任何一點(diǎn)改進(jìn)就可以迅速覆蓋整個(gè)AI社區(qū),但同時(shí),它也帶來一些隱患,大模型的缺陷會(huì)被所有下游模型所繼承。特點(diǎn)之二是海量數(shù)據(jù)(603138,股吧)訓(xùn)練出的基礎(chǔ)模型具有“涌現(xiàn)”特性,也就是產(chǎn)生未曾預(yù)先設(shè)想的新能力,這種特性有望讓AI具備處理語言、視覺、機(jī)器人、推理、人際互動(dòng)等各類相關(guān)任務(wù)的能力。

              這帶來的問題就是,在追求“巨量”的同時(shí),如何規(guī)避風(fēng)險(xiǎn),并通過模型激活各行各業(yè),讓AI落地應(yīng)用?

              在浪潮信息副總裁、浪潮信息AI&HPC產(chǎn)品線總經(jīng)理劉軍看來,任何技術(shù)的發(fā)展總有一個(gè)從興起到成熟再到落地的一個(gè)階段,大模型現(xiàn)在正處于興起的階段,大家正在圍繞著模型的體量以及模型體量帶來的精度效應(yīng)來開展持續(xù)的探索,當(dāng)大模型探索走向成熟之后,一定要考慮應(yīng)用的具體問題,比如響應(yīng)化、高性能推理部署等諸如此類的問題。

              同時(shí),劉軍認(rèn)為,AI巨量模型到底要做什么,不做什么,不能天馬行空。“可以從兩個(gè)不同的層面去考慮,一是產(chǎn)業(yè)發(fā)展的層面,產(chǎn)品怎么去滿足客戶、滿足市場、滿足應(yīng)用需要的發(fā)展。二是科研創(chuàng)新,科學(xué)的探索方向,去思考怎么樣和產(chǎn)業(yè)的方向去匹配。“

              從“量”上看,“源1.0”相比GPT-3模型1750億參數(shù)量和570GB訓(xùn)練數(shù)據(jù)集,“源1.0”參數(shù)規(guī)模領(lǐng)先40%,訓(xùn)練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。同時(shí)“質(zhì)”上也達(dá)到了全球領(lǐng)先,“源1.0”在語言智能方面表現(xiàn)優(yōu)異,獲得中文語言理解評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類總榜冠軍,測(cè)試結(jié)果顯示,人群能夠準(zhǔn)確分辨人與“源1.0”作品差別的成功率已低于50%。

              但單純的追求“大”并不是浪潮信息的目標(biāo)。劉軍表示:“巨量模型不是大公司專享,應(yīng)該成為普惠性的科技進(jìn)步力量,讓行業(yè)用戶甚至是中小用戶也能使用巨量模型尋求深度創(chuàng)新,促進(jìn)業(yè)務(wù)可持續(xù)健康發(fā)展”。吳韶華對(duì)此也表示,巨量模型的發(fā)展并不是真的在比大,大不是目的,最根本的目的,從技術(shù)層面來講就是要追求通用智能,就是從專用智能走向通用智能。

              開源開放,從“順勢(shì)而為”到“扶搖直上”

              在AICC 2021大會(huì)上,浪潮信息推出“源1.0”開放開源計(jì)劃,“源1.0”將面向?qū)W術(shù)研究單位和產(chǎn)業(yè)實(shí)踐用戶進(jìn)行開源、開放、共享。

              其實(shí),將AI算法模型進(jìn)行開源已經(jīng)是AI產(chǎn)業(yè)的通用做法,但回到浪潮信息自身來看,這一步棋還是有不一樣的涵義。

              首先,浪潮信息“源1.0”作為全球最大規(guī)模的中文AI巨量模型,除了規(guī)模大、數(shù)據(jù)大、性能強(qiáng)之外,無論是開放模型API,開放高質(zhì)量中文數(shù)據(jù)集,開源模型訓(xùn)練代碼、推理代碼和應(yīng)用代碼等都需要浪潮信息有強(qiáng)有力的支撐,能夠做好支撐行業(yè)AI開發(fā)者的堅(jiān)實(shí)底座。

              先看浪潮信息“源1.0”的開源底氣何來?《逍遙游》中說,“水之積也不厚,則其負(fù)大舟也無力”“風(fēng)之積也不厚,則其負(fù)大翼也無力”,全球最大的中文AI巨量模型誕生,得益于浪潮信息在人工智能領(lǐng)域深厚的積累和不斷的探索實(shí)踐。浪潮信息一直活躍在AI前沿方向,在異構(gòu)加速計(jì)算、深度學(xué)習(xí)框架、AI算法等領(lǐng)域取得了一定的成績。

              目前,浪潮信息的AI服務(wù)器市占率已位居全球第一,連續(xù)4年中國市場占比超過50%;在深度學(xué)習(xí)框架領(lǐng)域,浪潮信息先后推出了深度學(xué)習(xí)并行計(jì)算框架Caffe-MPI、TensorFlow-Opt、全球首個(gè)FPGA高效AI計(jì)算開源框架TF2等等。2020年,浪潮信息在人工智能領(lǐng)域的專利貢獻(xiàn)達(dá)到1174件,位居中國前列。

              其次,在國內(nèi)已經(jīng)有許多廠商開放AI算法模型的前提下,浪潮信息開放“源1.0”,必然需要走差異化的道路,提供給AI開發(fā)者和產(chǎn)業(yè)不一樣的價(jià)值,如此其開源才有意義。

              浪潮信息作為智算中心的提出者,可以讓智算中心這一算力基礎(chǔ)設(shè)施和巨量模型這一算法基礎(chǔ)設(shè)施行成協(xié)同效應(yīng)。因?yàn)榇竽P偷挠?xùn)練運(yùn)行需要智算中心的基礎(chǔ)設(shè)施,需要算力基礎(chǔ)設(shè)施來作為算力平臺(tái),兩者的協(xié)同工作,能為產(chǎn)業(yè)AI提供一個(gè)強(qiáng)大的推動(dòng)力。

              正是因?yàn)閲鴥?nèi)人工智能產(chǎn)業(yè)的迅猛壯大,才能產(chǎn)生浪潮信息AI服務(wù)器市占率位居全球第一、“源1.0”成為全球最大的中文AI巨量模型這樣的成績,“水大魚大”,浪潮信息不止做到了順勢(shì)而為,還做到了“扶搖直上”, 負(fù)產(chǎn)業(yè)之志,然后圖南,浪潮信息“源1.0”有“絕云氣,負(fù)青天”之志,更是中國AI產(chǎn)業(yè)扶搖而上者九萬里的希望所在。

              Hi

              本文首發(fā)于微信公眾號(hào):略懂的小咖。文章內(nèi)容屬作者個(gè)人觀點(diǎn),不代表和訊網(wǎng)立場。投資者據(jù)此操作,風(fēng)險(xiǎn)請(qǐng)自擔(dān)。

              相關(guān)熱詞搜索: 模型 AI 浪潮 信息 人工智能 產(chǎn)業(yè) 巨量 數(shù)據(jù)

              上一篇:馬斯克:證明60億美元能解決饑餓問題,我就立刻賣股票!
              下一篇:早財(cái)經(jīng)|格力回應(yīng)在美被罰9100萬美元;《個(gè)人信息保護(hù)法》11月1日施行:不得大數(shù)據(jù)殺熟等;公募持有A股市值占比創(chuàng)近10年新高

              熱點(diǎn)話題

              熱點(diǎn)推薦

              頭條

              ? 久久精品国产精品亚洲精品| 久久久久亚洲精品无码网址色欲| 亚洲成在人线在线播放无码| 亚洲AV成人一区二区三区在线看| 亚洲欧洲日产v特级毛片| 亚洲成a人片在线观看日本| 精品亚洲一区二区三区在线播放 | 国产精品久久亚洲一区二区| 亚洲精品色播一区二区| 亚洲国产精品精华液| 亚洲精品久久无码| 亚洲人成网站18禁止| 亚洲第一第二第三第四第五第六| 亚洲日韩精品国产3区| 亚洲国产成人AV在线播放| 亚洲成a∨人片在无码2023| 国产亚洲欧美日韩亚洲中文色| 自拍偷自拍亚洲精品偷一| 国产产在线精品亚洲AAVV| 亚洲精品国产精品乱码不卞 | 亚洲精品在线免费看| 亚洲日本香蕉视频| 国产精品亚洲精品青青青| 亚洲欧美日韩中文高清www777| 亚洲精品美女久久久久久久| 日本亚洲中午字幕乱码| 亚洲精品和日本精品| 亚洲日韩激情无码一区| 久久综合图区亚洲综合图区| 亚洲精品美女久久久久| 亚洲人配人种jizz| 亚洲aⅴ无码专区在线观看| 亚洲AV成人精品日韩一区18p| 亚洲综合色成在线播放| 亚洲成AV人片在线观看无码 | 极品色天使在线婷婷天堂亚洲| 亚洲高清最新av网站| 亚洲人成77777在线播放网站| 亚洲av无码国产精品色午夜字幕 | 国产精品亚洲专一区二区三区| 亚洲一区二区三区国产精品|