久久亚洲国产欧洲精品一,亚洲精品无码不卡在线播放,亚洲日韩中文字幕

財(cái)經(jīng)作家吳曉波曾經(jīng)給過去十年一個(gè)概括，用的就是“水大魚大”，所謂“沒有企業(yè)的時(shí)代”，只有“時(shí)代的企業(yè)”，正因?yàn)橹袊@汪大湖過去十年大水猛漲，中國公司的體量隨之膨脹。而“水大魚大”的比喻，在人工智能產(chǎn)業(yè)的發(fā)展來說，又極其的貼切。

人工智能的每一步發(fā)展都是因?yàn)檫@個(gè)時(shí)代的環(huán)境使然。得益于數(shù)據(jù)量的爆炸式增長、計(jì)算能力的大幅提升、機(jī)器學(xué)習(xí)算法的持續(xù)優(yōu)化，人工智能產(chǎn)業(yè)正快速發(fā)展。IDC預(yù)測(cè)：在2025年，全球數(shù)據(jù)量將達(dá)到史無前例的163ZB；同時(shí)，5G和AI結(jié)合帶動(dòng)了全球算力爆炸式增長,從2016年開始到現(xiàn)在AI算力增長了約30萬倍。就算法來看，大模型成了AI產(chǎn)學(xué)界刷屏率頗高的詞匯，更大算力、更大數(shù)據(jù)集的大模型，或許才是未來AI最好的伙伴。

在這樣一個(gè)人工智能的汪洋大海里，無論是AI芯片、AI服務(wù)器等領(lǐng)域，都已經(jīng)涌現(xiàn)出了一批巨頭。

AI算法模型,更巨量者得天下?

人工智能已經(jīng)從五六年前的“黑科技”變成了今天的“熱科技”，并與各個(gè)產(chǎn)業(yè)深度融合，加速推動(dòng)著智慧時(shí)代的到來。但同時(shí)，人工智能的落地應(yīng)用從“可用”走向“好用”，還存在著諸多挑戰(zhàn)。

就算法來說，深度學(xué)習(xí)技術(shù)興起的近10年間，AI模型基本上是針對(duì)特定應(yīng)用場景需求進(jìn)行訓(xùn)練的小模型。而在中國工程院院士、浪潮首席科學(xué)家王恩東看來，人工智能如何發(fā)展出像人類具備邏輯、意識(shí)和推理的認(rèn)知能力，是人工智能研究一直在探索的方向。“目前來看，通過大規(guī)模數(shù)據(jù)訓(xùn)練超大參數(shù)量的巨量模型，被認(rèn)為是非常有希望實(shí)現(xiàn)通用人工智能的一個(gè)重要方向。”王恩東院士認(rèn)為，隨著巨量模型的興起，巨量化已成為未來人工智能發(fā)展非常重要的一個(gè)趨勢(shì)。

算法模型為什么要從“小”到“大”？浪潮信息(000977,股吧)人工智能研究院首席研究員吳韶華作了進(jìn)一步解釋，小模型用特定領(lǐng)域有標(biāo)注的數(shù)據(jù)訓(xùn)練，通用性差，換到另外一個(gè)應(yīng)用場景中往往不適用，這樣有一個(gè)很糟糕的結(jié)果就是，針對(duì)于任何一個(gè)任務(wù)都要微調(diào)出來一個(gè)有針對(duì)性的模型。極端的真實(shí)案例里，就有一家客戶產(chǎn)生了幾百種模型來支撐幾百種產(chǎn)品。另外，小模型的訓(xùn)練方式需要大規(guī)模的標(biāo)注數(shù)據(jù)，如果某些應(yīng)用場景的數(shù)據(jù)量少，訓(xùn)練出的模型精度就會(huì)不理想。而大模型技術(shù)路線可有效解決這個(gè)問題。“大模型有非常突出的小樣本學(xué)習(xí)，甚至零樣本學(xué)習(xí)的能力，很有希望去解決這種不同場景下模型繁多的問題，一個(gè)模型訓(xùn)練出來可以適用于不同的場景。“

“巨量數(shù)據(jù)、巨量算法和巨量算力”正成為邁向通用人工智能的重要路徑，OpenAI、微軟、谷歌、英偉達(dá)、浪潮信息等科技巨頭紛紛發(fā)力“大模型”創(chuàng)新。更有研究預(yù)計(jì)，大模型將在三到五年的時(shí)間里開始真正深刻影響產(chǎn)業(yè)的變革和智能化升級(jí)的方向。

在“AICC 2021人工智能計(jì)算大會(huì)”期間，全球最大規(guī)模中文人工智能巨量模型“源1.0”首次亮相。“源1.0”的單體模型參數(shù)量達(dá)2457億，訓(xùn)練采用的中文數(shù)據(jù)集達(dá)5000GB，問鼎全球最大規(guī)模中文AI巨量模型。這也代表了國內(nèi)AI巨量模型的一個(gè)新高度。但從參數(shù)量的角度來看，“源1.0”還遠(yuǎn)沒有到盡頭，按照目前這種趨勢(shì)，AI產(chǎn)業(yè)的玩家們對(duì)于更大體量模型的探索仍然會(huì)繼續(xù)下去。

不止于大,從專用智能到通用智能

最近，斯坦福大學(xué)數(shù)十位研究者聯(lián)名發(fā)表《基礎(chǔ)模型的機(jī)遇和風(fēng)險(xiǎn)》綜述文章，認(rèn)為大模型的特點(diǎn)之一是“同質(zhì)化”，好處在于大模型的任何一點(diǎn)改進(jìn)就可以迅速覆蓋整個(gè)AI社區(qū)，但同時(shí)，它也帶來一些隱患，大模型的缺陷會(huì)被所有下游模型所繼承。特點(diǎn)之二是海量數(shù)據(jù)(603138,股吧)訓(xùn)練出的基礎(chǔ)模型具有“涌現(xiàn)”特性，也就是產(chǎn)生未曾預(yù)先設(shè)想的新能力，這種特性有望讓AI具備處理語言、視覺、機(jī)器人、推理、人際互動(dòng)等各類相關(guān)任務(wù)的能力。

這帶來的問題就是，在追求“巨量”的同時(shí)，如何規(guī)避風(fēng)險(xiǎn)，并通過模型激活各行各業(yè)，讓AI落地應(yīng)用？

在浪潮信息副總裁、浪潮信息AI&HPC產(chǎn)品線總經(jīng)理劉軍看來，任何技術(shù)的發(fā)展總有一個(gè)從興起到成熟再到落地的一個(gè)階段，大模型現(xiàn)在正處于興起的階段，大家正在圍繞著模型的體量以及模型體量帶來的精度效應(yīng)來開展持續(xù)的探索，當(dāng)大模型探索走向成熟之后，一定要考慮應(yīng)用的具體問題，比如響應(yīng)化、高性能推理部署等諸如此類的問題。

同時(shí)，劉軍認(rèn)為，AI巨量模型到底要做什么，不做什么，不能天馬行空。“可以從兩個(gè)不同的層面去考慮，一是產(chǎn)業(yè)發(fā)展的層面，產(chǎn)品怎么去滿足客戶、滿足市場、滿足應(yīng)用需要的發(fā)展。二是科研創(chuàng)新，科學(xué)的探索方向，去思考怎么樣和產(chǎn)業(yè)的方向去匹配。“

從“量”上看，“源1.0”相比GPT-3模型1750億參數(shù)量和570GB訓(xùn)練數(shù)據(jù)集，“源1.0”參數(shù)規(guī)模領(lǐng)先40%，訓(xùn)練數(shù)據(jù)集規(guī)模領(lǐng)先近10倍。同時(shí)“質(zhì)”上也達(dá)到了全球領(lǐng)先，“源1.0”在語言智能方面表現(xiàn)優(yōu)異，獲得中文語言理解評(píng)測(cè)基準(zhǔn)CLUE榜單的零樣本學(xué)習(xí)和小樣本學(xué)習(xí)兩類總榜冠軍，測(cè)試結(jié)果顯示，人群能夠準(zhǔn)確分辨人與“源1.0”作品差別的成功率已低于50%。

但單純的追求“大”并不是浪潮信息的目標(biāo)。劉軍表示：“巨量模型不是大公司專享，應(yīng)該成為普惠性的科技進(jìn)步力量，讓行業(yè)用戶甚至是中小用戶也能使用巨量模型尋求深度創(chuàng)新，促進(jìn)業(yè)務(wù)可持續(xù)健康發(fā)展”。吳韶華對(duì)此也表示，巨量模型的發(fā)展并不是真的在比大，大不是目的，最根本的目的，從技術(shù)層面來講就是要追求通用智能，就是從專用智能走向通用智能。

開源開放,從“順勢(shì)而為”到“扶搖直上”

在AICC 2021大會(huì)上，浪潮信息推出“源1.0”開放開源計(jì)劃，“源1.0”將面向?qū)W術(shù)研究單位和產(chǎn)業(yè)實(shí)踐用戶進(jìn)行開源、開放、共享。

其實(shí)，將AI算法模型進(jìn)行開源已經(jīng)是AI產(chǎn)業(yè)的通用做法，但回到浪潮信息自身來看，這一步棋還是有不一樣的涵義。

首先，浪潮信息“源1.0”作為全球最大規(guī)模的中文AI巨量模型，除了規(guī)模大、數(shù)據(jù)大、性能強(qiáng)之外，無論是開放模型API，開放高質(zhì)量中文數(shù)據(jù)集，開源模型訓(xùn)練代碼、推理代碼和應(yīng)用代碼等都需要浪潮信息有強(qiáng)有力的支撐，能夠做好支撐行業(yè)AI開發(fā)者的堅(jiān)實(shí)底座。

先看浪潮信息“源1.0”的開源底氣何來？《逍遙游》中說，“水之積也不厚，則其負(fù)大舟也無力”“風(fēng)之積也不厚，則其負(fù)大翼也無力”，全球最大的中文AI巨量模型誕生，得益于浪潮信息在人工智能領(lǐng)域深厚的積累和不斷的探索實(shí)踐。浪潮信息一直活躍在AI前沿方向，在異構(gòu)加速計(jì)算、深度學(xué)習(xí)框架、AI算法等領(lǐng)域取得了一定的成績。

目前，浪潮信息的AI服務(wù)器市占率已位居全球第一，連續(xù)4年中國市場占比超過50%；在深度學(xué)習(xí)框架領(lǐng)域，浪潮信息先后推出了深度學(xué)習(xí)并行計(jì)算框架Caffe-MPI、TensorFlow-Opt、全球首個(gè)FPGA高效AI計(jì)算開源框架TF2等等。2020年，浪潮信息在人工智能領(lǐng)域的專利貢獻(xiàn)達(dá)到1174件，位居中國前列。

其次，在國內(nèi)已經(jīng)有許多廠商開放AI算法模型的前提下，浪潮信息開放“源1.0”，必然需要走差異化的道路，提供給AI開發(fā)者和產(chǎn)業(yè)不一樣的價(jià)值，如此其開源才有意義。

浪潮信息作為智算中心的提出者，可以讓智算中心這一算力基礎(chǔ)設(shè)施和巨量模型這一算法基礎(chǔ)設(shè)施行成協(xié)同效應(yīng)。因?yàn)榇竽Ｐ偷挠?xùn)練運(yùn)行需要智算中心的基礎(chǔ)設(shè)施，需要算力基礎(chǔ)設(shè)施來作為算力平臺(tái)，兩者的協(xié)同工作，能為產(chǎn)業(yè)AI提供一個(gè)強(qiáng)大的推動(dòng)力。

正是因?yàn)閲鴥?nèi)人工智能產(chǎn)業(yè)的迅猛壯大，才能產(chǎn)生浪潮信息AI服務(wù)器市占率位居全球第一、“源1.0”成為全球最大的中文AI巨量模型這樣的成績，“水大魚大”，浪潮信息不止做到了順勢(shì)而為，還做到了“扶搖直上”，負(fù)產(chǎn)業(yè)之志，然后圖南，浪潮信息“源1.0”有“絕云氣，負(fù)青天”之志，更是中國AI產(chǎn)業(yè)扶搖而上者九萬里的希望所在。

本文首發(fā)于微信公眾號(hào)：略懂的小咖。文章內(nèi)容屬作者個(gè)人觀點(diǎn)，不代表和訊網(wǎng)立場。投資者據(jù)此操作，風(fēng)險(xiǎn)請(qǐng)自擔(dān)。

巨量模型加速形成“馬太效應(yīng)”，但浪潮的“源1.0”開始換了賽道

熱點(diǎn)話題

熱點(diǎn)推薦

頭條