楊凈 蕭簫 發(fā)自 凹非寺
量子位 報道 | 公眾號 QbitAI
企業(yè)擁有265萬開發(fā)者是一種什么體驗?
是在最新財報上已經(jīng)商業(yè)變現(xiàn),開放平臺營收增速高達(dá)131%?
是連續(xù)5年在合肥振臂一呼,全球就迅速響應(yīng)?
當(dāng)然,這還不是全部。
在這一次開發(fā)者節(jié)上,科大訊飛(002230,股吧)董事長劉慶峰向全球開發(fā)者,攤開過去一年答卷。
科大訊飛AI開放平臺,至今已有441項核心技術(shù);
每個月平均新增9萬開發(fā)者團(tuán)隊,其中工業(yè)應(yīng)用占比達(dá)到60%;
醫(yī)療AI系統(tǒng)一年給出97萬份修正診療結(jié)果……
而像“遇強(qiáng)則強(qiáng),遇弱則弱”的圍棋機(jī)器人、1分鐘定制專屬AI數(shù)字人、3秒判斷聲音畫像等這些技術(shù)成果更是成為展區(qū)的爆款!
第五屆全球開發(fā)者節(jié)究竟有何看頭?現(xiàn)在就帶你一文看盡。
科大訊飛最新技術(shù)成績
今年1024開發(fā)者節(jié)上,最先登場的科大訊飛董事長劉慶峰披露了取得的一系列最新成績。
其一,AI健康咨詢準(zhǔn)確率超過絕大部分全科醫(yī)生。
在你就診時,健康咨詢AI系統(tǒng)會根據(jù)你的相關(guān)健康狀況,推薦你去對應(yīng)醫(yī)院找專家就診。據(jù)劉慶峰介紹,目前科大訊飛的健康咨詢AI系統(tǒng),已經(jīng)超過96.4%的通過國家考試的全科醫(yī)生。
其二,醫(yī)療AI系統(tǒng)一年給出97萬份修正診療結(jié)果。
在過去一年中,科大訊飛的AI輔助診療系統(tǒng),協(xié)助修正了97萬份安徽省基層醫(yī)生看病的診療初步結(jié)果。依賴于科大訊飛的醫(yī)療AI輔助診療系統(tǒng),安徽基層醫(yī)生合理診斷度已經(jīng)從70分提升到了80分,整體系統(tǒng)準(zhǔn)確率已經(jīng)達(dá)到97%以上。
其三,AI開放平臺核心技術(shù)達(dá)到441項。
2010 年,科大訊飛開放平臺正式上線,集成了語音合成、語音搜索、自然語言處理和語音聽寫等多項能力,成為當(dāng)時行業(yè)內(nèi)開放最早的智能語音平臺。如今,科大訊飛已經(jīng)從最初的3項核心技術(shù),進(jìn)化到今天具備的441項核心AI能力與方案。
其四,1句話就能語音合成1個人的聲音。
據(jù)劉慶峰介紹,科大訊飛正在不斷的持續(xù)打造人工智能的核心技術(shù)的領(lǐng)先引擎,包括無監(jiān)督訓(xùn)練等技術(shù),讓機(jī)器用更小的數(shù)據(jù)、更少的標(biāo)注學(xué)習(xí)更多的知識,現(xiàn)在在語音合成上已經(jīng)實現(xiàn)一句話就能模仿一個人的音色。
在小語種識別上,科大訊飛提出的統(tǒng)一空間表達(dá)的半監(jiān)督語音識別技術(shù),使得研究人員只用100個小時的有監(jiān)督語音和無標(biāo)簽文本數(shù)據(jù)訓(xùn)練,就能達(dá)到之前10000小時有監(jiān)督語音數(shù)據(jù)訓(xùn)練的效果。
其五,用AI讓學(xué)生無效作業(yè)時間平均降低50%。
據(jù)劉慶峰介紹,科大訊飛在安徽合肥率先用人工智能助力“雙減”,利用AI復(fù)雜系統(tǒng),結(jié)合OCR自動評分、語音推理等技術(shù),分析學(xué)生的學(xué)習(xí)情況,對過程性作業(yè)考試數(shù)據(jù)進(jìn)行評價,精準(zhǔn)給予指導(dǎo),將孩子的無效作業(yè)時間平均降低了50%。
這一系列亮眼的成績之上,劉慶峰公開了科大訊飛AI開放平臺2.0戰(zhàn)略,共包括6大措施:
劉慶峰表示,行業(yè)關(guān)鍵問題,需要各行業(yè)的人共同努力:
開發(fā)者可以不了解AI技術(shù),只要有靈感、創(chuàng)意和想象力,就可以加入到AI開放平臺2.0來。
只有生態(tài)的繁榮,才能決定AI的未來。
AI開放平臺2.0升級
接下來,基于過去5年的開發(fā)者生態(tài)積累,科大訊飛總裁吳曉如提出1024計劃5.0——用系統(tǒng)性創(chuàng)新,打造人工智能產(chǎn)業(yè)新生態(tài)。
當(dāng)中最重要的部分,就是AI開放平臺2.0的發(fā)布。
與過去1.0相比,簡單來說,就是二維到三維的升級。
以往的解決方案,都是單向提供給創(chuàng)業(yè)伙伴,但隨著人工智能逐漸向傳統(tǒng)產(chǎn)業(yè)落地,需要解決的問題更為復(fù)雜,需要系統(tǒng)性架構(gòu)來解決。
既然如此,就需要與行業(yè)龍頭打造基線底座模型,再與上下游合作伙伴展開合作,形成完整的行業(yè)方案。
以智慧農(nóng)業(yè)為例。
訊飛就與中國農(nóng)業(yè)大學(xué)展開合作,共同研發(fā)預(yù)測生產(chǎn)模型、澆水施肥模型等,然后提供給傳感器等上下游供應(yīng)商,共同將方案提供給業(yè)內(nèi)的合作伙伴。
目前,科大訊飛首次推出18個行業(yè),并表示將每年投入5億研發(fā)基金,服務(wù)100萬開發(fā)者。
既然如此,那該如何推動開放平臺2.0的戰(zhàn)略?有四大維度。
1、與高校合作開設(shè)人工智能專業(yè),目前已經(jīng)開發(fā)339門課程,培養(yǎng)超60萬開發(fā)者。
2、與合作伙伴籌建智能語音創(chuàng)新中心,為每個行業(yè)制定標(biāo)準(zhǔn)測試環(huán)境。
3、舉辦頂尖賽事,選出行業(yè)標(biāo)桿。正如此次1024開發(fā)者節(jié),就舉辦了兼具行業(yè)應(yīng)用、學(xué)術(shù)研究、公益等105個賽道賽事,共有兩萬多支隊伍報名。
3、孵化創(chuàng)新企業(yè),提供優(yōu)質(zhì)資源。除了中國聲谷之外,訊飛在全國共有十余家雙創(chuàng)基地。
四大技術(shù)方向突破
接著,科大訊飛高級副總裁、AI研究院院長胡國平,就分享了四大技術(shù)方向的突破。
嗯,實際上就是去年發(fā)布的“AI科技樹”,今年已然開出一些果來。
第一項,端到端建模技術(shù)。
這項技術(shù)將前端多路信號直接同步輸入到后端聲學(xué)模塊,來實現(xiàn)更精細(xì)的建模,可實現(xiàn)復(fù)雜(比如嘈雜環(huán)境)場景下的一體化語音識別、語音翻譯等。
在語音識別上,以賣場為例,這項技術(shù)成功將只有35%的語音識別準(zhǔn)確率,提升到了88%;同時語音喚醒的成功率,也成功從40%提升到了90%。
在語音翻譯上,科大訊飛還成功在IWSLT國際口語機(jī)器翻譯大賽的同傳任務(wù)上,包攬了三個賽道的冠軍。
第二項,無監(jiān)督訓(xùn)練技術(shù)。
為了降低對語音合成數(shù)據(jù)規(guī)模的要求,科大訊飛提出了聽感量化編碼,充分借助語音識別數(shù)據(jù)來合成音庫,成功實現(xiàn)了多人混合模型訓(xùn)練。
在小語種識別上,提出的統(tǒng)一空間表達(dá)的半監(jiān)督語音識別技術(shù),使得只用100個小時的有監(jiān)督語音和無標(biāo)簽文本數(shù)據(jù),就能達(dá)到之前10000小時有監(jiān)督語音數(shù)據(jù)訓(xùn)練的效果。
在語音合成上,利用無監(jiān)督訓(xùn)練甚至實現(xiàn)了發(fā)音內(nèi)容、情感和音色分別可控的效果,例如1句話合成語音、方言自由切換等等……
注意,不止是普通的四川和合肥話,科大訊飛甚至開放了6種船新的少數(shù)民族語種:
第三,多模態(tài)融合技術(shù)。
在人機(jī)交互上,現(xiàn)在甚至已經(jīng)不需要喚醒詞了,機(jī)器會看到你的嘴型,從而自動判斷你“是否在對它說話”,并自動做出應(yīng)答,誤喚醒率降低到0.01%。
在復(fù)雜文檔(例如試卷)識別上,多模態(tài)技術(shù)會結(jié)合OCR、手寫數(shù)學(xué)公式識別等技術(shù),將一張紙上的所有信息準(zhǔn)確識別出來,已經(jīng)實現(xiàn)教輔作業(yè)批改準(zhǔn)確率從92%進(jìn)化到98%的效果。
第四,外部知識融入技術(shù)。
我們都知道,做語音交互的AI總是有點(diǎn)“呆”,這是因為它們雖然學(xué)習(xí)了不少技術(shù)知識和新科技,但對人類的一些常識掌握得卻還不夠深。
為了提升AI在這方面的“人情味”,科大訊飛特意將人類的常識和知識整理成一個事理圖譜。
像兒童玩具交互場景中,就包括“搶玩具”“收拾玩具”這樣具體的動作,讓它知道人類平時會做、會說的事情。
這樣,在面對小朋友亂拋玩具時,AI就能從容說出“來收拾一下玩具”這樣的語句,而不是只會幫小朋友一遍遍親自收拾玩具。
又例如電子病歷場景下,運(yùn)用外部知識融入技術(shù)也能讓AI學(xué)習(xí)到人類醫(yī)生看病的經(jīng)驗,最終將罕見病診斷率從87%提升到了93%,整體病情判斷準(zhǔn)確率從92%提升到了95%。
兩大平臺+生態(tài)助力產(chǎn)業(yè)
最后面向合作伙伴,科大訊飛交出自身探索成果——
兩大平臺+兩大生態(tài)。
首先是企業(yè)數(shù)字化平臺的發(fā)布和虛擬人交互平臺的開放。
簡單來說,這個企業(yè)數(shù)字化平臺其實是原來的AI開放平臺基礎(chǔ)上,配置了RPA引擎,從而具有智能化、自動化(RPA)、低代碼、流程管理等特性。
以智能招聘為例,這位“虛擬小助理”可以在前期分發(fā)信息、電話通知等重復(fù)性工作上替代HR的工作,據(jù)稱流程至少提效10倍。
除了企業(yè)數(shù)字化平臺的發(fā)布以外,還開放了虛擬人交互平臺。
值得一提的是,在傳統(tǒng)意義上開放給開發(fā)者外,還接受聲音、形象提供者提供相應(yīng)的數(shù)據(jù),以應(yīng)用于各類應(yīng)用場景。
實際上,在過去一年里,這個交互平臺已經(jīng)在400+個企業(yè)客戶進(jìn)行試點(diǎn),應(yīng)用在了新聞生產(chǎn)、企業(yè)客服、泛娛樂營銷等場景,新增54個形象,匯集了4988份聲音。
接著,就是科大訊飛過去一年中成績最顯著的兩大生態(tài):教育+城市。
在教育生態(tài)上,科大訊飛今年提出了三大計劃,包括教育科研基金資助計劃,即在未來三年投入1個億的科研基金,開展前沿的理論與應(yīng)用的研究;
此外合作伙伴聯(lián)合創(chuàng)新計劃,設(shè)立創(chuàng)新孵化投資基金,每年投入1億元,技術(shù)上提供300人以上的技術(shù)和市場領(lǐng)域的專家服務(wù);
還有教學(xué)教研聯(lián)盟的公益計劃,預(yù)計新增建設(shè)10個區(qū)域聯(lián)合教研機(jī)構(gòu)、100所名校聯(lián)盟新增合作校,推動內(nèi)容共創(chuàng)平臺新增骨干教研員1萬名。
在城市生態(tài)上,據(jù)科大訊飛高級副總裁張友國表示,科大訊飛預(yù)計在2025年的智慧城市中,實現(xiàn)一年銷售收入150億,在“十四五”期間實現(xiàn)約500億收入,其中預(yù)計60%(約300億)的收入,科大訊飛都會分享給生態(tài)合作伙伴。
人工智能的未來:由表及里的生態(tài)
一天發(fā)布會下來,聽到最多的一個關(guān)鍵詞就是生態(tài)。
隨著浪潮向前,人工智能不再像此前那般是一個觸不可及的概念,而是真正普惠于民、用之于民的全民技術(shù)。
“幫助每個人、陪伴每個人、更懂每個人”,這是科大訊飛所描述的AI未來。
而預(yù)見未來最好的方式,就是共創(chuàng)未來。
去年這個時候,劉慶峰在演講的最后提到,唯有生態(tài),才能生生不息。
今年開發(fā)者節(jié)上,“生態(tài)”的味道更加明晰,從技術(shù)、到產(chǎn)業(yè),再到開發(fā)者從內(nèi)到外全面滲透。
作為一家上市13年的老牌企業(yè),正在用這種方式去完成人工智能產(chǎn)業(yè)的全面盛放。
One More Thing
對了,在本次開發(fā)者節(jié)上,還有其他意想不到的亮點(diǎn)。
比如,安徽人余承東回到家鄉(xiāng),在父老鄉(xiāng)親面前“帶貨”。(手動狗頭)
本文首發(fā)于微信公眾號:量子位。文章內(nèi)容屬作者個人觀點(diǎn),不代表和訊網(wǎng)立場。投資者據(jù)此操作,風(fēng)險請自擔(dān)。