新智元報道
編輯:Q
【新智元導讀】1024開發者節大會上,訊飛聽見發布「智慧辦公服務平臺」,讓辦公不止于「聽見」。
智能語音,一直被認為是人工智能時代各種終端的「入口」,長期以來都是各大公司的「必爭之地」。
在剛剛過去的1024開發者節上,科大訊飛(002230,股吧)向我們展示了虛擬人交互,多模態等多種前沿技術的落地應用,更是將400多項能力開放給數百萬開發者使用,其中就包括多項科大訊飛深耕多年的智能語音技術。
在大會的現場,訊飛聽見同傳為大會提供了實時語音轉寫翻譯服務,為遠程觀看的觀眾提供更貼心的雙語字幕。同時,諾貝爾獎得主Michael Levitt、國際人工智能聯合會議主席Michael Wooldridge在發表主題演講時,通過訊飛聽見同傳提供的出色同傳服務與現場觀眾更好的交流。
通過多年來無監督訓練、多模態融合、人機協同進化等核心技術的提升,科大訊飛在最擅長的語音方面有了質的飛躍:模仿一個人的聲音,已經從最初的一周時間,到后來的一天時間,再到之后的3個小時,而現在則發展到僅需要一句話即可完成模仿。甚至通過一句話,AI程序就能做出用戶畫像,大致判斷出年齡、性格、喜好等特點。
此外,在語音識別和翻譯領域,現在用100小時的訓練就可以達到此前1萬小時的訓練效果。
智能語音領域的「先行者」
根據數據顯示,2020年中國的人工智能軟件及應用市場規模達272億元人民幣,預計未來三年將繼續保持高速增長的態勢。
來源:易觀分析的《中國智能語音轉寫工具行業洞察2021》報告
在語音識別和智能語音領域,科大訊飛一直處于全球領先的行業地位。作為人工智能國家隊,科大訊飛在「讓機器能聽會說、能理解會思考」這條技術道路上堅持攀登21年,在26日發布的第三季度報告中,前三季度營收108.68億元,同比增長49.2%。
對于智能語音領域來說,目前語音轉寫服務是重要的一環。在易觀發布的《中國智能語音轉寫工具行業洞察2021》報告中,「訊飛聽見」的品牌知名度、用戶好感度等均表現搶眼,在品牌知名度上更是以90%的成績位列榜首。
來源:易觀分析的《中國智能語音轉寫工具行業洞察2021》報告
訊飛聽見作為科大訊飛語音轉寫及翻譯的重要業務承接,核心功能就是語音轉文字和翻譯,與其他類似競品相比,有很多獨有的功能,更加考慮到用戶需求的方方面面。
在訊飛聽見的網站、APP上可以上傳音頻和視頻,并在提交后快速轉寫為文字,轉寫準確率最高達97.5% ,還可以對轉寫結果實時編輯,并支持一鍵導出word、txt、鏈接等多種形式,訊飛聽見智能云更是通過「可信云」評估,錄音文本全程加密處理,全程保證音頻內容的隱私安全。
此外,轉寫成功后還支持「拖動音頻定位文字」或者「點擊文字定位音頻」,極大的提高了效率;現在還支持語氣詞過濾,讓人工干預的環節更少。
找翻譯的過程也同樣簡單,訊飛聽見官網、APP現在支持兩種翻譯模式,上傳文檔后,既可以選擇快速機器翻譯,也可以選擇不同等級的人工翻譯,滿足不同用戶細粒度的需求。
對于轉寫來說,訊飛聽見目前已經支持10種國家語言、2種少數民族語、12種中文方言轉寫服務;對于翻譯來說,支持9國語言的多語種翻譯。
目前,訊飛聽見的錄音轉文字、在線云會議成為C端市場的重要功能,「訊飛聽見」網站和APP是重要入口。
不止于「聽見」,更是智慧辦公平臺
「訊飛聽見」在成立之初依托于科大訊飛深耕多年的自然語言處理、聲紋識別、語音識別、翻譯等核心技術,以轉寫和翻譯為技術核心。在本次1024開發者節大會上,科大訊飛副總裁、聽見科技總經理王瑋宣布訊飛聽見正式發布”智慧辦公服務平臺”,并向AI+辦公時代全面邁進。
改版后:訊飛聽見官網首頁
www.iflyrec.com
訊飛聽見網站在本次「智慧辦公服務平臺」發布后,將以「智慧辦公」、「語音語言服務」兩大版塊為核心,將原有的語音轉寫服務升級為以轉文字、云會議、拍字幕、找翻譯、智能硬件、行業解決方案等為核心的智慧辦公系列產品和服務平臺,可滿足多場景、多終端、多形式的辦公需求,致力于全方位提高知識管理的效率。
在云會議的場景中,除了超高的語音識別率之外,訊飛聽見會議還支持實時字幕、實時翻譯、中英文發言隨意切換、會后自動生成會議記錄、一鍵區分發言人、按句回聽等實用功能,助力高效整理會議內容。
對于自媒體行業的從業人員來說,添加字幕是個非常費時的工作,通過「訊飛聽見字幕」功能,既可以智能生成時間軸添加時間碼,也可以快速翻譯添加雙語字幕。
?
除此之外,對于在線培訓行業,也可以一鍵壓縮并導出帶字幕視頻;綜藝節目的后期編輯也可以通過多格式字幕文件對接各種專業視頻剪輯工具,滿足各種定制化的需求。
除了在錄音/語音轉寫文字、云會議、同傳翻譯、字幕等領域充分利用自身「大轉寫」技術,訊飛聽見更是在C端硬件產品上陸續推出高性價比的智能錄音筆A1/B1/H1、智慧屏、智能會議系統等產品,并可以為企業提供定制化的AI+辦公整體解決方案(具體可見文末視頻號演示)。
從最初的翻譯和轉寫,到現在的在線會議、自動添加字幕、多語種翻譯等功能,訊飛聽見已經服務超過1900萬客戶,賦能各行各業,累計轉寫時長超7000萬小時。
本次“智慧辦公服務平臺”的發布,從業務類型上展現了AI語音轉寫翻譯的功能整合及生態鏈路完善,并向AI+辦公方向全面邁進。
今年8月,Facebook最新推出了一個VR版的開會應用Workrooms,每個人都能用自己的虛擬形象,和同事坐在虛擬桌前一起開會。或許不久的將來,訊飛聽見也能通過自身積累的底層技術,實現智慧辦公3.0的「元宇宙」時代。
?
AI 有速度,科技有溫度
在生態的打造方面,訊飛聽見今年表現強勁;在業務發展上,也有很大的突破:2021年初,科大訊飛副總裁、聽見科技總經理王瑋代表科大訊飛與全國人大信息中心進行戰略簽約,這也是全國人大首次與人工智能服務企業進行深度業務合作。
而在社會責任,無障礙方面,訊飛聽見也一直致力于無障礙溝通建設上。
技術發展的最終意義,歸根到底還是讓人們擁有更美好的生活,而訊飛聽見的使命,除了讓辦公更高效,讓生活更簡單,最重要的更是用人工智能建設美好世界。
訊飛聽見聯手中國聾人協會發起的「聽見AI的聲音」公益活動已經邁入第三年,由訊飛聽見持續為聽障人士提供終身免費轉寫服務和云會議服務,幫助他們更好地工作和生活,與世界溝通。截至目前,訊飛聽見已為聽障人士提供2800萬分鐘的無償服務。
今年,訊飛聽見為聽障人士提供的關愛權益也在升級:除了訊飛聽見APP為所有聽障人士免費提供實時語音轉文字服務之外,還新增永久免費開放「訊飛聽見會議服務」(含會中實時轉寫及翻譯),進一步助力辦公學習無障礙。
此外,訊飛聽見還聯手B站推出了「無障礙直播間」,首次采用實時AI字幕,單日使用AI實時字幕人數突破127萬,讓更多聽障人士也能享受直播賽事的熱情與激動。
越來越多的科技公益,正不斷用技術改善這個世界,而訊飛聽見也讓越來越多的溫暖,傳遞給每一個人。
未來,期待更多像訊飛聽見一樣的人工智能企業,讓更多的前沿技術持續落地,讓算法和代碼助力每個人實現夢想。
點擊「閱讀原文」,下載訊飛聽見APP,感受AI語音轉寫的強大 。
本文首發于微信公眾號:新智元。文章內容屬作者個人觀點,不代表和訊網立場。投資者據此操作,風險請自擔。