AI 產品或者是智能語音助手,都還處在特別早期的階段。”對于已經發展了十年的智能語音助手,小冰公司 CEO 李笛依然認為其遠遠還未成熟。
十年前,蘋果公司的 Siri 作為智能手機的語音助手正式面世,由此掀起一場風潮,從智能手機、智能音箱,到智能手表、智能耳機,乃至于當下的汽車智能化浪潮,語音助手都成為標配,各家科技巨頭也在謀劃布局。
2013 年加入微軟亞洲研究院的李笛也在隨后推出了智能助理小冰,其也由此成為“小冰之父”。近日,在搜狐科技全新欄目《AI 十二談》首期的直播現場,作為嘉賓之一,李笛表示,自己經常會用智能語音助手,而小冰就是想探索智能語音助手終極形態的產物。
但智能語音助手的終極形態會是什么樣?李笛表示,很難去下一個定義。“是完成任務的,還是無所不能、無所不知的才是最好的助理?很難說,每個用戶有不同的需求。”
這種定義上的不清晰在或許一定程度上也導致了智能語音助手的發展緩慢,“人工智障”的吐槽暴露出其發展中的問題。當下,幾乎所有的智能語音助手都依賴于關鍵詞實現喚醒,但偶爾會出現失靈情況。
不過,李笛表示,智能語音助手最好的方式是不需要喚醒詞,應該像人一樣,能夠判斷人是不是在跟它去交流,同時能夠和人之間不停地邊聽邊說邊想,這就是所謂的全雙工的方式。這在今天可以做到,只不過準確性可能不能用戶所期望的那樣好。
李笛的感覺是,用戶對智能語音助手的期待其實比較高。他認為,Siri 更大的價值是嘗試給智能語音助手一個相對比較擬人化的定位,這給用戶營造了一個非常科幻的很高的期望值。“我們一直都還在為這個期望值而奮斗,努力去達到,但這條路還很長,非常長。”
李笛還分析了智能語音助手答非所問的原因,主要有三方面因素。一是智能語音助手的交互場景缺乏彈性空間,自身很難判斷回答到底好不好,難以形成數據和訓練上的交互回路。
其次,在跟智能語音助手交互的時候,獲得各種各樣的知識和事實的比例很小,更多時候是觀點,而觀點沒有正確與錯誤,且有很多不同分支,這樣給訓練智能語音助手提出很多新的難題。此外,測試者的心態也挺重要,如果測試者不停問智能助手問題,那么語音助手通常表現也不會很好。
盡管智能語音助手還存在不少問題,但目前應用已比較廣泛,未來可能會更加深入,語音交互也被視為新一代人機交互方式。這就伴隨著新的問題,該如何看待智能語音助手的定位?
“如果你把它定位成助理,容忍度不會特別高,但把它定位成朋友,容忍度就會高一些。”李笛說,當我們認為交互的是一個系統時,會把它物化,那么就不會去關注它的其它方面,容忍度也會相應低很多,防備心也會高很多。當把它視為有情生物的時候,它就可以成為對等的交互對象。
他認為,對于智能語音助手來說,真正重要的是越長越好的交互,交互里面的 topic(主題)覆蓋越豐富越好,人的狀態越放松越好。“當更多人在跟智能語音助手交互的時候,它的 topic 分布和其他人的交互 topic 分布越來越接近的時候,表明語音助手越來越被當做一個人來看待。”
但不可否認的是,智能語音助手在給我們帶來便捷的同時,也會存在倫理和隱私問題。李笛提到,全球范圍內,AI 倫理還處于非常早期的階段,數據到底應該怎么使用,應該由企業自己去監督還是怎么樣,數據是不是可以從 A 企業到 B 企業或 B 研究機構,這些都還沒有明確。
“某種意義上,只能靠我們自律。”他說。