圖庫瀏覽完畢
就在今天,科大訊飛公司舉辦了一場 “AI復(fù)始,萬物更新”的主題科技盛會,舉辦地選在高大上的北京國家會議中心。科大訊飛本次年度發(fā)布會被喻為“中國人工智能元年”的收官之作,接連發(fā)布了建立在全新語音交互基礎(chǔ)上的人工智能時代的人機交互界面——AIUI,面向文字工作者的錄音寶、聽見錄音筆以及訊飛聽見網(wǎng)組合式新品,以及展示在教育方面的新成果智學(xué)網(wǎng)、E聽說等ToC端的產(chǎn)品,并闡述了“訊飛超腦”2.0版的科研成果??梢哉f,整場發(fā)布會是中國人工智能領(lǐng)域的風(fēng)向標(biāo)。
在發(fā)布產(chǎn)品前,科大訊飛董事長劉慶峰解釋了當(dāng)下火熱的“人工智能”是什么?人工智能讓機器具備像人一樣的智能,應(yīng)該說是人類在科技和產(chǎn)業(yè)界最偉大的夢想之一。而要把這個夢想照進現(xiàn)實除了有激情有堅定不移的長期的激情堅守之外,還需要腳踏實地一步一個腳印踏踏實實的科技創(chuàng)新,和與之相匹配的各個階段令人尖叫的產(chǎn)品。
隨著技術(shù)不斷進步,2015年12月科大訊飛訊飛語音云平臺上的日訪問量已超10億人次之多。僅僅一款訊飛輸入法就有 2.8億用戶,每天有5000萬人在使用?,F(xiàn)在越來越多的輸入法,越來越多的移動App工具都在使用科大訊飛的語音技術(shù)。那么在輸入的同時,很多的朋友都在問,訊飛輸入法已經(jīng)做到了95%的準(zhǔn)確率,甚至達到98%,能不能在這樣的一個大會的過程中、在老師講課的講堂上能夠同步把語音也給轉(zhuǎn)成文字,便于事后檢索與學(xué)習(xí)。此時,劉慶峰就為我們展示了第一個驚喜,左右兩邊的大屏幕正同步實時轉(zhuǎn)寫今天的全程演講。
當(dāng)年,麥卡錫第一個提出了人工智能的概念,使AI成為了人工智能行業(yè)的名稱,而且發(fā)布了第一個人工智能的系統(tǒng)語言。在此基礎(chǔ)上另外一位計算機大師圖靈獎獲得者明斯基,他明確提出了一套算法,能夠證明第一代神經(jīng)網(wǎng)絡(luò)到底能夠干哪些事情,又有什么樣的缺陷。還有兩位大師在人類歷史上可以說非常耀眼的一個跨學(xué)科專家,既獲得諾貝爾獎也獲得了圖靈獎的西蒙,信息論的創(chuàng)始人也是現(xiàn)在通訊技術(shù)的奠基人香農(nóng)。就是這些專家從計算機,從數(shù)學(xué),從經(jīng)濟學(xué),從通訊,從信息論的角度聯(lián)合的產(chǎn)業(yè)跨界,共同的創(chuàng)新,才推出了人工智能的橫空出世。
一直到2006年深度學(xué)習(xí)的概念被正式提出來,首次證明用這種方法可以進行大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。學(xué)習(xí)能力有了之后,一系列的算法包括深度神經(jīng)網(wǎng)絡(luò)方面的卷積神經(jīng)網(wǎng)絡(luò)、遞歸神經(jīng)網(wǎng)絡(luò)等等辦法,不斷地在語音合成語音識別方面取得突破??拼笥嶏w認為人工智能發(fā)展有一條必由之路——由語音和語言為入口的認知智能的革命。
通過訊飛技術(shù)的進步可以看到,在萬物互聯(lián)時代,什么叫做真正的能夠?qū)崿F(xiàn)人機交互?第一個就是遠場降噪,第二個方言識別,第三全雙工,隨時隨地在聽,第四個自動糾錯,主動糾錯,你可以打斷它,然后多輪對話,上下文相關(guān)。只有這些都具備,才是萬物互聯(lián)時代真正的人機語音交互系統(tǒng)。所以今天科大訊飛首先發(fā)布全新的人機語音交互界面。
進一步以語音為主把圖像把視覺和手寫集合起來,打包集成完整的人工智能功能,命名業(yè)界首個人工智能的用戶交互界面——AIUI。它是一個專門針對人工智能和萬物互聯(lián)的人機交互的專門的界面。具備統(tǒng)一簡潔的交互接口,靈活的能力搭配,離線應(yīng)用和資源,同時具備很強的服務(wù)拓展的功能,兼顧普適性和靈敏的調(diào)動性。未來最新的人工智能成果,都可以放到AIUI的統(tǒng)一界面下。
另外不可不說的是,訊飛發(fā)布的另一款重磅新品組合,訊飛聽見網(wǎng)站、訊飛聽見錄音筆以及錄音寶,便于高效的知識管理。大會的產(chǎn)品發(fā)布,可以同步的語音自動轉(zhuǎn)寫,然后在大屏上顯示。訊飛聽見,是給聲音插上文字的翅膀。因為聲音原來是不能看只能聽到,現(xiàn)在一小時聲音5分鐘讓你看完。
比較有趣的是,現(xiàn)場科大訊飛還邀請了五位行業(yè)持證速記員參與本次大會的全程記錄,與科大訊飛的會議音字同步系統(tǒng)進行一場“有聲”的較量。通過大屏幕我們可以看見字幕同步的準(zhǔn)確率相當(dāng)高,連標(biāo)點符號也能根據(jù)發(fā)言人的語氣來標(biāo)識,甚至有點讓人懷疑是不是語音技術(shù)的產(chǎn)物。
科大訊飛發(fā)布的第三款更加特別,并不是一款產(chǎn)品,而是訊飛人工智能的推理和學(xué)習(xí)能力。以高考為例,訊飛正在承擔(dān)一個重大的項目——高考機器人??拼笥嶏w通過人工智能技術(shù)可以得知每個孩子,在上課過程中、課后作業(yè)以及每一次考試和訓(xùn)練過程中,他的知識掌握情況,分析出每次考試的知識薄弱環(huán)節(jié)……主要是智學(xué)網(wǎng)、E聽說兩款深入學(xué)校、家庭、孩子的產(chǎn)品。
劉慶峰在最后說的一句話,人工智能那些事表示很贊同。科大訊飛堅定不移地認為人工智能一定是為人類服務(wù)的,是用來延展我們?nèi)祟惖哪芰Φ摹kS著我們?nèi)祟惖哪芰νㄟ^萬物互聯(lián)時代的語音和語言交互,使我們的智慧可以在后臺進行碰撞進行比對相互啟發(fā)獲得靈感,我們?nèi)祟惖娜后w智慧會上一個巨大的臺階。
隨后,科大訊飛研究院院長胡郁先生詳細講解了人工智能的相關(guān)問題,深入淺出地說明科技起源、歷史沿革及未來發(fā)展,時不時地透露科大訊飛的技術(shù)進展。
現(xiàn)階段,科大訊飛已經(jīng)可以用人工智能技術(shù)來“調(diào)侃”作詩,胡郁表示只是目前的一個基礎(chǔ)應(yīng)用,其后會有更出彩的表現(xiàn)。
臨近結(jié)束,主持人公布了一組驚人的數(shù)字,在遠場情況、會場噪聲等復(fù)雜條件下,本次大會的音轉(zhuǎn)文字正確率高達99.4%,高于速記員手工錄入文字的準(zhǔn)確率??拼笥嶏w也表示,音轉(zhuǎn)文字是當(dāng)下都市生活的一種經(jīng)常性需求,如此高精準(zhǔn)的轉(zhuǎn)寫率具有極高的實用價值。
從本次科大訊飛發(fā)布的產(chǎn)品看,人工智能技術(shù)帶來的想象空間更寬廣。在現(xiàn)場,演示人員利用語音對話進行訂票、改簽、空調(diào)開啟調(diào)節(jié)、加濕器控制、機器閱卷(批改作文)等方面,儼然是一個生活中面面俱到的小助手,在沒有屏幕的情況下,全程實現(xiàn)語音交互。