人工智能是一門涉及非常廣泛的科學,包括語音識別、語音合成、感知智能等,其中人工智能語義也是非常重要的板塊。2018年7月6日,在深圳舉辦的首屆零一科技節中,三角獸科技創始人兼COO馬宇馳先生就為我們重點講述了究竟什么叫人工智能語義。
三角獸是一家人工智能語義公司,基于大數據和深度學習算法,提供對話式交互解決方案和端對端交互系統,大幅提升效率,降低成本。公司有由來自微軟、百度、阿里、IBM、樂視等企業的資深算法工程師團隊和連續創業經驗豐富的市場運營團隊。三角獸目前已經與微軟、百度、中國移動、富士康、新浪、小米、錘子、恒生、Rokid等達成合作,是國內人工智能語義領域發展最快,技術應用落地領域最廣的公司。
馬宇馳認為, 國內95%甚至更多打著人工智能標簽的公司都是偽人工智能,人工智能和非人工智能一個比較大的差別,即機器學習和深度學習的算法上面分別占了多大的比重?以及人工的部分占了多大的比重?真正的人工智能公司,要在算法的層面占到很大的比重,可以用機器去處理事情,而不是通過人。那么人工智能語義是什么?
據馬宇馳介紹,人工智能語義相當于腦,做的是大腦負擔的事情,負責看懂聽懂自然語言。例如我們說1、2、3、4,大屏幕就會顯示出來1、2、3、4,這個是把聲音轉成文字,而智能語義就是負責在轉成文字之后,怎么去處理它,回應它。
馬宇馳還說到,人工智能語義分為三個部分。第一個是語義理解,就是讓機器聽懂人話,并且給你回饋。我們每個人每天對手機有很多操作,無論復制、剪切,在APP當中查找東西,還是說你自己腦子里記住了跳到百度搜索引擎或者跳到哪里查找,這里相當于你有大量動作,從一個里面跳到另外一個里面,智能語義能解決你手機里任何一段文本,不管長短,當你要對它做一個動作的時候,我們就會給到相應你想要的一些資源、信息、服務等等。
第二個是開放域聊天。開放域聊天就是閑聊,例如小米音響,你可以跟它說任何話,它都會給一個相關性極高的回復,這個我們叫開放域聊天。這和原來市面上做的聊天有一個本質的差別,其他的公司主要是用庫和關鍵字。比如,我們正常聊天的時候會有很多問題,那機器如何去回答呢?這就靠關鍵句抓取,實在不行鏈接到百度百科、鏈接到知識上,構成幾十萬的庫。但我們的開放域聊天系統,已經上線的語料是接近70億種,這個是目前中文系統上最好的聊天的部分,這部分我們是百度、微軟、BAT的金牌合作方。
第三個部分,任務驅動的多輪對話,是大家更容易看到和理解的,例如很多機器人訂餐、訂票的應用。舉一個例子,大家看到谷歌開發者大會上那個訂做頭發和訂晚上吃飯位置的聲音,那是一個TDS合成的聲音,像人的聲音一樣,但是投入成本非常高,這其實是在技術上包裝了一層場景。
最后,馬宇馳談到如何用技術眼光看待產品?很多人工智能公司喜歡單獨秀一個沒有技術壁壘的應用場景。比如問機器鄧超和他老婆演過什么電影?這個從影視庫和電影演員庫做一些基礎關聯就OK了。真正的技術壁壘是在對你說話時吞字、落字的識別,比如有部電影叫老公們的私房錢,你說了男人們的私房錢,機器也可以識別出來,這個叫模糊語義理解,咱們聊天可能有一兩個字是錯的,但是這句話你能理解是什么意思,這個才是語義。相當于我們的大腦,會自己去識別和思考。我們今年還會有更多的產品落地,目前包括小天才手表,米2,百度小度2S的兒童版聊天、成人版聊天等等。
為什么參加零一科技節?
馬宇馳認為零一科技節通過沉浸式場景布置,推動了科技落地以及加快了AI商業化進程,這是一件非常有意義的事情。在人工智能行業,沒有投入商業應用的產品與技術并無價值,只有將技術方案化的落地到實際場景,實現行業的降本增效才有意義。零一科技節為參展的企業打造了一個全場景商業空間,將每一項技術、每一款產品進行了有機整合,幫助科技產品找到市場應用場景,推進AI行業落地進程。