
Artificial Fiction Brain (Wikipedia)
北京時間5月19日凌晨1點,本屆谷歌I/O開發(fā)者大會在加州舉行。延續(xù)此前AlphaGo的話題度,人工智能不出意外成為貫穿全場的主題。
首先也是重點被介紹的便是Google Assistant,新任谷歌CEO Sundar Pichai介紹道,它能夠跟你對話,聯(lián)系上下文語境,甚至幫你做出決策。谷歌希望它不僅僅是Android手機里的一個語音助手,還想讓它連接智能手表、智能汽車、電腦、客廳等。
聽起來很熟悉是不是?沒錯,就在上個月,百度推出的度秘機器人入駐肯德基智能概念店,成為了一名真正落地現(xiàn)實生活的智能小服務生。

百度度秘機器人入駐KFC智能概念店
顧客:“我要一個2號度秘能量套餐,九珍果汁可以換成可樂嗎?”
度秘:“好的,您確定要換成可樂嗎?”
顧客:“是的。”
聽起來是不是覺得很好玩,其實這就是具備了簡單人類思維意識的人工智能產(chǎn)品。消費者不但能夠用日常語言和餐廳里的人工智能機器人對話,完成從點餐到支付的智能點餐交互,還能夠通過全息投影技術,現(xiàn)場感受人工智能機器人,進行零距離互動。
不同于谷歌的初步嘗試,度秘已內嵌到搜索引擎中供用戶正常使用多時。從百度世界大會推出度秘,到谷歌I/O開發(fā)者大會將Google Assistant提上日程,不難發(fā)現(xiàn),人工智能生活化場景愈發(fā)成為IT巨頭的著力點。目前,全球最大的兩個深耕人工智能研究的公司谷歌和百度,在人工智能上生活應用中都做到了哪一步呢?人工智能的未來發(fā)展趨勢又是怎樣?在AI發(fā)展上,中國處在哪一梯隊上?我們不妨趁著谷歌I/O大會好好梳理一番。
搜索是最大的導流入口,得流量者坐擁天下,百度和谷歌早年都以搜索引擎為發(fā)展起點逐漸成長為復合型科技公司,所以選取這兩家作為對比最能說明問題,除此之外:
(1)4月13日下午,百度CEO李彥宏通過內部郵件宣布百度業(yè)務架構重組,劍指谷歌。

最新的百度業(yè)務架構重組圖(2016年4月)
早在去年8月,谷歌宣布成立新的母公司Alphabet,谷歌納入旗下成為全資子公司,將許多非互聯(lián)網(wǎng)核心業(yè)務剝離谷歌獨立運營。

最新的谷歌業(yè)務架構重組(2015年8月)
(2)均以搜索引擎起家,各自發(fā)展成為雄踞東西方的霸主,在人工智能方向上的布局非常相似,大部分產(chǎn)品已經(jīng)很好地投入使用。
(3)谷歌曾有多名優(yōu)秀人才流向百度,包括但不限于:谷歌大腦之父Andrew Ng(吳恩達)、王勁、劉駿、鄭子斌以及新貴教主樓天城(ACRush)等。百度一向對高端人才求賢若渴并且毫不吝嗇,業(yè)內廣為流傳“百度是靠技術引領,騰訊是靠產(chǎn)品引領,阿里是靠運營和HR引領”。

關于ACRush加盟百度美研的知乎提問:
https://www.zhihu.com/question/43704320

Andrew Ng發(fā)Twitter和Facebook歡迎樓天城加盟百度美研
近年來,百度和谷歌均在人工智能方面投入了巨大的財力和精力,百度已經(jīng)超越余凱引領IDL的時代,而谷歌也早已不是墻內人民廣泛意識中的Google X Lab那么簡單。總體上看,百度開發(fā)的度秘、語音 / 圖像識別與搜索、無人車、機器翻譯等都已成功植入到各條產(chǎn)品線投入使用;谷歌開發(fā)的DeepMind AlphaGo、開源深度學習系統(tǒng)TensorFlow、智能化家居、Google Now、語音 / 圖像識別與搜索、無人車、機器翻譯中有一些還處于科研探索階段,有一些收購以后還沒有比較實用的產(chǎn)出,業(yè)務布局廣而泛。
百度部分
(1)度秘 / 小度機器人

度秘 / 小度機器人
度秘是2015年百度世界大會上百度首度推出的為用戶提供秘書化搜索服務的機器人助理,它能夠通過自然的交互方式,依托強大的智能搜索技術,在準確理解用戶意圖的基礎之上,與用戶進行信息、服務、情感的交流。

App端調用度秘演示
不同于常規(guī)搜索引擎一問一答的交互模式,度秘機器人的核心功能在于能簡單模仿一顆真實人腦與用戶進行實際輪詢問答,文本、圖片或語音多模態(tài)輸入皆可。雖然現(xiàn)在技術還不夠智能和完善,但是這種脫離解集合約束的開放性強人工智能模式代表了未來必然的發(fā)展趨勢,要想讓機器模擬人腦的思維意識,需要用到很多技術才能精準定位用戶真正的需求,以度秘的技術架構為例,交互層需要用到多模交互技術,對用戶的文本、圖片或語音輸入進行智能識別,轉換成計算機能夠理解的中間狀態(tài),再由調度系統(tǒng)從搜索引擎中(包括O2O服務、互聯(lián)網(wǎng)大數(shù)據(jù)和知識圖譜等)尋找相關解決方案推送給用戶。

度秘的技術架構分解示意圖

入職KFC的智能點餐機器人度秘
類似的嵌入定制化智能點餐交互服務可以讓人工智能從線上走到線下,從學術化走向商業(yè)化,從“聽”和“說”向溝通進化。
(2)語音識別與搜索
在基于深度學習的語音識別達到比較理想的商業(yè)化狀態(tài)后,讓語音交互變得更加智能成為科學家們的下一個研究課題。舉個簡單的例子,當你想了解黃曉明的家庭成員時,一般會在搜索框中輸入“黃曉明的老婆是誰”,返回結果為Angelababy,如果想繼續(xù)知道“黃曉明的媽媽是誰”,就必須重新輸入這整句話才會得到結果。試想一下如果搜索引擎具備了人腦的思維方式,整個過程將會變成:“黃曉明的老婆是誰”→“Angelababy” →“媽媽呢”→“張素霞”,相當便捷。如果將這種搜索方式以語音的方式交互,省去在小塊手機屏幕上打字輸入的煩惱,對搜索用戶體驗將帶來極大的提升,這就是百度的語音搜索功能。語音搜索是一個結合多種人工智能技術的典型應用,包括但不限于語音識別(speech recognition)、自然語言處理(natural language processing, nlp)、機器學習(machine learning, ml)和對數(shù)據(jù)的挖掘(data minging, dm)和呈現(xiàn)(data visualization),可以通過語義理解與多輪對話精準識別你的需求,帶有一定的思考判斷能力。可以預見的是,語音搜索已經(jīng)開始應用到智能硬件服務、汽車導航助手、基于語音特征的金融支付、新聞媒體和咨詢顧問等行業(yè)中了。

具有多輪對話功能的百度語音搜索
(3)圖像識別與搜索
豐富的社交網(wǎng)絡讓人人自帶媒體屬性, 情感在互聯(lián)網(wǎng)上被肆意發(fā)泄,可以無時無刻分享心情和照片。最近幾年因深度學習被大力推崇與發(fā)展,搜索功能也變得不再單一,尤其是語音和圖像搜索與識別技術開始大放異彩,無數(shù)科學家前后投入希望搜索引擎更加智能地服務用戶。比如哪一天你在朋友圈刷到一張美女明星圖,不追星的你出于對美女的鐘愛也很想知道這是哪位明星以及她的基本資料,只要將圖片保存后上傳到圖像搜索引擎中分析識別即可。

基于海量數(shù)據(jù)的百度圖像識別
(4)無人車

百度無人車
去年12月,百度宣布百度無人駕駛車國內首次實現(xiàn)城市、環(huán)路及高速道路混合路況下全自動駕駛,從位于北京中關村軟件園的百度大廈附近出發(fā),駛入G7京新高速公路,經(jīng)五環(huán)路,抵達奧林匹克森林公園,并隨后按原路線返回。百度無人車的核心技術是百度汽車大腦,由百度地圖提供高精地圖、高精定位和智能決策與控制,人工智能技術提供感知語音 / 圖像感知與識別技術。其中:
● 百度超級計算機Minwa在一項以 ImageNet 對象分類為基準的人工智能測試中,圖像識別的錯誤率僅為4.58%。
● 在國際通用街景數(shù)據(jù)集KITTI的車輛識別準確率達到89.32%。
● 漢語安靜環(huán)境普通話語音識別的準確率接近97%(NCMMSC2015)。
都處于行業(yè)領先水準。
谷歌部分
(1)DeepMind
2014年1月,谷歌以4億美元收購了英國深度學習算法公司DeepMind,經(jīng)過近兩年多的發(fā)展,DeepMind開發(fā)的圍棋對弈系統(tǒng)AlphaGo在新世紀人機大戰(zhàn)中4:1擊敗韓國圍棋冠軍,一鳴驚人。翻閱官網(wǎng)可以發(fā)現(xiàn)DeepMind的Publication相當high level,發(fā)過Nature這樣的頂級科學期刊,也有NIPS和ICML等這樣的頂級國際會議錄入,科研水準絲毫不輸于給同當量的任何一個公司,在工業(yè)界十分難得。

DeepMind的Publication列表
(2)語音 & 圖像識別與搜索
谷歌早在14年就開發(fā)了一套能夠整合公司海量數(shù)據(jù)的語音系統(tǒng),它能使計算機“聽懂”和“思考”說話人向系統(tǒng)輸入的語音指令,并且準確率高達98%,后續(xù)在此基礎上又推出了Google Now語音助手,可惜由于版本限制和國情因素在中國的普及率很低。此次谷歌力推的Google Assistant,業(yè)內將其視作高配版的Google Now。
同年8月,谷歌通過收購圖片分析公司Jetpac加強了自身在圖像識別方面的能力。
(3)自動駕駛汽車
谷歌是最早在無人駕駛汽車方面投入的公司,這一方面甚至遠遠領先于傳統(tǒng)的汽車廠商。目前谷歌的無人駕駛汽車已經(jīng)累計行駛了150萬英里路程,無論是從技術還是產(chǎn)品形態(tài)上谷歌無人車都是世界領先地位的,遺憾的是今年初谷歌Lexus無人駕駛汽車竟然在以2英里速度行駛的狀態(tài)下與一輛公交車相撞,并且該起交通事故的責任方就是谷歌,在這次事故中體現(xiàn)出了智能系統(tǒng)沒能完全判斷準確人類的行為,直接將民眾對無人駕駛的信任打擊得消失殆盡。
或許是因為谷歌無人車在智能系統(tǒng)上還有待完善,盡管此前媒體預測谷歌在總部開I/O大會可能是為了更好展示無人駕駛汽車,但會上谷歌并沒有談這個話題,無人車僅僅成為場外的一道風景線。

谷歌的無人駕駛汽車
(4)智能家居生態(tài)系統(tǒng)建設
14年1月,谷歌以32億美元收購了智能家居制作商Nest;14年6月,谷歌通過Nest花費5.55億美元收購了基于云端的家庭監(jiān)控Dropcam;14年10月,收購了智能家居中樞控制設備公司Rovolv;15年10月,又花3億美元投資了前谷歌員工創(chuàng)立的智能手表公司出門問問,幫助Android Wear落地中國。關于這一塊,我曾在《谷歌返華:誰會看好,誰在唱衰,誰會恐慌,誰又在期待》(http://www.huxiu.com/article/132799/1.html)有過具體分析。
(5)開源機器學習平臺TensorFlow
TensorFlow一度被譽為是人工智能領域的安卓系統(tǒng),其原型可以追溯到2011年開發(fā)的深度學習基礎架構DistBelief,可以在小到一部智能手機、大到數(shù)千臺數(shù)據(jù)中心服務器的各種設備上運行。TensorFlow在很多地方都能應用,如語音識別、自然語言理解、計算機視覺、廣告等。已支持CNN、RNN和LSTM算法,這都是目前在Image、Speech和NLP中最流行的深度神經(jīng)網(wǎng)絡模型。
以上,便是百度和谷歌在人工智能方面的產(chǎn)出概況。谷歌的Google X思維比較天馬行空,雖然成果多點開花,但后期基本靠收購中小型新興企業(yè)來擴充創(chuàng)新產(chǎn)品線,再者由于中國國情特殊,對中國民眾來說關于谷歌往往只停留在新聞媒體了解的階段。百度雖是后起之秀,但由于適應國情,不斷自我調整產(chǎn)品適應民眾,戰(zhàn)略重心從本土到國際,在中國一直處于絕對領先地位,正如普利策獎得主、《紐約時報》駐硅谷記者約翰•馬爾科夫所言,相比于程序化的計算,人工智能的價值其實更在于那些人們習以為常的小事,比如倒一杯咖啡,照顧小孩這樣。而今天,這樣的人工智能正在走進我們的日常生活。也許不到10年,我們每一個人都會變成人工智能的受益者。
特別提醒:本網(wǎng)信息來自于互聯(lián)網(wǎng),目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點。其原創(chuàng)性以及文中陳述文字和內容未經(jīng)本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,并請自行核實相關內容。本站不承擔此類作品侵權行為的直接責任及連帶責任。如若本網(wǎng)有任何內容侵犯您的權益,請及時聯(lián)系我們,本站將會在24小時內處理完畢。