在7月3日的“Baidu Create 2019”百度 AI開發者大會上,百度首席技術官王海峰博士正式發布了百度大腦5.0。這可以說是百度大腦史上最具跨越性的一次重磅升級,在算法創新、AI計算架構層面均實現重大突破。當天下午,百度大腦分論壇如期舉行。眾多百度技術大佬們在兩個半小時內悉數登場,解密十余項AI前沿技術的最新進展。
其中,百度AI技術平臺體系執行總監吳甜圍繞百度語言與知識技術的整體布局,做了詳細介紹。語言方面,百度大腦推出知識增強語義理解框架ERNIE,以及兼具高準確、低時延的機器同傳技術;知識方面,全面解析基于百度知識圖譜技術的視頻語義理解能力。同時,重磅推出行業知識圖譜平臺和智能創作平臺2.0兩大應用級平臺。
核心算法全面升級 保持業界領先水平
在語言與知識技術中,語義理解是重要的基礎之一。吳甜介紹了近期百度大腦在語義理解上的重要突破,推出基于知識增強的語義理解框架ERNIE。“不僅在學術界的公開數據集上,ERNIE也一直在百度實際的應用中展現實力,比如智能問答、CPR預估、文本潤色、對話理解等等,”吳甜說到。截至目前,ERNIE已經學習了超10億知識。由此,ERNIE全面刷新中文NLP任務的效果,成為業界效果最好的語義理解框架,幫助AI更深度地理解真實世界。

機器同傳方面也有最新進展,在翻譯過程中對語音識別結果進行糾錯的聯合詞向量編碼技術,可解決翻譯一致性和連貫性問題的語篇翻譯模型等,結合先進的語音技術,百度大腦實現了高準確、低時延的端到端機器同傳技術。在本次大會上,現場聽眾掃描二維碼,即可通過手機同步收聽機器同傳流暢、自然播報的聲音,獲得沉浸式體驗。
知識,能幫助AI更深度地理解真實世界。在主論壇中,王海峰用近期熱映的音樂紀錄片《大河唱》,形象展示了融合百度知識圖譜技術的視頻語義理解能力。該技術通過對視頻的多模態知識解析,在多元異構知識圖譜上建立關聯,并通過計算推理,建立對視頻的深度語義理解。
解密百度語言與知識技術平臺全貌
百度在語言與知識技術方面的重大更新,依靠的是在該領域的長期積累。現場,吳甜展示了百度語言與知識技術開放平臺的全景圖,其中不僅有豐富的基礎技術,還有包括翻譯開放平臺、UNIT平臺、行業知識圖譜平臺和智能創作平臺在內的4個應用級平臺。
“從使用規模、便捷性和價值來看,這是NLP和知識技術大生產平臺。”吳甜這樣介紹百度語言與知識技術開放平臺。30多項技術供給,多樣、靈活、可定制的服務方式,多套場景技術方案以及全面領先的多語言與知識技術,包括最好的中文語義理解框架ERNIE以及最大的多元語義知識圖譜等,使得平臺具有很好的便捷性價值。目前,平臺日均調用量達千億級,吸引了20萬開發者,綜合規模巨大。今年,百度基于飛槳(PaddlePaddle)平臺正式開源了百度多年積累的中文NLP工具和數據集Paddle NLP,吳甜表示,Paddle NLP的發布是開源、開放、大生產平臺階段一個重要的里程碑。
應用級平臺再升級:行業知識圖譜、智能創作2.0
在吳甜的發言中,兩大應用級平臺的重磅新發布作為壓軸戲登場,一是行業知識圖譜平臺,二是智能創作平臺2.0。
行業知識圖譜平臺基于領先的知識圖譜核心技術,提供智能高效的知識生產流程、低成本啟動和跨行業遷移的能力,幫助產業開發者定制行業知識圖譜并應用。
行業智能化的大量需求,對行業知識的積累和應用帶來了巨大的挑戰。后者的知識構建通常需要領域專家參與,而傳統知識圖譜耗時、耗力、成本高。吳甜進一步解釋道,百度打造了行業知識圖譜平臺,旨在能通過百度自身積累的知識圖譜技術,實現行業知識自動獲取和應用,助力企業實現智能化升級。百度行業知識圖譜具有深入復雜和專業兩大特點,且具備遷移學習能力,低成本啟動,能幫助產業開發者定制行業知識圖譜并應用。
同時,吳甜還向現場觀眾介紹了升級后的百度大腦智能創作平臺2.0。如果說去年百度世界大會上發布且在今年4月完成能力全面開放的智能創作平臺1.0,是讓創作者從枯燥和繁忙的“趕稿”日常中解放出來,那么2.0版本塑造的是更智能、更貼心的自動創作服務。據吳甜所說,智能創作平臺2.0具有三大特點。
一是實時熱點關聯豐富素材,以知識圖譜為基礎,提供熱點事件、熱詞關聯和事件脈絡等不同角度的素材,包含文本、圖片、視頻等多種模態,為創作者提供新鮮、實用的創作靈感和素材支持,讓撰稿者不再談“熱點”色變。二是全面的創作輔助能力,該平臺提供了全面的創作輔助能力,例如快速創作時效性內容的自動創作功能、幫助創作者優化文字細節的糾錯和潤色功能、在發布內容前補充信息的自動標簽和摘要功能等。三是領先的多模生成技術,以短視頻為例,多模態是內容創作的重要趨勢。綜合利用百度視覺、語音、文本的多模態理解能力,百度研發了自動根據圖文創作視頻,以及根據視頻創作圖文的先進技術。這些技術可以幫助創作者高效完成多種模態的內容生產。
語言與知識技術是機器與人交流、理解真實世界的重要基礎,百度大腦在此方面的系列創新,拉近了人與機器的距離。在最后,吳甜在大屏幕上用了“突破創新、開源開放、智見未來”十二個大字,結束了她的演講。這也是百度在語言與知識技術領域的長期發展目標,將持續為開發者和相關領域提供更好的技術支持。
從該場論壇來看,百度大腦5.0已經打通了從基礎層的深度學習技術到通用AI能力、應用技術方案,再到定制化模型,以及最終的部署和集成,整個人工智能產業化應用落地的全部流程,實現了AI技術的標準化、自動化和模塊化。而這股打通“任督二脈”的“神功”,百度正在開放給更多開發者,希望大家都能平等便捷地獲取AI能力,加速產業智能化進程。