飛象網(wǎng)訊 6月8日,百度聯(lián)盟峰會在風(fēng)景俊秀的云南大理召開。這一次,百度創(chuàng)始人、董事長兼CEO李彥宏借助幻燈片,將熙熙攘攘的會場變成了一場頗具未來感的技術(shù)大秀,齊聚在蒼山腳下的數(shù)千名聯(lián)盟成員則共同聆聽了一場有關(guān)人工智能的大型“公開課”。
李彥宏在演講中這樣描述移動互聯(lián)網(wǎng)的飛速發(fā)展,“PC互聯(lián)網(wǎng)走了18年的路,移動互聯(lián)網(wǎng)僅僅走了4年”,他認(rèn)為這兩個階段正是互聯(lián)網(wǎng)發(fā)展的第一幕和第二幕。而當(dāng)前所面臨的人口紅利趨薄、市場規(guī)模趨于飽和等問題,則讓很多人都感受到了其中成長的壓力。“國家靠互聯(lián)網(wǎng)+保增長,互聯(lián)網(wǎng)靠什么?”李彥宏給出的答案是人工智能,并展示了百度語音識別、Image QA、無人駕駛、度秘機(jī)器人等技術(shù)、產(chǎn)品的最新進(jìn)展,引起現(xiàn)場的贊嘆。
最后,李彥宏提出,期待在互聯(lián)網(wǎng)的下一幕中,“真正讓人工智能迅速滲透到各個行業(yè),改變我們的社會”,讓人工智能技術(shù)解放全人類。
下面就讓我們一起來看看這場有關(guān)技術(shù)與未來的長篇干貨:
歡迎大家來到第十一次的百度聯(lián)盟峰會,在去年的時候我已經(jīng)基本上預(yù)告了今年要講什么。按照慣例我們在聯(lián)盟峰會上會講產(chǎn)業(yè)趨勢,而今年我們稍微變了變形式,以前是純粹“講”,今天有一個PPT,它題目叫做《下一幕》。
去年在聯(lián)盟峰會上我講了互聯(lián)網(wǎng)的第一幕和第二幕,我們先回顧一下。從1994年開始的PC互聯(lián)網(wǎng),一直持續(xù)到了大約2012年,應(yīng)該說是改變了整個世界、改變了人們的生活,這算是互聯(lián)網(wǎng)的第一幕;我覺得第二幕應(yīng)該算是從2012年開始,每個人都切實(shí)地感受到了移動互聯(lián)網(wǎng)的大潮對于我們生活的改變。所以我去年就留了一個疑問:移動互聯(lián)網(wǎng)之后是什么?今天我想和大家分享這樣一個主題。
從2012年到現(xiàn)在,其實(shí)只有短短四年的時間,移動互聯(lián)網(wǎng)的成長非常迅速,同時我們每一個人可能也感受到了其中的壓力。這個壓力是什么?中國互聯(lián)網(wǎng)的滲透率現(xiàn)在已經(jīng)到了50%左右,如果把老人、小孩這些都去掉,其實(shí)能上網(wǎng)的人大多數(shù)都已經(jīng)上網(wǎng)了,F(xiàn)在,人口的紅利快要沒有了,該用智能手機(jī)的人都已經(jīng)用上了智能手機(jī),市場的規(guī)模也逐步趨于飽和。現(xiàn)在大家都說市場很大、很繁榮,各種各樣的機(jī)會不斷的出來。可是當(dāng)我們再往前看一下的時候,我們會發(fā)現(xiàn)整個互聯(lián)網(wǎng)面臨著巨大的挑戰(zhàn)。PC互聯(lián)網(wǎng)走了18年左右的路,移動互聯(lián)網(wǎng)走了僅僅四年,很多人就已經(jīng)感覺到這當(dāng)中成長的壓力。
過去的PC互聯(lián)網(wǎng)時代,比如說百度成立的時候,中國只有不到1000萬網(wǎng)民,現(xiàn)在這個數(shù)字是7億,這里一直有人口紅利的迅速增長。移動互聯(lián)網(wǎng)僅僅發(fā)展了四年時間,就基本上已經(jīng)處于一個普及的狀態(tài)了。在這種情況下,未來會是什么樣子?
其實(shí)現(xiàn)在從國家政策的角度來講,非常提倡所謂的“互聯(lián)網(wǎng)+”行動計劃,這是因?yàn)閲业慕?jīng)濟(jì)進(jìn)入了新常態(tài),從國家政策的角度來講,我理解新的增長動力就是希望靠“互聯(lián)網(wǎng)+”,讓互聯(lián)網(wǎng)和每一個行業(yè)結(jié)合來提升運(yùn)營的效率,從而推動經(jīng)濟(jì)持續(xù)地、高速地增長。但是國家靠互聯(lián)網(wǎng)推動經(jīng)濟(jì)的增長,而移動互聯(lián)網(wǎng)本身的增長我們現(xiàn)在已經(jīng)看到瓶頸了。所以我們必須要思考互聯(lián)網(wǎng)靠什么來保持它持續(xù)地、高速地增長。最近幾年其實(shí)這兩個詞都是非常熱的,一個是大數(shù)據(jù),一個是云計算。所以互聯(lián)網(wǎng)大的下一幕是不是大數(shù)據(jù),是不是云計算?我的答案:不是。那是什么?是人工智能。
這是我本來去年就有點(diǎn)想講的,后來因?yàn)橐v其他的內(nèi)容,所以把它推到了今年。沒有想到在過去一年當(dāng)中人工智能從一個高精尖的科技變成了每一個人都可以街談巷議的熱門話題。事實(shí)上,人工智能背后的技術(shù)其實(shí)還是非常復(fù)雜的,需要投入、需要做的事情是非常多的。所以我想先給大家回顧一下人工智能的發(fā)展歷程。
1950年圖靈提出圖靈測試,就是當(dāng)你對面有一個屏幕和你交流的時候,你說一句話它回答一句話,看看回答這個話背后的究竟是一臺機(jī)器還是一個人,如果你能夠區(qū)別出來是機(jī)器還是人,就說明計算機(jī)還不具有智能,如果你區(qū)分不出來它是一個機(jī)器還是一個人,我們就可以說計算機(jī)具備了智能。
到1956年的夏天,MIT(麻省理工學(xué)院)一群科學(xué)家首次提出了“人工智能”這個詞,Artificial intelligence。當(dāng)時他們聚在一起的時候,六七個人打算用一夏天的時間,用他們這些聰明的頭腦就可以解決人工智能的問題。沒有想到不僅僅是一夏天解決不了,之后的半個世紀(jì)都沒有能夠解決人工智能的問題。我們看到70年代、80年代,一直到90年代初期,90年代是我在美國讀計算機(jī)的時期,我們有人工智能的課程,我非常喜歡,但是學(xué)完了之后非常失望的發(fā)現(xiàn)人工智能其實(shí)沒有實(shí)際的應(yīng)用,在當(dāng)時任何一個領(lǐng)域我們都看不到有價值的人工智能的應(yīng)用,所以當(dāng)時非常depress(失望)。
90年代以后,數(shù)據(jù)量越來越大,計算的能力也越來越強(qiáng),機(jī)器學(xué)習(xí)逐漸興起;到2006年一個叫做深度學(xué)習(xí)的模式首次能夠證明它比過去所有的算法例如圖像識別等都更加有效,而且是遠(yuǎn)遠(yuǎn)地超出過去圖像識別的能力。深度學(xué)習(xí)其實(shí)也不是2006年提出來的,是很早就提出來了。但是2006年為什么出現(xiàn)了這樣一個拐點(diǎn),為什么大家突然覺得這個東西行了、work(起作用)了,是因?yàn)閿?shù)據(jù)量越來越大,計算能力越來越強(qiáng),而且越來越便宜,所以過去那些不實(shí)用的算法,到2006年以后逐步進(jìn)入到了實(shí)用階段。
這里還有一個2013年,在2013年年初,百度對外宣布成立IDL(深度學(xué)習(xí)研究院),開始大規(guī)模進(jìn)入深度學(xué)習(xí)的領(lǐng)域。以上大致就是人工智能發(fā)展60年時間的回顧。
現(xiàn)在人工智能已經(jīng)能夠在多個領(lǐng)域顯現(xiàn)出來它的威力,第一領(lǐng)域是語音的識別。當(dāng)前百度的語音識別準(zhǔn)確率超過了97%。目前語音識別日請求的量到了1億以上。97%是什么概念?它比正常人的聽力都要好一些了。不信我們來試一試。
【展示語音識別技術(shù):播放方言或發(fā)音不清晰的語音,請現(xiàn)場嘉賓判斷內(nèi)容。在觀眾表示很難聽清的情況下,機(jī)器則能夠準(zhǔn)確的進(jìn)行判斷】
深度學(xué)習(xí)這樣的計算機(jī)能力在語音識別上已經(jīng)相當(dāng)精準(zhǔn),所以我有時候向朋友推薦用百度語音搜索,很多人第一反應(yīng)是百度有語音搜索嗎?第二反應(yīng)是它能夠識別我的話嗎?我的話不是很標(biāo)準(zhǔn),其實(shí)大家看到了剛剛這些不是很標(biāo)準(zhǔn)的語言都可以被很不錯地識別出來了。不僅是語音方面的進(jìn)展,我們可以看到在語音合成上也能做很多事情。剛才是識別,你說了它能夠知道你說什么,接下來它能夠?qū)W你說話,說出來跟你說話幾乎是一模一樣的。我給大家演示一下,模仿麥兜動畫片里面的配音演員對百度聯(lián)盟峰會說一段話。
【展示語音合成技術(shù):通過人工合成用麥兜的聲音說出一段話】
這個配音演員其實(shí)從來沒有說過這些話,但是我們根據(jù)過去他說的很多很多話就可以人工合成出來一段他“講”的話,并且聽起來還是很像的,合成的準(zhǔn)確度也會逐步地提高。
這是語音的合成,其實(shí)我們完全可以想象圖像也可以合成,圖像合成有什么實(shí)際用處呢?昨天晚上吃飯的時候大家聊,如果一旦實(shí)現(xiàn)了圖像的合成,以后演員、大腕們演電影也將會被改變,只要他們同意演這個電影,不用實(shí)際去演,我們可以把他所有的動作和語言合成出來。過去一個大腕一年拍兩部戲、三部戲,以后可以拍2000部戲、3000部戲,只要他同意我們就可以合成出來各種各樣的動作和聲音。所以這些技術(shù)一旦應(yīng)用到各個領(lǐng)域,就能夠產(chǎn)生出來無窮無盡的可能性。
下面我們看一下圖像識別技術(shù),先看2015年時做到的東西,這個我在當(dāng)時聯(lián)想的技術(shù)創(chuàng)新大會上演示過一遍,大家看一下。
【展示2015年圖像識別技術(shù):對既有圖片進(jìn)行提問】
大家看到這個圖片是在表達(dá)什么樣的東西,計算機(jī)是能夠明白的。不僅如此,它還能夠懂得你問話的意思,它能夠理解你的自然語言。這是2015年我們已經(jīng)實(shí)現(xiàn)的,那接下來我們看一下2016年和2015年有什么不一樣?
【展示2016年圖像識別技術(shù):對現(xiàn)場拍照得到的圖片進(jìn)行提問】
2016年和2015年有什么不一樣?2015年我們用了一張靜態(tài)高質(zhì)量的圖片,2016年我們就用手機(jī)隨便拍一張很自然圖片,在質(zhì)量不是很高的情況下機(jī)器仍然理解的比較到位,畫面里是什么樣的東西,我們的提問是什么意思。所以對圖像和對自然語言理解的相關(guān)技術(shù)也在迅速的提升。
其實(shí)我們?nèi)斯ぶ悄艿募夹g(shù)不僅僅在圖像識別、語音識別、自然語言理解方面有非常大的推動作用,另外一個很大的推動作用實(shí)際上是百度從去年開始對外宣傳的無人車。我一直在說,從本質(zhì)上來講無人車是帶著輪子的電腦,這臺電腦就可以像人一樣,識別障礙物、識別交通燈、遵守交通規(guī)則、帶著乘客到任何他想要去的地方。這里我也想給大家放一個短片,演示一下我們的無人車實(shí)際在路上跑的情況。
【播放“無人車”上路測試視頻】
大家可以看到,視頻中無人駕駛車路測的整個過程是沒有人進(jìn)行任何干預(yù)的。當(dāng)然,無人車離使用還有一段時間。現(xiàn)在我們能做到的是在路況不是特別復(fù)雜、非上下班高峰期的時候,無人車不需要人工干預(yù)就可以上上下下、做各種動作,但如果路況特別復(fù)雜的話,現(xiàn)在我們技術(shù)還達(dá)不到。但是我們相信,三五年之內(nèi),無人駕駛一定可以成為現(xiàn)實(shí)。
我們認(rèn)為人工智能再往下發(fā)展,其最主要的作用是會取代簡單的腦力勞動。我剛才舉的幾個例子,比如無人車,一般人用幾個月都可以學(xué)會駕車,而自動駕駛就是能夠模仿人類的這種簡單腦力勞動。還有一些在餐館里的點(diǎn)餐員,他做的事情也是相對比較簡單的,我們的人工智能也能夠替代這樣的功能,我們來看一下點(diǎn)餐的狀況。
【播放“度秘”入駐上?系禄蛷d為顧客點(diǎn)餐視頻】
這是在上海的一個肯德基概念店,我們用度秘實(shí)現(xiàn)了點(diǎn)餐的功能。其實(shí)我們可以想象,未來很多這種簡單、重復(fù)性的勞動都可以通過人工智能的方式來實(shí)現(xiàn),代替人的作用。
當(dāng)然,人工智能在很多領(lǐng)域都有應(yīng)用,比如金融領(lǐng)域。依據(jù)大數(shù)據(jù),依據(jù)我們對一個人的理解和分析,這其實(shí)也是一種人工智能、機(jī)器學(xué)習(xí)的技術(shù),能夠?qū)崿F(xiàn)很多過去不那么方便實(shí)現(xiàn)的東西。比如征信,現(xiàn)在百度的教育貸款,基本上就是以秒為單位就可以決定是否要給一個人貸款,而在過去恐怕是要以天為單位去計時的。
在很多領(lǐng)域,人工智能都能夠?qū)鹘y(tǒng)產(chǎn)業(yè)產(chǎn)生改變。我覺得不需要我做更多的解釋,大家只要想一想剛才展示的這些技術(shù),無論是語音識別也好,自然語言的理解也好,還是圖像識別也好,這些技術(shù)一旦應(yīng)用到各種各樣的產(chǎn)業(yè)中,都會對每一個產(chǎn)業(yè)產(chǎn)生巨大的改變。我們講了很多年互聯(lián)網(wǎng)對于制造業(yè)的影響,講了很多年的物聯(lián)網(wǎng),我可以下這樣的結(jié)論,如果沒有人工智能的能力,物聯(lián)網(wǎng)也好,互聯(lián)網(wǎng)也好,對于制造業(yè)——大家知道中國是一個制造業(yè)大國——是不會有本質(zhì)性影響的;但是有了人工智能,它對于制造業(yè)幾乎每一個領(lǐng)域都可以產(chǎn)生巨大的影響。原來大家覺得一個死的東西,將來就變活了,它就會具有人類的智能。
那么問題來了,這可能是很多人比較喜歡談?wù)摰囊粋話題:人工智能到底是會解放人類,還是會毀滅人類?業(yè)界其實(shí)有很多大咖都傾向于后者,他們都很擔(dān)心人工智能會毀滅人類,我是屬于比較樂觀的那一類,我認(rèn)為人工智能會做的是解放人類,至少在我有生之年,它毀滅不了人類。
其實(shí)這個道理很簡單,大家想想,能夠毀滅人類的東西早就出現(xiàn)了,比如說原子彈,F(xiàn)在人類擁有的原子彈可以毀滅人類很多次,但是為什么至今還沒有能夠毀滅人類呢?這是因?yàn)槲覀冞擁有最終的控制權(quán),誰能去push那個launch button(發(fā)射按鈕),這個方面還是有很好的機(jī)制能夠管理的。所以人工智能會越來越智能、越來越接近人類的能力,能夠解放人類很多繁瑣的工作,也能夠激發(fā)無限的可能性。過去我們覺得不能做的事情,未來可能通過人和機(jī)器的結(jié)合,就越來越能做了,但是我不覺得人工智能會毀滅人類,因?yàn)槲覀冇心芰θタ刂疲覀円灿心芰θブ贫ㄏ鄳?yīng)的規(guī)則。
講了很多技術(shù),我想說的是,這些技術(shù)不僅僅是屬于百度的,我們會無償把它開放出來,供我們聯(lián)盟的伙伴使用。不管你想做什么行業(yè),不管你想進(jìn)入哪一個領(lǐng)域,百度這些技術(shù)完全都是開放的,讓大家自由地使用,甚至我們很快也會把我們深度學(xué)習(xí)的源代碼開放出來,讓大家看到底這些東西是怎么實(shí)現(xiàn)的,大家甚至可以在這個基礎(chǔ)上進(jìn)行相應(yīng)的改進(jìn)。這樣的話確實(shí)能夠使得人工智能迅速地滲透到各個行業(yè),從而改變我們的社會。
所以,我所說的下一幕就是人工智能。這是繼移動互聯(lián)網(wǎng)之后一個更加激動人心、更加能夠給我們帶來各種各樣想象、各種各樣可能性的新時代。我們希望每一個在座的人都能夠在下一幕、在新的時代中,綻放自己的能力和風(fēng)采,謝謝!