
“人工智能會不會在未來五年、十年就把人類替代了?”在人工智能研究快速發(fā)展的今天,這樣的問題不斷被人提出,但在微軟全球執(zhí)行副總裁、計算機視覺和圖形學(xué)領(lǐng)域頂尖專家沈向洋看來,這個問題從一開始就問錯了。
“我說這個問題都問錯了,人工智能也好,計算機也好,或者是以前的石器時代也好,人類發(fā)展是不斷的在尋找所謂的工具。不斷的有了這些新的技術(shù),是在令人類的能力更加的強,我自己是持這樣的態(tài)度?!?/p>
18日,沈向洋在位于微軟總部貝爾維尤的一處辦公樓內(nèi)接受騰訊科技采訪,暢談了他對于人工智能研究領(lǐng)域的理解。
“最典型的應(yīng)用是我們有兩個程序員寫了How old .net,那件事情一下子火的不得了,現(xiàn)在上傳數(shù)據(jù)差不多有6億張圖片,非常有趣。”微軟全球執(zhí)行副總裁沈向洋笑著說道。
上傳一張肖像照片,系統(tǒng)立即就能告訴你這個人的年齡,這就是前一段時間火爆的應(yīng)用“How-old”能實現(xiàn)的具體功能,這個微軟出品并遇到無數(shù)好評和罵聲的應(yīng)用,實際上便是人工智能的具體應(yīng)用。
沈向洋認為,人工智能現(xiàn)在正處于“激動人心”的發(fā)展階段,最近發(fā)展得“非常迅猛”,包括研究機構(gòu)、大學(xué)、大公司都在進行這方面的研究,也受到風(fēng)投的密切關(guān)注。
他提出,人工智能領(lǐng)域取得了一些“突破性的進展,主要表現(xiàn)在兩個領(lǐng)域,一是語音識別,另一個是視覺識別。
在語音識別方面,沈向洋說,“語音識別業(yè)界已經(jīng)做了四、五十年,但語音識別最大的問題是誤差率一直降不下來。”
“語音識別如果在一般的場景下,比如在一個房間里,一般的人聽語音大概誤差率在8%,這么多年下來它是一直下不來。最近有了突破的發(fā)展,就是深度學(xué)習(xí),用很多層的人工網(wǎng)絡(luò)去做大數(shù)據(jù),大訓(xùn)練,做到這樣,所以最近語音誤差率降的非??臁!鄙蛳蜓笳f。
他指出,目前語音識別的誤差率(實驗室環(huán)境)已經(jīng)降到12%左右,而微軟的預(yù)測是五年之內(nèi)誤差率可以達到人類的水平。
他認為,在語音識別領(lǐng)域,目前微軟、谷歌(微博)和IBM三家公司處于領(lǐng)先地位。
在視覺識別方面,沈向洋認為,目前的發(fā)展也非常迅速,上述提到的“How-old.net”便是一個具體的例子。
他提出,微軟目前所提出的“移動為先、云為先”的戰(zhàn)略,實際上給更廣泛的人群進行人工智能的研究和應(yīng)用開發(fā)也提供了很好的基礎(chǔ)。
“微軟的目標(biāo)是打造全球最大的云,這個云還不是一般的云,是智能云?!鄙蛳蜓笳f。
微軟在今年4月份發(fā)布了Project Oxford(牛津計劃),便通過微軟的Azure云服務(wù),向開發(fā)者提供API和SDK工具包,讓開發(fā)者可以使用微軟的自然數(shù)據(jù)理解能力,為自己的解決方案增加智能服務(wù)。這些工具包包括人臉識別、語音識別、計算機視覺和語音理解智能服務(wù)。
對于開發(fā)者來說,如果想從事一些語音或者語言識別,或者做一些圖像識別的應(yīng)用,可以從“云端”API獲取相應(yīng)的內(nèi)容。
但沈向洋同時提醒說,在人工智能領(lǐng)域,雖然部分領(lǐng)域發(fā)展很快,但還是有更多的領(lǐng)域并沒有像語音和視覺識別發(fā)展的那么快,例如可推廣性方面、規(guī)劃方面等。
他認為,實際上人類目前對人工智能的研究,和過去任何時代一樣,是人類不斷拓展自己的能力、尋找工具的探索。
“不斷地擁有這些技術(shù)和工具之后,實際上是對人類能力的一種增強?!鄙蛳蜓笳f。
北京app開發(fā)公司 | app開發(fā) | app開發(fā)公司 | 企業(yè)品牌App開發(fā)移動互聯(lián)網(wǎng)解決方案 | 一站式o2o app開發(fā)大數(shù)據(jù)解決方案 | 智能設(shè)備APP開發(fā)商
