原創|行業資訊|編輯:陳俊吉|2017-12-11 10:26:22.000|閱讀 338 次
概述:伴隨著認知計算時代的到來,如何將我們計算機的信息處理能力與人類的認知能力相結合,從而提高我們的信息處理效率,是我們在目前所要思考的問題。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
伴隨著認知計算時代的到來,如何將我們計算機的信息處理能力與人類的認知能力相結合,從而提高我們的信息處理效率,是我們在目前所要思考的問題。本期清華大數據“技術·前沿”系列講座我們邀請到IBM研究院研究總監、及計算研究方向首席數據科學家蘇中為大家帶來題為《從深藍到AlphaGo,從大數據到認知商業》的分享。
文字版干貨整理如下:
IBM研究院研究總監蘇中
蘇中:美國的達特茅斯于61年前提出一詞,而人工智能的歷史可以向前追溯很長的時間,甚至中國人發明算盤的時候就在思考將計算的機器演化成智能。這一演化進程與人類認識客觀規律的過程相類似。通過符號推理,人類體現出早期的智能行為,并認識到世界的規則。以三段論為例,我們在認識世界時,先設定一個大前提或者一個更大的公理,而每件事情都有一個特例,根據這個公理和特例就可以推出一個結論。在很多人工智能的演化中,這方面已取得了非常大的進步,如定理證明。
這方面的技術同樣應用在產業界,以專家系統為例。在醫療行業中我們需要考慮一個好醫生所具備的特點,到底是他診斷的病人比較多還是他遇到的疑難雜癥比較多?一般而言,一個疾病、一個好醫生大概可以總結為幾個類別。我們進行數據分析通常把一個大問題劃分到一個小的問題空間,然后在小的問題空間領域求解。
專家系統采用同樣的角度,如醫療專家對一個病種的病人進行分類,符合分類的病人具有怎樣的表征,通過什么樣的檢驗方法得以確診,這類病人一般有幾種治療方式,其中每種治療方式對應各自的優缺點,需考慮在什么情況下用什么方式治療。一般來講一個好醫生把一個病種稍微的梳理一下可能會累積幾十條規則,那么幾個醫生或幾十個該行業的專家醫生就能梳理出一個完整的知識體系,如《臨床醫療指南》。按照《臨床醫療指南》的整個流程,我們能夠很容易地確定病人該做什么樣的檢查,通過檢查能得到什么結論,得到結論以后有什么治療手法,以及在整個病程中該做一些什么樣的觀察。
這樣的專家系統是非常有效的,在醫療行業也有很好的應用。但專家系統同樣面臨著一大挑戰,即固化的知識體系不能應對實際繁雜的問題。這種基于數據普適性的挑戰使得人工智能的發展進入了一個瓶頸期。
的迅速發展得益于的爆發,在這場爆發中,機器學習可以自動地從數據里尋找規律、,規則同時隨數據的改變而自動發生變化。由此,人工智能迅速在互聯網方面得以應用,包括搜索、推薦、語音識別等等。
下棋是一個較容易驗證計算機是否具有智能的方式,因為可能只有人類會下棋,另外下棋有很多推理過程,如對于棋局的判斷等。隨著伴隨計算機習得經驗的增多,它的智能水準就得以提高。下棋本身是相對比較容易理解的問題,因為棋的規則是開放的,不管是國際象棋、中國象棋、跳棋還是圍棋,規則是非常清晰的,在一個清晰的規則系統下,輸贏很容易判斷。
由于雙方的棋力都能在棋盤上顯示出來,再加上清晰的評價函數、規則系統和數據,我們能比較容易地設定人工智能的系統。以IBM的深藍系統為例,當把一個棋面變成數值時,我們就可以讓機器去做搜索算法,而每一個棋子在不同方向都有被選擇的可能,就構建出搜索素樹算法,再通過α-β剪枝的方法就可以迅速得到結論。當時深藍就是通過這種方式對國際象棋做出很好的評估函數,由于這些評估函數大多來自國際象棋大師,并且計算機算法搜索很深入,我們就可以讓計算機打敗像卡斯帕羅夫這樣的大師。
在用象棋的這種方法來解決圍棋問題時卻遇到很大的挑戰:一是圍棋的棋盤是19乘19,有361個空間可能性,其搜索空間達2.08X10 107 ,那,那么搜索素樹就會相當復雜;二是圍棋的每個子是一樣的,無法通過棋面盤面子粒的多少判斷它的狀態;三是圍棋比賽中會出現一步臭棋,全盤皆輸的情況,即圍棋的評價函數值不連續,在某一點一個子粒的變化可以讓整個棋面的評估變得很復雜。蒙特卡羅搜索樹為解決這些問題提供了思路:雖然我們沒有辦法判斷當前盤面的情況,但可以讓系統隨機下棋,拿勝率作為評估標準盤。隨機數可以從某種意義上描述評估值,從而解決怎樣評估一個棋子的問題。
當計算機算到足夠的深度時,這樣的方法會有較好的效果。但是它的速度空間還是太大,那有沒有什么辦法可以降低呢?通過深度學習的網絡來評估棋局就是一種好方法。我們用深度學習算法可以將評估變成一個深度學習的任務,以當前的對局作為輸入,輸出在某一點上的值,也可以提高預測精度。
那把蒙特卡羅搜索樹和CNN結合能產生什么樣的化學效應呢?如果用神經原網絡可以預測專業棋手在對局中下一步棋的位置,我們就可以讓搜索空間變小了。
AlphaGo把這個事情推到了極致,他們不光讓棋的搜索寬度變窄,更做了策略網絡,來判斷當前棋局黑白雙方獲勝的概率有多大,但遇到的挑戰是這個數據比對局的數據要少,對局的每一步都可以作為訓練數據,但輸贏一盤只有一次,訓練數據有點稀疏。所以他們在這個工作上使用了增強學習的方法,即讓一個戰斗力不錯的系統,或者兩個系統互相對戰產生對局,然后用最后的輸贏結果作為機器的樣本學習。結果就是這個系統戰勝了李世石,非常了不起。
AlphaGo zero又是一個非常重要的突破,一是 AlphaGo zero完全從零開始,二是 AlphaGo zero沒有用任何的方式評估,只用了對局本身的棋盤信息。它的輸入只有圍棋的規則,之后機器就自己跟自己下棋,以此確認模型。在深度學習里面它把原來13層的網絡變成40層,而且把原來CNN的網絡變得更為復雜,同時把所有的人類知識都拋掉了。但在這一過程當中,它的訓練非???,第三天這個系統跟李世石的系統對決可以完勝,過了21天它就打敗了戰勝柯潔的那個系統。從某種意義來講,像下棋這樣在規則明確、狀態空間有限、容易評估、所有信息透明的情況下,用增強學習的方法是可解的,而且它的解法可以比人做的還要好。
那這樣的方法能不能解決其他問題呢?現實當中,很多問題可能沒法解。增強學習是大量數據的模擬,通過模擬的結果來調整參數。舉一個醫療上的例子,我們能拿一個病人去模擬嗎?給他吃不同的藥看他會發生什么問題?很難。另外,數據的來源信息不是單元的,各方面的因素都會影響到病人,如基因、飲食、生活習慣、家人、天氣等,這些因素不可能在一個簡單的環境里被算出來,每多一個維度的參數都需要更多的數據來訓練。
用多模型聚合的方法是不是可以放在行業里呢?舉個例子,比如水管的優化問題預測。歷史上有一些數學模型來預測管道哪個地方容易發生銹蝕,我們該在哪個地方打開了去看,但用幾個模型、用不同的參數去優化,可以取得很好的效果,而且產生了很大的經濟效益。
又例如,在電商平臺上怎么提高電商的經濟效益呢?在電商網站上買東西要經過搜索、對比、加購物車、看評論,這些步驟就是一個決策鏈,每個鏈條之間都有轉化率,我們怎么提高電商的銷售額呢?最好的推薦算法是什么呢?在這個領域里面,采用協同過濾算法是最有效的。
協同過濾有一個方法是矩陣分解,我們可以把用戶作為一類,商品作為一類,比方說有6億用戶,1億商品,就是一個6億乘1億的矩陣。我們可以把這個矩陣分解成M乘K的矩陣,當然這兩個矩陣之間不會完全一致,可能有一些像壓縮的損失。但是矩陣分解可以減小計算量,也可以根據用戶跟用戶之間的相似度、商品和商品之間的相似度做智能推薦。也就是說在這里面用一個多元K,用好多階層的K來做優化,以達到最好的效果。
在新的時代里,由于多了數據維度,我們可以解決很多新的問題。例如皮膚癌的識別,每個醫生能看到的案例都是有限的,一個好的大夫一天可能看5個案例就已經很了不起了。但機器可以學了幾十萬個案例以后做出判斷,這個場景就是拿自己手機拍了照片以后發到系統,系統做出風險評估,以判斷患有皮膚癌或者黑色素瘤的概率有多大。
回到今天的主題,我們從下棋里面看到一些計算機的成長,包括它能用更多的數據,也包括計算能力的增強,新的算法的體現。如果面對的問題是可以解決的,那這些能力就可以應用到現實當中的行業里。但是現實當中的問題往往比我們像下棋這樣的問題要復雜得多,所以我們講這種算法還有很長的路要走。
我們很多人都在擔心機器人要替代人類的工作,但是其實機器人走路時還在以各種各樣的方式摔倒。實際上這些都是世界上最好的機器人在比賽。三年前有一個比賽,場景是以福島核電站的輻射場景作為藍圖,機器人可以開車,到達一個地方可以上樓梯,進去以后找到閥門,關上指定的閥門。它可能會使用一些器械,包括使用電鉆等,這些都不復雜。當年的冠軍是韓國一個大學,他們做的系統相對來說更容易,就是四點著地,相當于跪著,前面膝蓋的地方有一個像履帶的東西,所以它走路的時候像坦克車一樣行走,不容易摔倒。從某種意義上來講也驗證了一個經典,用最合適的方法去解決一個問題,也許成熟的技術或者是一些簡單的技術在現實當中更有效。
人工智能確實會有很大的發展,因為大數據的變化改變著很多產業,對從金融行業到醫療行業、教育行業都有很大的幫助。人們經常講的“人工智能威脅論”事實上有很多的局限性,無論是從應用方法本身,還是問題本身。實際的問題很復雜,參數很多,而現在的方法都是簡化的方法。當我們回到真正的應用當中會發現,還有很多最基本的東西需要攻克。
我們用計算機在圖象識別領域里面做得很好,但它仍然是有限的數據集,比方說我可以用100萬張的圖片訓練出一個機器人識別貓,識別狗,它能做的比人還要準,但是如果把數據集換成漫畫,機器就識別不出來,但是孩子可以識別出來。孩子真正理解這是個蘋果,這是個小貓,那是真正的理解,而大數據的智能在某種意義上不是真正的理解。另外,智能的本身是真正了解人,人最復雜的不光是表象,還有很多情感,這對智能來說是不小的障礙。
迄今為止,我們看到智能化的門已經打開,真正能夠改變多少,可能需要不斷的嘗試。因為并不是所有的問題都可以用解決。
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn