轉(zhuǎn)帖|行業(yè)資訊|編輯:郝浩|2017-04-17 16:21:52.000|閱讀 955 次
概述:現(xiàn)在一談到人工智能就繞不開(kāi)“神經(jīng)網(wǎng)絡(luò)”這個(gè)詞。人造神經(jīng)網(wǎng)絡(luò)粗線條地模擬人腦,使得計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)。本文將向你系統(tǒng)講解神經(jīng)網(wǎng)絡(luò)是什么,以及它的工作原理是怎樣的。
# 界面/圖表報(bào)表/文檔/IDE等千款熱門(mén)軟控件火熱銷售中 >>
現(xiàn)在一談到人工智能就繞不開(kāi)“神經(jīng)網(wǎng)絡(luò)”這個(gè)詞。人造神經(jīng)網(wǎng)絡(luò)粗線條地模擬人腦,使得計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)。
機(jī)器學(xué)習(xí)這一強(qiáng)大的分支結(jié)束了 AI 的寒冬,迎來(lái)了人工智能的新時(shí)代。簡(jiǎn)而言之,神經(jīng)網(wǎng)絡(luò)可能是今天最具有根本顛覆性的技術(shù)。
看完這篇神經(jīng)網(wǎng)絡(luò)的指南,你也可以和別人聊聊深度學(xué)習(xí)了。為此,我們將盡量不用數(shù)學(xué)公式,而是盡可能用打比方的方法,再加一些動(dòng)畫(huà)來(lái)說(shuō)明。
AI 的早期流派之一認(rèn)為,如果您將盡可能多的信息加載到功能強(qiáng)大的計(jì)算機(jī)中,并盡可能多地提供方法來(lái)了解這些數(shù)據(jù),那么計(jì)算機(jī)就應(yīng)該能夠“思考”。比如 IBM 著名的國(guó)際象棋 AI Deep Blue 背后就是這么一個(gè)思路:通過(guò)對(duì)棋子可能走出的每一步進(jìn)行
編程,再加上足夠的算力,IBM 程序員創(chuàng)建了一臺(tái)機(jī)器,理論上可以計(jì)算出每一個(gè)可能的動(dòng)作和結(jié)果,以此來(lái)?yè)魯?duì)手。
通過(guò)這種計(jì)算,機(jī)器依賴于工程師精心預(yù)編程的固定規(guī)則——如果發(fā)生了 A,那么就會(huì)發(fā)生 B ; 如果發(fā)生了 C,就做 D——這并不是如人類一樣的靈活學(xué)習(xí)。當(dāng)然,它是強(qiáng)大的超級(jí)計(jì)算,但不是“思考”本身。
在過(guò)去十年中,科學(xué)家已經(jīng)復(fù)活了一個(gè)舊概念,不再依賴大型百科全書(shū)式記憶庫(kù),而是框架性地進(jìn)行模擬人類思維,以簡(jiǎn)單而系統(tǒng)的方式分析輸入數(shù)據(jù)。 這種技術(shù)被稱為深度學(xué)習(xí)或神經(jīng)網(wǎng)絡(luò),自20世紀(jì)40年代以來(lái)一直存在,但是由于今天數(shù)據(jù)的大量增長(zhǎng)—— 圖像、視頻、語(yǔ)音搜索、瀏覽行為等等——以及運(yùn)算能力提升而成本下降的處理器,終于開(kāi)始顯示其真正的威力。
機(jī)器——它們和我們很像
人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種算法結(jié)構(gòu),使得機(jī)器能夠?qū)W習(xí)一切,從語(yǔ)音命令、播放列表到音樂(lè)創(chuàng)作和圖像識(shí)別。典型的 ANN 由數(shù)千個(gè)互連的人造神經(jīng)元組成,它們按順序堆疊在一起,以稱為層的形式形成數(shù)百萬(wàn)個(gè)連接。在許多情況下,層僅通過(guò)輸入和輸出與它們之前和之后的神經(jīng)元層互連。(這與人類大腦中的神經(jīng)元有很大的不同,它們的互連是全方位的。)
這種分層的 ANN 是今天機(jī)器學(xué)習(xí)的主要方式之一,通過(guò)饋送其大量的標(biāo)簽數(shù)據(jù),可以幫助它學(xué)習(xí)如何解讀數(shù)據(jù)(有時(shí)甚至比人類做得更好)。
以圖像識(shí)別為例,它依賴于稱為卷積神經(jīng)網(wǎng)絡(luò)(CNN)的特定類型的神經(jīng)網(wǎng)絡(luò),因?yàn)樗褂梅Q為卷積的數(shù)學(xué)過(guò)程來(lái)以非文字的方式分析圖像, 例如識(shí)別部分模糊的對(duì)象或僅從某些角度可見(jiàn)的對(duì)象。 (還有其他類型的神經(jīng)網(wǎng)絡(luò),包括循環(huán)神經(jīng)網(wǎng)絡(luò)和前饋神經(jīng)網(wǎng)絡(luò),但是這些神經(jīng)網(wǎng)絡(luò)對(duì)于識(shí)別諸如圖像的東西不太有用,下面我們會(huì)用示例來(lái)說(shuō)明)
那么神經(jīng)網(wǎng)絡(luò)到底是如何學(xué)習(xí)的? 讓我們看一個(gè)非常簡(jiǎn)單但有效的流程,它叫作監(jiān)督學(xué)習(xí)。我們?yōu)樯窠?jīng)網(wǎng)絡(luò)提供了大量的人類標(biāo)記的訓(xùn)練數(shù)據(jù),以便神經(jīng)網(wǎng)絡(luò)可以進(jìn)行基本的自我檢查。
假設(shè)這個(gè)標(biāo)簽數(shù)據(jù)分別由蘋(píng)果和橘子的圖片組成。照片是數(shù)據(jù);“蘋(píng)果”和“橘子”是標(biāo)簽。當(dāng)輸入圖像數(shù)據(jù)時(shí),網(wǎng)絡(luò)將它們分解為最基本的組件,即邊緣、紋理和形狀。當(dāng)圖像數(shù)據(jù)在網(wǎng)絡(luò)中傳遞時(shí),這些基本組件被組合以形成更抽象的概念,即曲線和不同的顏色,這些元素在進(jìn)一步組合時(shí),就開(kāi)始看起來(lái)像莖、整個(gè)的橘子,或是綠色和紅色的蘋(píng)果。
在這個(gè)過(guò)程的最后,網(wǎng)絡(luò)試圖對(duì)圖片中的內(nèi)容進(jìn)行預(yù)測(cè)。首先,這些預(yù)測(cè)將顯示為隨機(jī)猜測(cè),因為真正的學(xué)習(xí)還未發(fā)生。如果輸入圖像是蘋(píng)果,但預(yù)測(cè)為“橘子”,則網(wǎng)絡(luò)的內(nèi)部層需要被調(diào)整。
調(diào)整的過(guò)程稱為反向傳播,以增加下一次將同一圖像預(yù)測(cè)成“蘋(píng)果”的可能性。這一過(guò)程持續(xù)進(jìn)行,直到預(yù)測(cè)的準(zhǔn)確度不再提升。正如父母教孩子們在現(xiàn)實(shí)生活中認(rèn)蘋(píng)果和橘子一樣,對(duì)于計(jì)算機(jī)來(lái)說(shuō),訓(xùn)練造就完美。如果你現(xiàn)在已經(jīng)覺(jué)得“這不就是學(xué)習(xí)嗎?”,那你可能很適合搞人工智能。
很多很多層……
通常,卷積神經(jīng)網(wǎng)絡(luò)除了輸入和輸出層之外還有四個(gè)基本的神經(jīng)元層:
在最初的卷積層中,成千上萬(wàn)的神經(jīng)元充當(dāng)?shù)谝唤M過(guò)濾器,搜尋圖像中的每個(gè)部分和像素,找出模式(pattern)。隨著越來(lái)越多的圖像被處理,每個(gè)神經(jīng)元逐漸學(xué)習(xí)過(guò)濾特定的特征,這提高了準(zhǔn)確性。
比如圖像是蘋(píng)果,一個(gè)過(guò)濾器可能專注于發(fā)現(xiàn)“紅色”這一顏色,而另一個(gè)過(guò)濾器可能會(huì)尋找圓形邊緣,另一個(gè)過(guò)濾器則會(huì)識(shí)別細(xì)細(xì)的莖。如果你要清理混亂的地下室,準(zhǔn)備在車庫(kù)搞個(gè)大銷售,你就能理解把一切按不同的主題分類是什么意思了(玩具、電子產(chǎn)品、藝術(shù)品、衣服等等)。 卷積層就是通過(guò)將圖像分解成不同的特征來(lái)做這件事的。
特別強(qiáng)大的是,神經(jīng)網(wǎng)絡(luò)賴以成名的絕招與早期的 AI 方法(比如 Deep Blue 中用到的)不同,這些過(guò)濾器不是人工設(shè)計(jì)的。他們純粹是通過(guò)查看數(shù)據(jù)來(lái)學(xué)習(xí)和自我完善。
卷積層創(chuàng)建了不同的、細(xì)分的圖像版本,每個(gè)專用于不同的過(guò)濾特征——顯示其神經(jīng)元在哪里看到了紅色、莖、曲線和各種其他元素的實(shí)例(但都是部分的) 。但因?yàn)榫矸e層在識(shí)別特征方面相當(dāng)自由,所以需要額外的一雙眼睛,以確保當(dāng)圖片信息在網(wǎng)絡(luò)中傳遞時(shí),沒(méi)有任何有價(jià)值的部分被遺漏。
神經(jīng)網(wǎng)絡(luò)的一個(gè)優(yōu)點(diǎn)是它們能夠以非線性的方式學(xué)習(xí)。如果不用數(shù)學(xué)術(shù)語(yǔ)解釋,它們的意思是能夠發(fā)現(xiàn)不太明顯的圖像中的特征——樹(shù)上的蘋(píng)果,陽(yáng)光下的,陰影下的,或廚房柜臺(tái)的碗里的。這一切都要?dú)w功于于激活層,它或多或少地突出了有價(jià)值的東西——一些既明了又難以發(fā)現(xiàn)的屬性。
在我們的車庫(kù)大甩賣中,想像一下,從每一類東西里我們都挑選了幾件珍貴的寶物:書(shū)籍,大學(xué)時(shí)代的經(jīng)典 T 恤。要命的是,我們可能還不想扔它們。我們把這些“可能”會(huì)留下的物品放在它們各自的類別之上,以備再考慮。
整個(gè)圖像中的這種“卷積”會(huì)產(chǎn)生大量的信息,這可能會(huì)很快成為一個(gè)計(jì)算噩夢(mèng)。進(jìn)入池化層,可將其全部縮小成更通用和可消化的形式。有很多方法可以解決這個(gè)問(wèn)題,但最受歡迎的是“最大池”(Max Pooling),它將每個(gè)特征圖編輯成自己的“讀者文摘”版本,因此只有紅色、莖或曲線的最好樣本被表征出來(lái)。
在車庫(kù)春季清理的例子中,如果我們使用著名的日本清理大師 Marie Kondo 的原則,將不得不從每個(gè)類別堆中較小的收藏夾里選擇“激發(fā)喜悅”的東西,然后賣掉或處理掉其他東西。 所以現(xiàn)在我們仍然按照物品類型來(lái)分類,但只包括實(shí)際想要保留的物品。其他一切都賣了。
這時(shí),神經(jīng)網(wǎng)絡(luò)的設(shè)計(jì)師可以堆疊這一分類的后續(xù)分層配置——卷積、激活、池化——并且繼續(xù)過(guò)濾圖像以獲得更高級(jí)別的信息。在識(shí)別圖片中的蘋(píng)果時(shí),圖像被一遍又一遍地過(guò)濾,初始層僅顯示邊緣的幾乎不可辨別的部分,比如紅色的一部分或僅僅是莖的尖端,而隨后的更多的過(guò)濾層將顯示整個(gè)蘋(píng)果。無(wú)論哪種方式,當(dāng)開(kāi)始獲取結(jié)果時(shí),完全連接層就會(huì)起作用。
現(xiàn)在是時(shí)候得出結(jié)果了。在完全連接層中,每個(gè)削減的或“池化的”特征圖“完全連接”到表征了神經(jīng)網(wǎng)絡(luò)正在學(xué)習(xí)識(shí)別的事物的輸出節(jié)點(diǎn)(神經(jīng)元)上。 如果網(wǎng)絡(luò)的任務(wù)是學(xué)習(xí)如何發(fā)現(xiàn)貓、狗、豚鼠和沙鼠,那么它將有四個(gè)輸出節(jié)點(diǎn)。 在我們描述的神經(jīng)網(wǎng)絡(luò)中,它將只有兩個(gè)輸出節(jié)點(diǎn):一個(gè)用于“蘋(píng)果”,一個(gè)用于“橘子”。
如果通過(guò)網(wǎng)絡(luò)饋送的圖像是蘋(píng)果,并且網(wǎng)絡(luò)已經(jīng)進(jìn)行了一些訓(xùn)練,且隨著其預(yù)測(cè)而變得越來(lái)越好,那么很可能一個(gè)很好的特征圖塊就是包含了蘋(píng)果特征的高質(zhì)量實(shí)例。 這是最終輸出節(jié)點(diǎn)實(shí)現(xiàn)使命的地方,反之亦然。
“蘋(píng)果”和“橘子”節(jié)點(diǎn)的工作(他們?cè)诠ぷ髦袑W(xué)到的)基本上是為包含其各自水果的特征圖“投票”。因此,“蘋(píng)果”節(jié)點(diǎn)認(rèn)為某圖包含“蘋(píng)果”特征越多,它給該特征圖的投票就越多。兩個(gè)節(jié)點(diǎn)都必須對(duì)每個(gè)特征圖進(jìn)行投票,無(wú)論它包含什么。所以在這種情況下,“橘子”節(jié)點(diǎn)不會(huì)向任何特征圖投很多票,因?yàn)樗鼈儾⒉徽嬲魏巍伴僮印钡奶卣鳌W詈螅冻鲎疃?票數(shù)的節(jié)點(diǎn)(在本例中為“蘋(píng)果”節(jié)點(diǎn))可以被認(rèn)為是網(wǎng)絡(luò)的“答案”,盡管事實(shí)上可能不那么簡(jiǎn)單。
因?yàn)橥粋€(gè)網(wǎng)絡(luò)正在尋找兩個(gè)不同的東西——蘋(píng)果和橘子——網(wǎng)絡(luò)的最終輸出以百分比表示。在這種情況下,我們假設(shè)網(wǎng)絡(luò)在訓(xùn)練中表現(xiàn)已經(jīng)有所下降了,所以這里的預(yù)測(cè)可能就是75%的“蘋(píng)果”,25%的“橘子”。或者如果是在訓(xùn)練早期,可能會(huì)更加不正確,它可能是20%的“蘋(píng)果”和80%的“橘子”。這可不妙。
所以,在早期階段,神經(jīng)網(wǎng)絡(luò)可能會(huì)以百分比的形式給出一堆錯(cuò)誤的答案。 20%的“蘋(píng)果”和80%的“橘子”,預(yù)測(cè)顯然是錯(cuò)誤的,但由于這是使用標(biāo)記的訓(xùn)練數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí),所以網(wǎng)絡(luò)能夠通過(guò)稱為“反向傳播”的過(guò)程來(lái)進(jìn)行系統(tǒng)調(diào)整。
避免用數(shù)學(xué)術(shù)語(yǔ)來(lái)說(shuō),反向傳播將反饋發(fā)送到上一層的節(jié)點(diǎn),告訴它答案差了多少。然后,該層再將反饋發(fā)送到上一層,再傳到上一層,直到它回到卷積層,來(lái)進(jìn)行調(diào)整,以幫助每個(gè)神經(jīng)元在隨后的圖像在網(wǎng)絡(luò)中傳遞時(shí)更好地識(shí)別數(shù)據(jù)。
這個(gè)過(guò)程一直反復(fù)進(jìn)行,直到神經(jīng)網(wǎng)絡(luò)以更準(zhǔn)確的方式識(shí)別圖像中的蘋(píng)果和橘子,最終以100%的正確率預(yù)測(cè)結(jié)果——盡管許多工程師認(rèn)為85%是可以接受的。這時(shí),神經(jīng)網(wǎng)絡(luò)已經(jīng)準(zhǔn)備好了,可以開(kāi)始真正識(shí)別圖片中的蘋(píng)果了。
本文來(lái)自:新智元,
領(lǐng)域相關(guān):神經(jīng)網(wǎng)絡(luò)工具NeuroSolutions>>
本站文章除注明轉(zhuǎn)載外,均為本站原創(chuàng)或翻譯。歡迎任何形式的轉(zhuǎn)載,但請(qǐng)務(wù)必注明出處、不得修改原文相關(guān)鏈接,如果存在內(nèi)容上的異議請(qǐng)郵件反饋至chenjj@fc6vip.cn