轉帖|行業資訊|編輯:黃竹雯|2016-07-22 13:56:41.000|閱讀 507 次
概述:圖像識別(image recognition)是現在的熱門技術。文字識別、車牌識別、人臉識別都是它的應用。但是,這些都算初級應用,現在的技術已經發展到了這樣一種地步:計算機可以識別出,這是一張狗的照片,那是一張貓的照片。
# 界面/圖表報表/文檔/IDE等千款熱門軟控件火熱銷售中 >>
圖像識別(image recognition)是現在的熱門技術。
文字識別、車牌識別、人臉識別都是它的應用。但是,這些都算初級應用,現在的技術已經發展到了這樣一種地步:計算機可以識別出,這是一張狗的照片,那是一張貓的照片。
這是怎么做到的?
讓我們從人眼說起,學者發現,人的視覺細胞對物體的邊緣特別敏感。也就是說,我們先看到物體的輪廓,然后才判斷這到底是什么東西。
計算機科學家受到啟發,第一步也是先識別圖像的邊緣。
加州大學的學生 Adit Deshpande 寫了一篇文章,介紹了一種最簡單的算法,非常具有啟發性,體現了圖像識別的基本思路。
首先,我們要明白,人看到的是圖像,計算機看到的是一個數字矩陣。所謂”圖像識別”,就是從一大堆數字中找出規律。
怎樣將圖像轉為數字呢?一般來說,為了過濾掉干擾信息,可以把圖像縮小(比如縮小到 49 x 49 像素),并且把每個像素點的色彩信息轉為灰度值,這樣就得到了一個 49 x 49 的矩陣。
然后,從左上角開始,依次取出一個小區塊,進行計算。
上圖是取出一個 5 x 5 的區塊。下面的計算以 7 x 7 的區塊為例。
接著,需要有一些現成的邊緣模式,比如垂直、直角、圓、銳角等等。
上圖右邊是一個圓角模式,左邊是它對應的 7 x 7 灰度矩陣。可以看到,圓角所在的邊緣灰度值比較高,其他地方都是0。
現在,就可以進行邊緣識別了。下面是一張卡通老鼠的圖片。
取出左上角的區塊。
取樣矩陣與模式矩陣對應位置的值相乘,進行累加,得到6600。這個值相當大,它說明什么呢?
取樣矩陣移到老鼠頭部,與模式矩陣相乘,得到的值是0。
乘積越大就說明越匹配,可以斷定區塊里的圖像形狀是圓角。通常會預置幾十種模式,每個區塊計算出最匹配的模式,然后再對整張圖進行判斷。
作者: 阮一峰
日期: 2016年7月22日
文自:
更多掃描識別相關資訊,請聯系!
本站文章除注明轉載外,均為本站原創或翻譯。歡迎任何形式的轉載,但請務必注明出處、不得修改原文相關鏈接,如果存在內容上的異議請郵件反饋至chenjj@fc6vip.cn