深度學習:關於 AI 與機器視覺,我應該要知道的事情
人工智慧 vs 機器學習 vs 深度學習
人工智慧 (Artificial Intelligence, AI) – 藉由人工製作的機器來模擬人類行為,像是人類感官的視覺聽覺,身體肢體動作,甚至到推理學習,都是屬於人工智慧的範疇。更早以前,基於許多規則來定義系統也可以算是人工智慧的一環。
機器學習 (Machine Learning, ML) – 這是通過大量資料學習其中規則,從而實現人工智慧的一種技術
深度學習 (Deep Learning, DL) – 眾多機器學習演算法中的其中一種方法,前身是類神經網路,由於神經網路的技術突破,深度學習成為目前最活耀的技術,常被用來解決影像或是自然語言辨識中。
機器視覺與深度學習
在傳統機器視覺中,要辨識一張影像需要結合各種演算法才能完成工作,例如使用影像處理來找到臉部特徵、輪廓等資訊,藉此來框出人臉所在位置,但由於每次拍攝的環境、光線、角度的不同,導致無法適用各種情況,再加上早期的機器學習演算法,需要手動擷取特徵,並在特定條件下才能有很好的 Performace,所以機器學習在機器視覺的應用上一直沒有很大突破。
近年來出現的深度學習技術,是基於類神經網路再加上濾波技術 (Convolution),就是常聽到的 Convolutional Nerual Network (CNN),再加上網路進步,已經有非常龐大的資料庫以及強大的計算設備,可以直接利用深度學習的方式來學習特徵,
瑕疵檢測樣本數
通常要蒐集瑕疵資料是非常困難的是,因為瑕疵通常都是特殊案例,可能本身設備就難以偵測到,所以樣本數也是非常少,甚至沒有樣本,在這種情況下如何偵測異常,也是一項相當具有挑戰性的工作。
現在使用深度學習,其實可以藉由學習正樣本,來prefer出異常樣本,抑或是用深度學習技術產生出負樣本,比如說 生成對抗網路 GAN,當然具體實現可能需要進行更詳盡的survey,但現階段使用深度學習使目前可行性最高的方案。
深度學習的應用
不同的深度神經網路架構,也會有不同應用。現在常見的模型應用架構大概是分類、分割、物件偵測、場景識別、影像雜訊消除、參數迴歸分析、新資料生成。
基於上面這些架構其實可以運用到工廠瑕疵檢測、無人車、無人機、交通管理、門禁系統,也可以做出之前新聞常見的變小孩變動漫人物的濾鏡,也還有許多有趣應用等著被發現。
標記工具
基本要讓深度學習能夠真的學習,還是仰賴人工標記的資料,只是不用進行一系列的特徵萃取,就可以達到辨識能力。
下面列了一些常見的影像標記工具: