深度學習：關於 AI 與機器視覺，我應該要知道的事情

人工智慧 vs 機器學習 vs 深度學習

人工智慧 (Artificial Intelligence, AI) – 藉由人工製作的機器來模擬人類行為，像是人類感官的視覺聽覺，身體肢體動作，甚至到推理學習，都是屬於人工智慧的範疇。更早以前，基於許多規則來定義系統也可以算是人工智慧的一環。

機器學習 (Machine Learning, ML) – 這是通過大量資料學習其中規則，從而實現人工智慧的一種技術

深度學習 (Deep Learning, DL) – 眾多機器學習演算法中的其中一種方法，前身是類神經網路，由於神經網路的技術突破，深度學習成為目前最活耀的技術，常被用來解決影像或是自然語言辨識中。

機器視覺與深度學習

在傳統機器視覺中，要辨識一張影像需要結合各種演算法才能完成工作，例如使用影像處理來找到臉部特徵、輪廓等資訊，藉此來框出人臉所在位置，但由於每次拍攝的環境、光線、角度的不同，導致無法適用各種情況，再加上早期的機器學習演算法，需要手動擷取特徵，並在特定條件下才能有很好的 Performace，所以機器學習在機器視覺的應用上一直沒有很大突破。

近年來出現的深度學習技術，是基於類神經網路再加上濾波技術 (Convolution)，就是常聽到的 Convolutional Nerual Network (CNN)，再加上網路進步，已經有非常龐大的資料庫以及強大的計算設備，可以直接利用深度學習的方式來學習特徵，

瑕疵檢測樣本數

通常要蒐集瑕疵資料是非常困難的是，因為瑕疵通常都是特殊案例，可能本身設備就難以偵測到，所以樣本數也是非常少，甚至沒有樣本，在這種情況下如何偵測異常，也是一項相當具有挑戰性的工作。

現在使用深度學習，其實可以藉由學習正樣本，來prefer出異常樣本，抑或是用深度學習技術產生出負樣本，比如說生成對抗網路 GAN，當然具體實現可能需要進行更詳盡的survey，但現階段使用深度學習使目前可行性最高的方案。

深度學習的應用

不同的深度神經網路架構，也會有不同應用。現在常見的模型應用架構大概是分類、分割、物件偵測、場景識別、影像雜訊消除、參數迴歸分析、新資料生成。

基於上面這些架構其實可以運用到工廠瑕疵檢測、無人車、無人機、交通管理、門禁系統，也可以做出之前新聞常見的變小孩變動漫人物的濾鏡，也還有許多有趣應用等著被發現。

標記工具

基本要讓深度學習能夠真的學習，還是仰賴人工標記的資料，只是不用進行一系列的特徵萃取，就可以達到辨識能力。

下面列了一些常見的影像標記工具：