你真的需要Deep Learning嗎？

September 10, 2021 · 15 min read

Software Engineer & Programming Instructor

不知大家有否親歷過類似的情況：一位講者在侃侃而談，講解其公司/組識未來資訊科技發展的宏圖大計，如何使用人工智能(Artificial Intelligence)、深度學習(Deep Learning)去提升公司效率，更可大大增加盈利云云。筆者當然亦曾在類似情景之中，每次聽到用深度學習解決問題時，筆者例必竪起耳朵，細聽到底深度學習是用作解決其公司/組識當前遇到的甚麼問題。結果往往令筆者大失所望，很多這些宏圖大計都是流於表面，花了許多時間去討論大方向，討論抽象的策略，卻不見有討論過實際運作方案的Technical Details。

為何會出現這樣的現象呢？筆者認為是因為由於普遍大眾對資訊科技界認識不深，有一些科技用語由於聽起來很厲害，就往往成為含混的重災區。人工智能看起來很科幻，Deep Learning(深度學習)聽起來也很莫測高深，作為一個Pitching的題目也很吸引，所以往往就通通「炒成一碟」，務求提過所有科技Buzzword，演講就可平安過關。

甚麼才算是人工智能

人工智能其實有悠長歷史，由上世紀50年代開始就已有人工智能的概念，定義也有廣義與狹義之分。這是一張筆者數年前分享的示意圖。

Data Science

當中所謂的推理機，其實就是將知識以IF-THEN-ELSE的方式表達。所以最基礎的if-else ，其實也算是最廣義的「人工智能」! 例如你的冷氣機，可能就有以下一段程式碼，當溫度低于22度時，就會自動關閉製冷；高于22度，就繼續製冷。

let temperature = sensor_input();
if (temperature < 22) {
    turn_off_compressor();
} else {
    continue_compressor();
}

室內氣溫太低就關冷氣，太高就開冷氣。這種簡單的程式，展現出來也是很具智能的表現。人工智能之價值不在於實行難度，而在解決實際問題之上。

以下一幅網絡趣圖既有趣，更反映現實。

AI vs If-else

Source: 9Gag

大家心目中不少很厲害的AI產品，背後也必然運用了很多if-else。大家可能因此大失所望，AI不是正在改變世界嗎？背後竟然只是if-else。這其實反映了一個想法:

就是普遍大眾認為if-else很簡單，是低級技能; 而AI、Deep Learning等技能很複雜，是高級技能。

這是一個非常常見的誤解，Deep Learning並不取代if-else，兩者是相輔相成關係(Supplementary relation)而不是競爭關係(Competitive relation)。

要理清兩者之間的關係，筆者認為用一個人工智能階梯(Ladder of AI)就最好不過。

人工智能階梯

Ladder of AI

階梯1: 傳統編程

本質上，編寫程式其實就是在編寫「人工智能」，電腦能在定時定候提醒日程、能夠快速計算試算表內的數字、能夠在千分之幾秒快速找尋資料，這些全都是智能的表現，不需要去到「智能叛變」的程度啊! 編寫程式，其實就是人工智能階梯最底一層。

階梯的最低一層並不代表傳統編程比「機器學習」要弱，僅僅代表有些問題，傳統編程可以更直接簡單解決，反而機器學習會舉步為艱。要計算1 + 1、3 * 20 - 25這些簡單數學，傳統編程語言只需要一兩句，用上Deep Learning反而簡單問題複雜化，例如在這個例子裏，就是運用Tensorflow去訓練一個模型，去計算加數。編寫、訓練這個模型固然複雜，可惜就算這樣計算出的結果，也不會是百份百準確，例如計算2000+3000會輸出5095.9385，在機器學習中的迴歸 (Regression)已是不錯的結果，但數學老師只會給你一個零雞蛋。

為何不是百份百準確呢？因為本質上機器學習是基於統計運作(Statistical Nature)之算法，工程師要提供輸入(Input)及輸出(Output)，電腦就通過估算得到結果得到一個模型(model)，但結果不會是完全精確(Exact)。大家心目中的2000+3000 == 5000這個算法，是一個分析解答(Analytical Solution)，也就是必然是精確的答案。

if else vs machine_learning

精確的答案和大概準確的答案那個較好呢？當然是必然精確的答案更好。如果一個問題能夠使用傳統編程解決，寫if-else、for-loop就能夠迎刃而解的話，是完全沒有必要再向階梯上層移動。正如大家食水果的時候，用水果刀切就可以了，總不會用電鋸去切吧？殺雞不用牛刀，筆者認為是一個很基本，卻又很容易忘記的原則。

階梯2: 機器學習

在階梯上上移一層，是機器學習(Machine Learning)，也就是使用統計方法(Statistical Methods)去作預測的領域，由於是用統計方法，所以機器學習需要大量的原始數據(Raw datasets)去幫助電腦調較參數。因此機器學習的第一步，經常是需要收集大量數據，數據愈多，機器學習之學習方法就愈能在其中找出預測的Pattern。

機器學習並不在每個問題範疇(Problem Domain)都得到廣泛應用，以下是一些常見的機器學習問題，等筆者一一解釋:

分類 Classification: 根據數據特徵(Feature)分成不同類別(Class)，例如物件識別(Object Detection)、人面辨識(Face Recognition)等。分類問題的特點是類別皆是有限而離散(Limited and Discrete)，也就是只會在有限選項中選出結果。
迴歸 Regression: 根據數據特徵計算出一個數值之結果，例如估算顧客在網購平台上消費金額、根據不同因素估算房屋價錢。迴歸問題的特點是結果是連續(Continuous)，結果可以有無數多個。
聚類 Clustering: 根據數據特徵分成不同類別，與分類最大分別的是，分類中的類別是已知的類別: 例如男/女、紅/綠燈等等。聚類中的類別是未知類別。所以聚類是一個描述性(Descriptive)機器學習算法，而分類是一個預測性(Predictive)算法。消費者分析是一個常見的聚類應用，企業可以通過聚類分析，找出不同之顧客族群。
異常檢測 Anomaly Detection: 在大量數據中找尋常見的pattern，從而偵測到不常的現象(Anomaly)，網絡安全常常會運用這個技巧，因為網絡入侵正是一個異常事件，運用統計方法去找出異常，正是機器學習的強項。
降低維度 Dimensionality Reduction: 在機器學習之中，有一個著名問題稱為Curse of Dimensionality，意思就是在一個有許多維度(Dimension)的數據之中，會遇上不少很難解決的問題。一個常見的做法是將對一個有許多維度進行降低維度的動作Dimensionality Reduction 的動作，就可以減少問題出現。

大家可以發現，以上五類問題都與統計學有密切關係，機器學習本質就是統計學與電腦科學之結合，因此不少機器學習的問題，都是需要運用統計學方法。大家習慣解決絕大多數的業務邏輯問題，例如「如果A條件發生，就會執行B動作」或是「運行C動作30次」這些情況，其實都無須用到機器學習的算法，只需運用if-else就能輕鬆解決。

筆者在這裏推介一個很好的網站，可以讓初學者學習何謂Machine Learning。下圖是一個KNN分類(KNN Classification)的應用，這個算法可以算是機器學習的ABC。

KNN ml playground

階梯3: 深度學習

最後就是最受人誤解的深度學習(Deep Learning)，深度學習泛指任何使用人工神經網絡(Artificial Neural Network)去解決機器學習之方法。深度學習的應用範圍其實與機器學習很類似，還有像生成式對抗網絡(Generative Adversarial Networks)或強化學習(Reinforcement learning)等進階應用。

深度學習(Deep Learning)比傳統機器學習算法優勝的地方，在於深度學習可以在更多數據時，持續改善準確度(Accuracy)，因此非常適合在大數據時代運用，因為現今可以在互聯網及智能電話應用中收集大量數據，就能大大改善準確度。同時深度學習亦比機器學習更能處理大量特徵的問題，例如在傳統的機器學習中，解決人面辨識常常需要用人手由圖片提取特徵(Feature Extraction)，與之相對，深度學習的卷積神經網絡(Convolutional Neural Network)，可以直接運用圖片的像素作為輸入，大大減少人手提取特徵的成本所在。

ML vs DL

當數據量較少的時候，深度學習並不比傳統機器學習要好，只是在數據量龐大時，能夠比機器學習有更接近人類的表現(Human Level Performance)。隨著數據量漸多，傳統機器學習方法會出現飽和，深度學習則能持續改善。正是這個性質，令深度學習大數據時代，大放異彩。