圖解機器學習是一個用圖文並茂的方式來闡明機器學習(Machine
Learning)的規則和演算法,該網站由舊金山和紐約房屋資料的資料樣本,我們將會構建一個機器學習模型來將他們區分開來。
機器學習(Machine Learning)是電腦科學的一個方向。利用統計學的技巧,機器學習演算法(Machine Learning
Algorithms)能夠自動學習並識別資料內的規律。憑著這些規律,演算法便能作出高度準確的預測。
假設我們必須憑資料預測一棟房屋是位於紐約市, 我們應該怎樣開始呢?在機器學習中,這是一種分類任務。 (Classification
Task)。如果你到過舊金山,你可能會知道那裡的地形是出了名的高低不平。所以不妨讓我們從房屋的海拔入手,看看房屋的海拔資訊能不能協助我們去區分它們。
在資料裡尋找規律就是機器學習的基礎。所有的機器學習演算法都是使用統計學習去快速地找到最佳的分界。其中介紹了一種叫決策樹的機器學習演算法。決策樹十分簡單,它會逐一分析資料內的維度,從而去尋找分界線。