??人工智能包括機器學習,機器學習包括深度學習,學好機器學習的基礎對入門深度學習有很好的幫助。
機器學習是20世紀50年代就出現(xiàn)的數(shù)據(jù)分析技術,最近幾年才風靡是因為深度學習和增強學習的崛起,如AlphaGo和人臉識別等。前人定義機器學習為一個讓計算機自主學習的技術領域,它的核心目的是擬合, 分類和預測,具有極強的融合性,各種交叉學科都可能見到它的身影。
我個人理解就是扔一堆數(shù)據(jù)給計算機,然后它能分析出數(shù)據(jù)的規(guī)律,進而擬合出規(guī)律并預測下一個數(shù)據(jù)的屬性。
應用:語音、人臉識別、語言翻譯、計算機視覺、電影推薦、排序等等
分類
監(jiān)督學習(扔給計算機的數(shù)據(jù)是帶有標簽的,就是帶有數(shù)據(jù)的屬性,比如帶有標簽的貓的照片數(shù)據(jù),計算機會知道它是貓):
1、回歸(regression):利用數(shù)據(jù)擬合出一個規(guī)律,比如(1,1),(2,2)這兩點給計算機,它會擬合出y=x這條直線,這也叫線性回歸,如果數(shù)據(jù)變成三維或更高維,則稱為多元線性回歸。
2、分類(classification):計算機主要對數(shù)據(jù)進行分類,比如貓是貓,狗是狗,這種分類的主流方法有很多,以后會逐一介紹:邏輯回歸(名字叫回歸但實際是分類哦)、感知機(深度學習的基礎)、貝葉斯分類器(為數(shù)據(jù)分析引入了概率,考試的話送分的)、支持向量機(面試必問,很強大,但實際工業(yè)用得少)、決策樹(對結果有非常高的解釋性,考試的話送分的)、隨機森林(很多棵決策樹就變成了森林)、K近鄰(近朱者赤近墨者黑,考試的話送分的),等等
非監(jiān)督學習(就是數(shù)據(jù)沒有標簽了,計算機不知道誰是誰,只能根據(jù)數(shù)據(jù)的距離或概率分布等作出決策):
1、聚類(clustering):最常用的方法就是聚類,其中最主流、簡單的是K均值(與K近鄰都是有參數(shù)K和距離公式,但兩者大大不同),還有高斯混合模型、譜聚類等等
強化學習(模型能以“試錯”的方式進行學習,通過與環(huán)境進行交互獲得的獎賞指導行為,即可以評價每一次的行為,目標是使模型獲得最大的獎賞):
1、馬爾可夫決策過程(Markov Decision Process)
學習
要想全面掌握機器學習,我們還要學習很多的學習算法,如著名的梯度下降(BGD、SGD…),牛頓法等,很多基礎理論知識,如經(jīng)驗風險最小化、方差—誤差、數(shù)據(jù)集(訓練集、測試集、驗證集)、過擬合、矩陣分解(奇異值分解SVD)、降維(PCA、LDA…)。
可能很多人像我剛上課一樣覺得機器學習就是不斷編程嘛,搞代碼的一門課,其實不然,如果只是編程,調(diào)一個很成熟的sklearn庫就能解決大多問題,而且巨方便,但這樣和搭積木沒有太多區(qū)別。深入機器學習就必須了解這些庫是怎么通過一行行代碼實現(xiàn)的,這樣跟調(diào)參俠就會拉開差距,所以數(shù)學知識很重要,涉及高數(shù)、線代、概率論,還有一些凸優(yōu)化。一起加油吧!
附上其他筆記的鏈接:
《無廢話的機器學習筆記(二)(線性回歸)》
《無廢話的機器學習筆記(三)(梯度下降)》
《無廢話的機器學習筆記(四)(感知機、邏輯回歸、貝葉斯)》
《無廢話的機器學習筆記(五)(SVM)》
《無廢話的機器學習筆記(六)(決策樹,KNN)》
《無廢話的機器學習筆記(七)(聚類: kmeans、GMM、譜聚類)》
《無廢話的機器學習筆記(番外)(數(shù)據(jù)集,方差-偏差,過擬合,正則化,降維)》