一、前傳:
我們在決定分類的時候依據gi(x) = logP(Ci|x)或是P(Ci|x)來決策,其中X是新進來欲分類的資料,Ci則是現有資料的特徵,所以也可以把P(Ci|x)翻譯成:新進來的資料X屬於特徵Ci的機率。
則右圖為分類的取法
一、前傳:
我們在決定分類的時候依據gi(x) = logP(Ci|x)或是P(Ci|x)來決策,其中X是新進來欲分類的資料,Ci則是現有資料的特徵,所以也可以把P(Ci|x)翻譯成:新進來的資料X屬於特徵Ci的機率。
則右圖為分類的取法
Machine learning---Raymond J. Mooney
『機器學習』是一個新興且很有潛力的領域,它結合了統計、數學與資訊科學等學門。廣義來說,機器學習研究如何讓電腦具有學習的能力,從以往的經驗、資料中學習到知識,以增進電腦本身的效能,因此機器學習也可解釋為利用資料來建立一些模擬真實世界的模式(Model),利用這些模式來描述資料中的特徵(Patterns)以及關係(Relations)。這些模式有兩種用處,第一,瞭解資料的特徵與關係可以提供你做決策所需要的資訊。第二,資料的特徵可以幫助你做預測。
機器學習是一個重要的研究領域,在近幾年也有許多成功的應用。所發展的方法已被應用於消費者行為分析,聲音或影像識別,乃至於生物資訊等新興產業。
本章主要目的在介紹機器學習的基本概念、各種技術及演算法。如decision-tree、induction、Rule Induction、Instance-based、categorization等方法以及相關在自然語言處理上的應用,如:Part-of-speech tagging、Word-sense disambiguation、Information extraction、Anaphora resolution等。
直方圖均化:
1.直方圖在影像處理裡面是把一張圖裡面各個顏色佔的個數或比例顯現成一張分布圖
圖一:上面那三張的直方圖都集中在某個範圍,這樣容易偏亮偏暗對比度低,而最下面那張平均分布的直方圖則是對比度比較佳的
註:y軸為灰階出現機率或是個數,x軸為灰階值