分類

想象一下,一個系統想要檢測一籃子水果中的蘋果橘子。系統可以採摘水果,提取它的一些屬性(例如該水果的重量)。

假設系統有老師! 它教導系統哪些物件是蘋果,哪些是橙子。這是監督分類問題的一個例子。它受到監督,因為我們已經標註了示例。它是分類,因為輸出是我們物件所屬的類的預測。

在這個例子中,我們考慮 3 個特徵(屬性/解釋變數):

  1. 所選果實的重量大於 .5 克
  2. 尺寸大於 10 釐米
  3. 是顏色是紅色

(0 表示否,1 表示是)

因此,為了表示一個蘋果/橙色,我們有一系列(稱為向量)3 個屬性(通常稱為特徵向量)

(例如[0,0,1]表示這個水果重量不大於 .5 克,它的大小不大於 10 釐米,它的顏色是紅色)

因此,我們隨機挑選 10 個水果並測量它們的特性。然後教師(人)手動將每個水果標記為 apple => [1] 或 orange => [2]

例如)老師選擇一種蘋果水果。這個蘋果系統的表示可能是這樣的: [ 1,1,1 ] => [1] ,這意味著,這個水果的重量大於 .5 克大於 10 釐米的大小3 大。這種水果的顏色是紅色,最後它是一個蘋果 (=> [1])

因此,對於所有 10 種水果,老師將每種水果標記為蘋果[=> 1]或橙色[=> 2],系統找到了它們的屬性。你猜我們有一系列的向量(稱之為矩陣)代表整個 10 個水果。