fbpx
维基百科

混淆矩阵

在機器學習領域和統計分類問題中,混淆矩阵英語:confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。之所以如此命名,是因為通過這個矩陣可以方便地看出机器是否将两个不同的类混淆了(比如說把一個類錯當成了另一個)。

混淆矩阵(也稱誤差矩陣[1])是一種特殊的, 具有兩個維度的(實際和預測)列联表(英語:contingency table),並且兩維度中都有著一樣的類別的集合。


示例 编辑

如果已經訓練好了一個系統用來區分貓和狗,那混淆矩陣就可以概括算法的測試結果以便將來的檢查。假設一個13個動物的樣本,8隻貓和5隻狗,那混淆矩陣的結果可能如下表所示:

預測的類別
實際的類別
5 3
2 3

在這個混淆矩陣中,系統預測了8只實際的貓,其中系統預測3只是狗,而5隻狗中,則預測有2只是貓。 所有正確的預測都位於表格的對角線上(以粗體突出顯示),因此很容易從視覺上檢查表格中的預測錯誤,因為它們將由對角線之外的值表示。

混淆表 编辑

在預測分析中,混淆表(有時也稱為混淆矩陣)是具有兩行兩列的表,該表報告假陽性假陰性,真陽性和真陰性的數量。這不僅可以進行正確分類(準確度)的分析,還可以進行更詳細的分析。對於分類器的真實性能,準確性不是可靠的指標,因為如果數據集不平衡(即,當不同類別中的觀察數發生很大變化時),它將產生誤導性結果。例如,如果數據中有95隻貓,只有5條狗,則特定的分類器可能會將所有觀察結果歸為貓。總體準確度為95%,但更詳細地,分類器對貓類別的識別率為100%(敏感性),對狗類別的識別率為0%。在這種情況下,F1得分(英語:F1 score)甚至更加不可靠,在這種情況下,F1得分將超過97.4%,而約登指數則消除了這種偏見,並且將0作為亂猜情況下能增加信息量的決定(英語:informed decision)的概率(這裡總是猜測貓)。約登指數為0的系統或測試不具有任何作用[2]

  (總是猜測貓的約登指數)

参考文献 编辑

  1. ^ confusion matrix - 誤差矩陣;混淆矩陣. terms.naer.edu.tw. [2019-10-08]. (原始内容于2019-10-08). 
  2. ^ Youden's J statistic. Wikipedia. 2019-08-08 (英语). 

混淆矩阵, 此條目可参照英語維基百科相應條目来扩充, 2021年12月9日, 若您熟悉来源语言和主题, 请协助参考外语维基百科扩充条目, 请勿直接提交机械翻译, 也不要翻译不可靠, 低品质内容, 依版权协议, 译文需在编辑摘要注明来源, 或于讨论页顶部标记, href, template, translated, page, html, title, template, translated, page, translated, page, 标签, 在機器學習領域和統計分類問題中, 英語, confusion, m. 此條目可参照英語維基百科相應條目来扩充 2021年12月9日 若您熟悉来源语言和主题 请协助参考外语维基百科扩充条目 请勿直接提交机械翻译 也不要翻译不可靠 低品质内容 依版权协议 译文需在编辑摘要注明来源 或于讨论页顶部标记 a href Template Translated page html title Template Translated page Translated page a 标签 在機器學習領域和統計分類問題中 混淆矩阵 英語 confusion matrix 是可视化工具 特别用于监督学习 在无监督学习一般叫做匹配矩阵 矩阵的每一列代表一个类的实例预测 而每一行表示一个实际的类的实例 之所以如此命名 是因為通過這個矩陣可以方便地看出机器是否将两个不同的类混淆了 比如說把一個類錯當成了另一個 混淆矩阵 也稱誤差矩陣 1 是一種特殊的 具有兩個維度的 實際和預測 列联表 英語 contingency table 並且兩維度中都有著一樣的類別的集合 示例 编辑如果已經訓練好了一個系統用來區分貓和狗 那混淆矩陣就可以概括算法的測試結果以便將來的檢查 假設一個13個動物的樣本 8隻貓和5隻狗 那混淆矩陣的結果可能如下表所示 預測的類別貓 狗實際的類別 貓 5 3狗 2 3在這個混淆矩陣中 系統預測了8只實際的貓 其中系統預測3只是狗 而5隻狗中 則預測有2只是貓 所有正確的預測都位於表格的對角線上 以粗體突出顯示 因此很容易從視覺上檢查表格中的預測錯誤 因為它們將由對角線之外的值表示 混淆表 编辑在預測分析中 混淆表 有時也稱為混淆矩陣 是具有兩行兩列的表 該表報告假陽性 假陰性 真陽性和真陰性的數量 這不僅可以進行正確分類 準確度 的分析 還可以進行更詳細的分析 對於分類器的真實性能 準確性不是可靠的指標 因為如果數據集不平衡 即 當不同類別中的觀察數發生很大變化時 它將產生誤導性結果 例如 如果數據中有95隻貓 只有5條狗 則特定的分類器可能會將所有觀察結果歸為貓 總體準確度為95 但更詳細地 分類器對貓類別的識別率為100 敏感性 對狗類別的識別率為0 在這種情況下 F1得分 英語 F1 score 甚至更加不可靠 在這種情況下 F1得分將超過97 4 而約登指數則消除了這種偏見 並且將0作為亂猜情況下能增加信息量的決定 英語 informed decision 的概率 這裡總是猜測貓 約登指數為0的系統或測試不具有任何作用 2 J 9595 0 00 5 1 0 displaystyle J frac 95 95 0 frac 0 0 5 1 0 nbsp 總是猜測貓的約登指數 参考文献 编辑 confusion matrix 誤差矩陣 混淆矩陣 terms naer edu tw 2019 10 08 原始内容存档于2019 10 08 Youden s J statistic Wikipedia 2019 08 08 英语 取自 https zh wikipedia org w index php title 混淆矩阵 amp oldid 73967099, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。