fbpx
维基百科

F-score

F值,亦被稱做F-measure,是一種量測算法的精確度常用的指標,經常用來判斷演算法的精確度。目前在辨識、偵測相關的演算法中經常會分別提到精確率(precision)和召回率(recall),F-score能同時考慮這兩個數值,平衡地反映這個演算法的精確度

定義 编辑

一般式 编辑

 

 是使用者自行定義的參數,由一般式可見F-score能同時考慮precision和recall這兩種數值。分子為precision和recall相乘,根據這個式子,只要precision或recall趨近於0,F-score就會趨近於0,代表著這個演算法的精確度非常低。一個好的演算法,最好能夠平衡recall和precision,且儘量讓兩種指標都很高。所以有一套判斷方式可以同時考慮recall和precision。当 时,F-score退化为precision;当 时,F-score退化为recall。


Precision和Recall權重一樣時 编辑

一般上來說,提到F-score且沒有特別的定義時,是指 時的F-score,亦有寫作F1-score。代表使用者同樣的注重precision和recall的這兩個指標。其分數可以說是precision和recall的調和平均,式子如下:

 

F-score最理想的數值是趨近於1,做法是讓precision和recall都有很高的值。若兩者皆為1,使得 ,則F-score = 1 (100%),代表該算法有著最佳的精確度

F-score的組成元素 编辑

TP, FN, FP, TN 编辑

 
量測常見的4中情況

前面的true/false修饰后面的positive/negative,后面的positive/negative是我们的方法的判断。

  • TP (true positive):我们的方法判断为真,这个判断是对的。即事實上為真,而且被我們的方法判斷為真的情形。
  • FN (false negative):我们的方法判断为不真,这个判断是错的。即事實上為真,卻被我們的方法判斷為不真的情形。
  • FP (false positive):我们的方法判断为真,这个判断是错的。即事實上不為真,卻被我們的方法誤判為真的情形。
  • TN (true negative):我们的方法判断为不真,这个判断是对的。即事實上不為真,而且被我們的方法判斷成不為真的情形。

以抓犯人為例,TP是有罪而且被抓到的情形,FP是無罪但被誤抓的情形,FN是有罪但沒被抓到的情形,TN是無罪且未被誤逮的情形

混淆矩陣
  判斷為真 判斷不為真
事實上為真 TP FN
事實上不為真 FP TN

Precision和Recall 编辑

  (positive prediction rate)

Precision的分母為兩種判斷為真的情形的總和(范恩圖中完整綠色的部份)

解釋:當辨識結果為FP的代價很高時,F-score應該著重此指標,亦即precision要很高。
例子:辨識電郵信箱里的垃圾郵件時,如果某封被誤判成垃圾郵件(即FP)時,使用者可能就此錯過重要的通知。


 

Recall的分母事實上為真的情形的總和(范恩圖中完整紫色的部份)

解釋:當辨識結果為FN的代價很高時,F-score應該著重此指標,亦即recall要很高。
舉例:一個傳染病診斷辨識系統中,如果某個傳染病患者被誤判成陰性(即FN),當地的社區的居民就落入被傳染的高風險之中。
舉例:真正犯罪的人當中,有多少比例的罪犯被抓到。或,一張照片當中,有多少人臉被偵測到。


Precision和Recall的異同 编辑

  • 它們的分子皆為TP。
  • F-score的recall和precision之間存在著權衡的關係,可通過 β 調整更重視的部份。


以警察抓犯人的故事為例:

一位警察很厲害,抓了很多犯人,但是這些犯人當中,只有少部分真正有罪,其他都是被冤枉的。

  • recall 高,因為該抓與不該抓的犯人都被抓到了。
  • precision 低,因為很多都是沒犯罪的人。
「寧可錯抓一百,也不可放過一個」
recall 高,但 precision 低。


一個警察非常嚴謹,只逮捕真正有犯罪的人,不抓實在是沒辦法肯定的犯人。

  • precision 高,因為通常被抓到人的都是有罪的。
  • recall 低,因為不小心放掉一大群犯人。
「寧可錯放一百,也不可冤枉一個」
precision 高,但 recall 低。

應用 编辑

F-score經常用於評估資訊檢索的結果,如:

性质 编辑

F-score 是等于取回物品集和相关物品集的Dice系数

參考 编辑

  • 國立台灣大學電信工程學研究所丁建均教授. 高等數位訊號處理. [2020-07-01]. (原始内容于2020-05-08). 
  • F度量 (F-measure). 國家教育研究院雙語詞彙資料庫. [2020-07-01]. (原始内容于2020-07-03). 

score, 本條目存在以下問題, 請協助改善本條目或在討論頁針對議題發表看法, 此條目包含過多行話或專業術語, 可能需要簡化或提出進一步解釋, 2020年7月4日, 請在討論頁中發表對於本議題的看法, 並移除或解釋本條目中的行話, 此條目需要編修, 以確保文法, 用詞, 语气, 格式, 標點等使用恰当, 2020年7月4日, 請按照校對指引, 幫助编辑這個條目, 幫助, 討論, 此條目可参照英語維基百科相應條目来扩充, 2020年7月4日, 若您熟悉来源语言和主题, 请协助参考外语维基百科扩充条目, 请勿直接提交. 本條目存在以下問題 請協助改善本條目或在討論頁針對議題發表看法 此條目包含過多行話或專業術語 可能需要簡化或提出進一步解釋 2020年7月4日 請在討論頁中發表對於本議題的看法 並移除或解釋本條目中的行話 此條目需要編修 以確保文法 用詞 语气 格式 標點等使用恰当 2020年7月4日 請按照校對指引 幫助编辑這個條目 幫助 討論 此條目可参照英語維基百科相應條目来扩充 2020年7月4日 若您熟悉来源语言和主题 请协助参考外语维基百科扩充条目 请勿直接提交机械翻译 也不要翻译不可靠 低品质内容 依版权协议 译文需在编辑摘要注明来源 或于讨论页顶部标记 a href Template Translated page html title Template Translated page Translated page a 标签 此條目需要补充更多来源 2020年7月4日 请协助補充多方面可靠来源以改善这篇条目 无法查证的内容可能會因為异议提出而被移除 致使用者 请搜索一下条目的标题 来源搜索 F score 网页 新闻 书籍 学术 图像 以检查网络上是否存在该主题的更多可靠来源 判定指引 此條目的引用需要进行清理 使其符合格式 2020年7月4日 参考文献应符合正确的引用 脚注及外部链接格式 此條目已列出參考文獻 但因為沒有文內引註而使來源仍然不明 2022年4月24日 请加上合适的文內引註来改善这篇条目 F值 亦被稱做F measure 是一種量測算法的精確度常用的指標 經常用來判斷演算法的精確度 目前在辨識 偵測相關的演算法中經常會分別提到精確率 precision 和召回率 recall F score能同時考慮這兩個數值 平衡地反映這個演算法的精確度 目录 1 定義 1 1 一般式 1 2 Precision和Recall權重一樣時 2 F score的組成元素 2 1 TP FN FP TN 2 2 Precision和Recall 2 2 1 Precision和Recall的異同 3 應用 4 性质 5 參考定義 编辑一般式 编辑 F s c o r e 1 b 2 p r e c i s i o n r e c a l l b 2 p r e c i s i o n r e c a l l displaystyle F score frac 1 beta 2 precision times recall beta 2 precision recall nbsp b displaystyle beta nbsp 是使用者自行定義的參數 由一般式可見F score能同時考慮precision和recall這兩種數值 分子為precision和recall相乘 根據這個式子 只要precision或recall趨近於0 F score就會趨近於0 代表著這個演算法的精確度非常低 一個好的演算法 最好能夠平衡recall和precision 且儘量讓兩種指標都很高 所以有一套判斷方式可以同時考慮recall和precision 当b 0 displaystyle beta rightarrow 0 nbsp 时 F score退化为precision 当b displaystyle beta rightarrow infty nbsp 时 F score退化为recall Precision和Recall權重一樣時 编辑 一般上來說 提到F score且沒有特別的定義時 是指b 1 displaystyle beta 1 nbsp 時的F score 亦有寫作F1 score 代表使用者同樣的注重precision和recall的這兩個指標 其分數可以說是precision和recall的調和平均 式子如下 F 1 s c o r e 2 p r e c i s i o n r e c a l l p r e c i s i o n r e c a l l displaystyle F1 score 2 frac precision times recall precision recall nbsp F score最理想的數值是趨近於1 做法是讓precision和recall都有很高的值 若兩者皆為1 使得2 1 2 1 displaystyle 2 cdot frac 1 2 1 nbsp 則F score 1 100 代表該算法有著最佳的精確度 F score的組成元素 编辑TP FN FP TN 编辑 nbsp 量測常見的4中情況前面的true false修饰后面的positive negative 后面的positive negative是我们的方法的判断 TP true positive 我们的方法判断为真 这个判断是对的 即事實上為真 而且被我們的方法判斷為真的情形 FN false negative 我们的方法判断为不真 这个判断是错的 即事實上為真 卻被我們的方法判斷為不真的情形 FP false positive 我们的方法判断为真 这个判断是错的 即事實上不為真 卻被我們的方法誤判為真的情形 TN true negative 我们的方法判断为不真 这个判断是对的 即事實上不為真 而且被我們的方法判斷成不為真的情形 以抓犯人為例 TP是有罪而且被抓到的情形 FP是無罪但被誤抓的情形 FN是有罪但沒被抓到的情形 TN是無罪且未被誤逮的情形 混淆矩陣 判斷為真 判斷不為真事實上為真 TP FN事實上不為真 FP TNPrecision和Recall 编辑 p r e c i s i o n T P T P F P P displaystyle precision frac TP TP FP P nbsp positive prediction rate Precision的分母為兩種判斷為真的情形的總和 范恩圖中完整綠色的部份 解釋 當辨識結果為FP的代價很高時 F score應該著重此指標 亦即precision要很高 例子 辨識電郵信箱里的垃圾郵件時 如果某封被誤判成垃圾郵件 即FP 時 使用者可能就此錯過重要的通知 r e c a l l T P T P F N displaystyle recall frac TP TP FN nbsp Recall的分母為事實上為真的情形的總和 范恩圖中完整紫色的部份 解釋 當辨識結果為FN的代價很高時 F score應該著重此指標 亦即recall要很高 舉例 一個傳染病診斷辨識系統中 如果某個傳染病患者被誤判成陰性 即FN 當地的社區的居民就落入被傳染的高風險之中 舉例 真正犯罪的人當中 有多少比例的罪犯被抓到 或 一張照片當中 有多少人臉被偵測到 Precision和Recall的異同 编辑 它們的分子皆為TP F score的recall和precision之間存在著權衡的關係 可通過 b 調整更重視的部份 以警察抓犯人的故事為例 一位警察很厲害 抓了很多犯人 但是這些犯人當中 只有少部分真正有罪 其他都是被冤枉的 recall 高 因為該抓與不該抓的犯人都被抓到了 precision 低 因為很多都是沒犯罪的人 寧可錯抓一百 也不可放過一個 recall 高 但 precision 低 一個警察非常嚴謹 只逮捕真正有犯罪的人 不抓實在是沒辦法肯定的犯人 precision 高 因為通常被抓到人的都是有罪的 recall 低 因為不小心放掉一大群犯人 寧可錯放一百 也不可冤枉一個 precision 高 但 recall 低 應用 编辑F score經常用於評估資訊檢索的結果 如 圖像檢索 機器學習模型性质 编辑F score 是等于取回物品集和相关物品集的Dice系数參考 编辑國立台灣大學電信工程學研究所丁建均教授 高等數位訊號處理 2020 07 01 原始内容存档于2020 05 08 F度量 F measure 國家教育研究院雙語詞彙資料庫 2020 07 01 原始内容存档于2020 07 03 取自 https zh wikipedia org w index php title F score amp oldid 77354432, 维基百科,wiki,书籍,书籍,图书馆,

文章

,阅读,下载,免费,免费下载,mp3,视频,mp4,3gp, jpg,jpeg,gif,png,图片,音乐,歌曲,电影,书籍,游戏,游戏。