以下の空欄に最もよく当てはまる選択肢を1つずつ選べ。
分類問題にはさまざまな性能指標がある。ここでは,サンプルを陽性(Positive)と陰性(Negative)の2クラスに分ける2値分類を考える。(ア)は単純にサンプル全体のうち,予測が正解したサンプル数の比を取ったものである。また,偽陽性(False Positive, FP)を減らすことを重視する場合には(イ)を,逆に偽陰性(False Negative, FN)を減らすことを重視する場合には(ウ)を採用することが望ましい。しかし,この両者はトレードオフの関係にあることから,それらの調和平均を取った(エ)が利用されることも多い。
- 正答率
- 実現率
- 協調率
- 調和率
- 適合率
- 再現率
- f値
- p値
- t値
- z値
【出典】JDLA公式HP 例題
解答
(ア)1 (イ)6 (ウ)5 (エ)7
解説
分類問題の性能指標に関する知識を問う問題です。適切に穴埋めすると次の通りになります。
分類問題にはさまざまな性能指標がある。ここでは,サンプルを陽性(Positive)と陰性(Negative)の2クラスに分ける2値分類を考える。 正答率 は単純にサンプル全体のうち,予測が正解したサンプル数の比を取ったものである。また,偽陽性(False Positive, FP)を減らすことを重視する場合には 再現率 を,逆に偽陰性(False Negative, FN)を減らすことを重視する場合には 適合率 を採用することが望ましい。しかし,この両者はトレードオフの関係にあることから,それらの調和平均を取った f値 が利用されることも多い。