情報に関する理論(全50問中2問目)

AIにおける機械学習で,2クラス分類モデルの評価方法として用いられるROC曲線の説明として,適切なものはどれか。

出典:令和5年春期 問 3

  • 真陽性率と偽陽性率の関係を示す曲線である。
  • 真陽性率と適合率の関係を示す曲線である。
  • 正解率と適合率の関係を示す曲線である。
  • 適合率と偽陽性率の関係を示す曲線である。
正解 問題へ
分野:テクノロジ系
中分類:基礎理論
小分類:情報に関する理論
解説
与えられたデータを「はい・いいえ」「陽性・陰性」などの2つのクラスに分類する機械学習モデルにおける判定結果は、AIが予測したクラスと実際のクラス分類の関係から、真陽性、偽陽性、真陰性、偽陰性の4つに分けることができます。
03_1.gif
この4つの値を使って2値分類モデルの精度を示す指標として、正解率、再現率(真陽性率)、適合率、特異度、偽陽性率などがあります。
正解率
実際のクラスと同じクラスを予測した割合:TP+TNTP+FN+FP+TN
適合率
陽性と予測したものうち実際に陽性だった割合:TPTP+FP
真陽性率(再現率、感度)
実際に陽性のものを正しく陽性と予測した割合:TPTP+FN
特異度
実際に陰性のものを正しく陰性と予測した割合:TNFP+TN
偽陽性率
実際に陰性のものを誤って陽性と予測した割合:FPFP+TN
ROC曲線は、縦軸に真陽性率、横軸に偽陽性率にとったグラフ上で、陽性・陰性の判断基準となるしきい値を動かしながら、各点での真陽性率と偽陽性率を打点していくことで描かれる曲線です。真陽性率と偽陽性率はトレードオフの関係にありますが、高い真陽性率を維持しつつ、偽陽性率をどれだけ抑えたモデルとなっているかを可視化することができます。
03_2.gif
したがって「ア」が正解です。

なお「イ」は、ROC曲線と同じく、2値分類モデルの性能評価に使われるPR曲線(Precision Recall Curve)の説明です。

Pagetop