二値分類

記事数:(2)

AI活用

ロジスティック回帰で未来予測

回帰分析とは、ある事柄の結果に影響を与えていると考えられる原因となる事柄を見つけ出し、それらの関係性を数量的に明らかにする統計的な方法です。具体的に説明すると、ある商品の売り上げ数量という結果に、広告に使ったお金の量や商品の値段、気温といった原因となる事柄がどの程度影響を与えているのかを数値で表すことができます。そして、この数値化された関係性を利用することで、将来の売り上げ数量を予測することも可能になります。回帰分析には様々な種類がありますが、その中でもロジスティック回帰と呼ばれる方法は、結果が「成功」か「失敗」のように2つの値しか取らない場合に特に役立ちます。例えば、お客さんが商品を買うか買わないか、新しい薬が効果があるかないかといった予測に活用できます。売り上げ数量を予測する例で考えてみましょう。まず、過去の売り上げ数量のデータと、同時に取得した広告費、商品の価格、気温のデータを集めます。次に、これらのデータを用いて回帰分析を行います。すると、例えば「広告費を1万円増やすと売り上げ数量は平均で10個増える」、「気温が1度上がると売り上げ数量は平均で5個減る」といった関係性が数値で表されます。これらの数値は回帰係数と呼ばれ、それぞれの原因となる事柄が結果にどれくらい影響を与えるかを表す指標となります。回帰分析によって得られた関係性を利用することで、今後の売り上げ予測を行うことができます。例えば、次の月に広告費を2万円増やし、商品の価格を据え置き、気温が平均で2度下がると予想される場合、回帰分析の結果に基づいて売り上げ数量の変化を予測できます。具体的には、「広告費による増加分は20個、気温による増加分は10個」となり、合計で30個の売り上げ増加が見込まれると予測できます。このように、回帰分析は事業の計画や意思決定に役立つ強力な道具となります。
AI活用

AUC:機械学習モデルの性能評価

機械学習は、現代社会の様々な場所で活用されています。例えば、迷惑メールを自動で振り分ける、好みだと思われる商品を薦めてくれる、病気の兆候を見つけるといった作業を陰で支えています。こうした機械学習は、多くの場合、大量のデータから規則性やパターンを学び、将来を予測する「モデル」を構築することで実現されます。そして、作成したモデルがどれほど正確に予測できるのかを測ることは、モデルの開発や改良をする上で非常に大切です。この予測精度を測る指標の一つに「AUC」と呼ばれるものがあります。今回は、このAUCについて詳しく説明します。AUCは、「Area Under the Curve」の略で、日本語では「曲線の下側の面積」という意味です。この曲線は「ROC曲線」と呼ばれ、機械学習モデルの性能を視覚的に表すために使われます。ROC曲線は、横軸に「偽陽性率」、縦軸に「真陽性率」をとって描かれます。「真陽性率」とは、実際に陽性であるものの中で、正しく陽性と予測できた割合のことです。例えば、病気の人を正しく病気と診断できた割合です。一方、「偽陽性率」とは、実際には陰性であるものの中で、誤って陽性と予測してしまった割合のことです。例えば、健康な人を誤って病気と診断してしまった割合です。理想的なモデルは、真陽性率が100%で、偽陽性率が0%である、つまり、全ての陽性を正しく陽性と予測し、陰性を誤って陽性と予測することがないモデルです。この場合、ROC曲線は左上隅を通る形になり、AUCは1となります。逆に、全く予測できないモデル、つまりランダムに陽性と陰性を判断するモデルでは、ROC曲線は対角線となり、AUCは0.5となります。つまり、AUCの値は0.5から1の間の値をとり、1に近いほど性能が良いモデルと言えます。AUCは、様々な場面で活用される機械学習モデルの性能を評価する上で、重要な指標の一つです。AUCを理解することで、より精度の高いモデルを構築し、様々な問題を解決することに繋がるでしょう。