メインコンテンツまでスキップ

OpenAIのAPIを使用しています。正確性の保証はできませんので、ご注意ください。

教師あり学習と教師なし学習

このページでは、機械学習の基本的な概念である「教師あり学習」と「教師なし学習」を具体的な例を交えて解説します。

教師あり学習

教師あり学習は、機械学習の一種で、与えられた入力データ(特徴)とそれに対応する正解データ(ラベル)を用いて、モデルが学習します。学習したモデルを使って、新しい入力データに対する予測することが目的です。

例: 家の価格予測

/intro/supervised.jpg

教師あり学習の具体的な例として、家の価格を予測する問題を考えましょう。家の広さ(平方メートル)や築年数などの特徴データと、それに対応する家の価格(ラベル)が与えられているとします。このデータを使って、家の価格を予測するモデルを学習させます。学習が終わった後、新しい家の特徴データ(広さや築年数など)が与えられたときに、その家の価格を予測できるようになります。

教師なし学習

教師なし学習は、入力データ(特徴)のみが与えられ、正解データ(ラベル)が与えられない状況での学習を指します。このタイプの学習では、データの構造やパターンを見つけ出すことが目的です。

例: 動物の分類

教師なし学習の具体的な例として、動物の分類を考えましょう。動物の体重や体長、足の数などの特徴データが与えられているとします。しかし、どの動物がどの分類に属するかという正解データ(ラベル)は与えられていません。この場合、教師なし学習を用いて、与えられた特徴データに基づいて動物を自然なグループに分類できます。例えば、足が4本で体重が軽い動物を1つのグループとし、足が2本で体重が重い動物を別のグループに分類できます。このように、教師なし学習では、データの内在する構造やパターンを見つけ出すことが目的となります。

教師あり学習と教師なし学習の違い

教師あり学習と教師なし学習の主な違いは、学習データに正解データ(ラベル)が含まれるか否かです。教師あり学習では、入力データと正解データが与えられ、モデルはその関係を学習します。一方、教師なし学習では、正解データが与えられないため、モデルはデータの構造やパターンを発見することを目指します。

まとめ

このページでは、機械学習の基本的な概念である「教師あり学習」と「教師なし学習」を、具体的な例を交えてシンプルに解説しました。

教師あり学習では、家の価格予測のように、与えられた入力データと正解データを用いて学習し、新しい入力データに対する予測します。一方、教師なし学習では、動物の分類のように正解データが与えられない状況で、データの構造やパターンを見つけ出すことを目的とします。

次のステップでは、これらの概念を用いた機械学習手法や、Pythonを使った機械学習の実装方法について学びます。