4.2) 物体検出とは?

../_images/42_1_object_detection_type.png

図1 物体検出の例

「物体検出」は、画像に映っている物体の名前と位置を検出する手法です。 この手法では、物体の位置を矩形の枠(バウンディングボックスと呼びます)として検出します。

例えば、図1のようにそれぞれ犬と猫が映っている写真があると、 物体が「イヌ」なのか「ネコ」なのか判別した「ラベル名」と、画像上の犬と猫を囲った「バウンディングボックス」 が表示され、画像に映っている物体の名前と位置を教えてくれます。 (この「ラベル名」と「バウンディングボックス」の組み合わせを「ラベル」と呼びます。)

../_images/42_2_flow_object_detection.png

図2 物体検出の流れ

物体検出を行うためには、検出したい物体の映った大量の画像を用意して、 コンピューターに、ラベルを学習させる必要があります。 このため、事前に、学習用の画像にラベルを設定しておきます(「ラベル付け」と呼ばれています)。 十分な量のラベル付けされた画像を学習することで、 新しい画像に対しても、物体の名前と位置を認識できるようになります(図2)。