廣井 優姫 早稲田大学



1.1 研究背景

また、⼈物照合技術は⼤きく⼆つに分けることができる。⼀つ⽬は Image-based re-ID である。これは画像情報から特徴量を抽出することができる。しかし、画像情報のみを取得するので、似た服装を着た別⼈物や向きが異なる同⼀⼈物に対して識別が難しいという課題がある。⼀⽅、⼆つ⽬の Video-based re-ID は画像情報と時系列情報から時空間特徴量を抽出することが可能であり、⾒た⽬だけでなく歩き⽅などの動作により識別することができる。そのため、近年では後者の Video-based re-ID の⽅が盛んに研究されている。しかし、 Video-based re-ID にもまだ課題が残っている。例えば、動作により⼈物を識別することから、歩⾏以外の特定の動作(ポケットから物を取り出す動作、携帯電話で電話をかける動作など)の影響を受けやすいことが挙げられる。更に、⼊⼒データが動画もしくは時系列上に連続した複数の画像である必要があることから、⼊⼒する動画データのフレーム数のばらつきの違い、すなわち⼈物がカメラに写っている時間が異なるという課題が挙げられる。

1.2 研究⽬的
本研究では、Video-based re-ID に焦点を当て、時空間特徴量と提案⼿法により、服装やアイテム、⾏動による⼈物の写り⽅の違いや⼊⼒する動画データのフレーム数のばらつきといった従来の課題を改善し、従来⼿法[1]からの精度の向上を⽬的とする。

1.3 本論⽂の構成
本論⽂は以下の 6 章で構成されている。
第 1 章では本研究の研究背景及び⽬的について⽰す。
第 2 章では関連研究として、本研究の基盤となる CNN や時系列モデリング⼿法として Temporal Pooling、3D CNN、Convolutional LSTM、そしてストライプ分割特徴量について述べる。
第 3 章では提案⼿法として、Two-stream Feature-fusion Architecture、Shifting-subclip、そして Hard Positive Mining について述べる。
第 4 章では本実験で使⽤するデータセット、本実験の内容及び実験条件について述べる。
第 5 章では結果と考察として、実験結果を⽰し、実験結果から推測される考察について述べる。
第 6 章では本稿のまとめと今後の課題について述べる。


