2015年11月17日 09:00
機械の目が見たセカイ -コンピュータビジョンがつくるミライ (3) コンピュータビジョンの要素技術と応用範囲(後編)
文字を読み取って、テキスト情報として電子化することで、文書の検索などに役立ちます。
インターネット上の画像・動画の検索
キーワードを元に画像を検索するだけでなく、画像を与えると類似した画像を探してくれるサービスがあります。具体的には、Googleの画像検索で、テキスト入力欄の右側にカメラのマークがあり、それをクリックすることで画像を入力として類似した画像を探すことができます。
Evernote
Evernoteでは、文字を含む画像をアップロードするとサーバ側で文字認識をしてくれ、画像中の文字をテキストで検索することができます。
パノラマ画像生成
スマートフォンのカメラアプリには、パノラマ撮影モードが搭載されています。カメラを動かし、複数枚の画像を撮影して、それらを結合することで視野の広い画像(パノラマ画像)を生成する機能です。
Hyperlapse
SIGGRAPH 2014で発表されたMicrosoft researchの"First-person Hyper-lapse Videos"という論文があります。これは、GoProなどで撮影した映像を、過度な動きを抑制しつつ、早送りした映像に変換する手法です。