生成AI 動画を認識し文章で表現する新技術 NECが開発

生成AIの新たな活用技術を日本の大手企業が開発しました。
AIが動画の内容をみずから認識して文章で表現する技術で、ドライブレコーダーの動画から交通事故の原因を分析するなどAIの活用の幅が広がりそうです。

生成AIは、ことばや画像とは違って情報量が多い動画の認識では技術的な難易度が高まるとされています。

こうした中、NECは、AIが動画の内容をみずから認識して文章で表現する新たな技術を開発しました。

100を超える複数のAIがいわば協力して動画を認識するのが特徴で、人物やモノなどそれぞれの認識を得意とするAIがまず、断片的なことばとして文字化します。その認識結果を生成AIがとりまとめ、文章に整える仕組みです。

この技術によって、例えば、ドライブレコーダーの動画から交通事故の原因を分析して報告書を作成したり、建設現場の動画から作業記録を作成したりといった活用を想定しています。

生成AIが動画を認識する技術は、アメリカの大手IT企業なども開発を進めていますが、数多くのAIを組み合わせる方法は珍しいということで、新たな分野の競争で日本の大手企業の存在感が高まるかどうかも注目されます。