ChatGPT4による動画の説明文生成AIプロジェクト
〇長時間の動画から利用者の目的に応じた短縮動画と説明文章を自動生成し、LLM(大規模言語モデル(Large Language Model))で行動を分析する技術を開発。 〇1事例として、ドライブレコーダーで撮影した10枚の画像を次のプロンプトでChatGPTに読み込ませて、次の回答を得た。 プロンプト:トラックの前面ガラスのドライブレコーダーから0.1秒おきに連続撮影した10枚の画像です。これらの画像から何が言えますか。1枚1枚の画像の内容よりも、連続した動きを説明してください。日本語で回答してください。 回答:画像の連続する動きを詳しく説明すると、白い車が右側から登場し、徐々に横転しながら激しく回転します。この事故は、道路上で急激に方向を変えようとするか、何らかの障害物に接触して起きた可能性が高いです。回転する際、車は車体が完全にひっくり返り、最終的には火を発しながら路上に静止します。この一連の画像は、非常に重大な交通事故の瞬間を捉えており、ドライブレコーダーが事故の記録として重要な役割を果たしていることが分かります。