埼玉大学 / 工学部 情報工学科
従来法からの高速化
画像・音声処理の研究室に所属し、単眼画像から深度情報を用いて高速にステレオ画像対を生成する研究を行っています。従来の高精度で高速な生成モデルであるStereoDiffusionをベースに改良を重ね、当初の40秒から0.052秒(19FPS)でのステレオ画像生成を実現しました(2025/02月現在)。これは、従来法の0.0013倍の時間に当たります。 この成果は、2025年2月末に国際会議で発表予定です。
Discover companies you will love
埼玉大学大学院 / 理工学研究科数理電子情報専攻
大学院進学の為、25卒選考での就職は考えておりません。 インターンとしての勤務または27卒での就職を考えております.
AI領域に興味があります。
学部から引き続き、単眼画像から深度推定を用いて立体視可能なステレオ画像対を高速生成する研究を行っています。
フランス発のエンジニア養成機関です。教師がいない環境で、与えられた課題を生徒同士で話し合いながら学習をしていく仕組みが特徴的です。また、課題を提出する際にはレビューを受ける必要があり、コードへの理解や説明力が身につきます。
画像・音声処理の研究室に所属し、単眼画像から深度情報を用いて高速にステレオ画像対を生成する研究を行っています。従来の高精度で高速な生成モデルであるStereoDiffusion(1枚生成に40秒 : RTX3090)をベースに改良を重ね、現在では0.052秒(19FPS)でのステレオ画像生成を実現しています。(2025/02月現在) 2月末に開催された国際会議にて、Student Paper Award を受賞しました。
埼玉大学 / 工学部 情報工学科
画像・音声処理の研究室に所属し、単眼画像から深度情報を用いて高速にステレオ画像対を生成する研究を行っています。従来の高精度で高速な生成モデルであるStereoDiffusionをベースに改良を重ね、当初の40秒から0.052秒(19FPS)でのステレオ画像生成を実現しました(2025/02月現在)。これは、従来法の0.0013倍の時間に当たります。 この成果は、2025年2月末に国際会議で発表予定です。