GRIT: Faster and Better Image Captioning Transformer Using Dual Visual Features

Oct 1, 2022·

Van-Quang Nguyen

,

Masanori Suganuma

,

Takayuki Okatani

· 0 min read

Type

Conference paper

Publication

European Conference on Computer Vision (ECCV) 2022

Last updated on Oct 1, 2022

Van-Quang Nguyen

Authors

Van-Quang Nguyen

Postdoc Researcher, RIKEN AIP

← Leveraging Video Coding Knowledge for Deep Video Enhancement Jul 1, 2023

Look Wide and Interpret Twice: Improving Performance on Interactive Instruction-following Tasks Aug 1, 2021 →