Publications

Korawat Charoenpitaks, Van-Quang Nguyen, Masanori Suganuma, Kentaro Arai, Seiji Totsuka, Hiroshi Ino, Takayuki Okatani (2025). TB-Bench: Training and Testing Multi-Modal AI for Understanding Spatio-Temporal Traffic Behaviors from Dashcam Images/Videos. CVPR 2025 Workshop on Autonomous Driving.

Kittitouch Areerob, Van-Quang Nguyen, Xianfeng Li, Shogo Inadomi, Toru Shimada, Hiroyuki Kanasaki, Zhijie Wang, Masanori Suganuma, Keiji Nagatani, Pang-Jo Chun, Takayuki Okatani (2025). Multimodal artificial intelligence approaches using large language models for expert-level landslide image analysis. Computer-Aided Civil and Infrastructure Engineering (CACIE), 2025.

Korawat Charoenpitaks, Van-Quang Nguyen, Takayuki Okatani (2025). Critical Scenario Prediction Planning and Reasoning. In submission to IEEE Transactions on Intelligent Vehicles (TIV) 2025.

Anh-Cuong Pham, Van-Quang Nguyen, Thi-Hong Vuong, Quang-Thuy Ha (2024). KTVIC: A Vietnamese Image Captioning Dataset on the Life Domain. ArXiv preprint, 2024.

Korawat Charoenpitaks, Van-Quang Nguyen, Masanori Suganuma, Masahiro Takahashi, Ryoma Niihara, Takayuki Okatani (2024). Exploring the Potential of Multi-Modal AI for Driving Hazard Prediction. IEEE Transactions on Intelligent Vehicles (TIV), 2024.

Korawat Charoenpitaks, Van-Quang Nguyen, Masanori Suganuma, Masahiro Takahashi, Ryoma Niihara, Takayuki Okatani (2023). Visual Abductive Reasoning Meets Driving Hazard Prediction: Problem Formulation and Dataset. ArXiv preprint, 2023.

Thong Bach, Thuong Nguyen Canh, Van-Quang Nguyen (2023). Leveraging Video Coding Knowledge for Deep Video Enhancement. ArXiv preprint, 2023.

Van-Quang Nguyen, Masanori Suganuma, Takayuki Okatani (2022). GRIT: Faster and Better Image Captioning Transformer Using Dual Visual Features. European Conference on Computer Vision (ECCV) 2022.

Van-Quang Nguyen, Masanori Suganuma, Takayuki Okatani (2021). Look Wide and Interpret Twice: Improving Performance on Interactive Instruction-following Tasks. International Joint Conference on Artificial Intelligence (IJCAI) 2021.

Van-Quang Nguyen, Masanori Suganuma, Takayuki Okatani (2020). Efficient Attention Mechanism for Visual Dialog that can Handle All the Interactions between Multiple Inputs. European Conference on Computer Vision (ECCV) 2020.