VAST: A Vision-Audio-Subtitle-Text Omni-Modality Foundation Model and Dataset

Item #:

075280-3185

Details

DOI: https://doi.org/10.52202/075280-3185
Author(s): Sihan Chen, Handong Li, Jing Liu, Mingzhen Sun, Qunbo Wang, Zijia Zhao, Xinxin Zhu
Pages: 72842-72866 (25 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 36
Date/Location: Held 10-16 December 2023, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 36
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)

DOI: https://doi.org/10.52202/075280-3185
Author(s): Sihan Chen, Handong Li, Jing Liu, Mingzhen Sun, Qunbo Wang, Zijia Zhao, Xinxin Zhu
Pages: 72842-72866 (25 pages)
Format: PDF Paper Download
Conference: Advances in Neural Information Processing Systems 36
Date/Location: Held 10-16 December 2023, New Orleans, Louisiana, USA.
Series: Advances in Neural Information Processing Systems 36
Publisher: Neural Information Processing Systems Foundation, Inc. (NeurIPS)