Search Results for author: Chenhao Ye

Found 1 papers, 0 papers with code

Efficient Vision-and-Language Pre-training with Text-Relevant Image Patch Selection

no code implementations • 11 Jan 2024 • Wei Ye, Chaoya Jiang, Haiyang Xu, Chenhao Ye, Chenliang Li, Ming Yan, Shikun Zhang, Songhang Huang, Fei Huang

Vision Transformers (ViTs) have become increasingly popular in large-scale Vision and Language Pre-training (VLP) models.

Paper
Add Code

Cannot find the paper you are looking for? You can Submit a new open access paper.