Jiahui Yu

SimVLM: Simple Visual Language Model Pretraining with Weak Supervision
CoCa: Contrastive Captioners are Image-Text Foundation Models
Gemini: A Family of Highly Capable Multimodal Models
Gemini: A Family of Highly Capable Multimodal Models