Shusheng Yang

research

∙ 08/31/2023

TouchStone: Evaluating Vision-Language Models by Language Models

Large vision-language models (LVLMs) have recently witnessed rapid advan...

0 Shuai Bai, et al. ∙

research

∙ 08/24/2023

Qwen-VL: A Frontier Large Vision-Language Model with Versatile Abilities

We introduce the Qwen-VL series, a set of large-scale vision-language mo...

0 Jinze Bai, et al. ∙

research

∙ 05/24/2023

ViTMatte: Boosting Image Matting with Pretrained Plain Vision Transformers

Recently, plain vision Transformers (ViTs) have shown impressive perform...

0 Jingfeng Yao, et al. ∙

research

∙ 03/30/2023

MobileInst: Video Instance Segmentation on the Mobile

Although recent approaches aiming for video instance segmentation have a...

0 Renhong Zhang, et al. ∙

research

∙ 01/17/2023

Masked Visual Reconstruction in Language Semantic Space

Both masked image modeling (MIM) and natural language supervision have f...

8 Shusheng Yang, et al. ∙

research

∙ 05/19/2022

Masked Image Modeling with Denoising Contrast

Since the development of self-supervised visual representation learning ...

13 Kun Yi, et al. ∙

research

∙ 04/18/2022

Temporally Efficient Vision Transformer for Video Instance Segmentation

Recently vision transformer has achieved tremendous success on image-lev...

0 Shusheng Yang, et al. ∙

research

∙ 04/06/2022

Unleashing Vanilla Vision Transformer with Masked Image Modeling for Object Detection

We present an approach to efficiently and effectively adapt a masked ima...

14 Yuxin Fang, et al. ∙

research

∙ 02/26/2022

Relational Surrogate Loss Learning

Evaluation metrics in machine learning are often hardly taken as loss fu...

0 Tao Huang, et al. ∙

research

∙ 06/22/2021

Tracking Instances as Queries

Recently, query based deep networks catch lots of attention owing to the...

0 Shusheng Yang, et al. ∙

research

∙ 05/05/2021

QueryInst: Parallelly Supervised Mask Query for Instance Segmentation

Recently, query based object detection frameworks achieve comparable per...

6 Yuxin Fang, et al. ∙

research

∙ 04/13/2021

Crossover Learning for Fast Online Video Instance Segmentation

Modeling temporal visual context across frames is critical for video ins...

0 Shusheng Yang, et al. ∙

Shusheng Yang

Featured Co-authors

Sign in with Google

Consider DeepAI Pro