Alexandre Muzio | DeepAI

DeepAI

AI Chat AI Image Generator AI Video AI Music Voice Chat AI Photo Editor Math AI

Featured Co-authors

Furu Wei
184 publications
Jian Yang
171 publications
Rui Liu
95 publications
Li Dong
95 publications
Shuming Ma
66 publications
Stefan Lee
52 publications
Shaohan Huang
46 publications
Dongdong Zhang
37 publications
Yuxiong He
34 publications
Xia Song
25 publications
Prasad Tadepalli
24 publications

research

∙ 05/28/2022

Gating Dropout: Communication-efficient Regularization for Sparsely Activated Transformers

Sparsely activated transformers, such as Mixture of Experts (MoE), have ...

0 Rui Liu, et al. ∙

research

∙ 11/03/2021

Multilingual Machine Translation Systems from Microsoft for WMT21 Shared Task

This report describes Microsoft's machine translation systems for the WM...

0 Jian Yang, et al. ∙

research

∙ 09/22/2021

Scalable and Efficient MoE Training for Multitask Multilingual Models

The Mixture of Experts (MoE) models are an emerging class of sparsely ac...

0 Young Jin Kim, et al. ∙

research

∙ 09/10/2021

Improving Multilingual Translation by Representation and Gradient Regularization

Multilingual Neural Machine Translation (NMT) enables one model to serve...

7 Yilin Yang, et al. ∙

research

∙ 06/25/2021

DeltaLM: Encoder-Decoder Pre-training for Language Generation and Translation by Augmenting Pretrained Multilingual Encoders

While pretrained encoders have achieved success in various natural langu...

0 Shuming Ma, et al. ∙

research

∙ 12/31/2020

XLM-T: Scaling up Multilingual Machine Translation with Pretrained Cross-lingual Transformer Encoders

Multilingual machine translation enables a single model to translate bet...

0 Shuming Ma, et al. ∙