Comment en est-on arriver aux Transformers ?
Quels contraintes a t-on rencontré ?
Problème 1: Dilution de l’information pendant l’encodage
Problème 2: Dilution du context
Problème 3: Vanishing gradient problem
Problème 4: Performance du contexte