Ce n’est pas vraiment sur les gros calculs que le gain se fait, c’est surtout pour des algos massivement parallèle qu’il y a un gain.
Si tu veux faire un gros calcul sur des flottants, mais qu’il n’est pas parallélisable, mieux vaut le faire sur le CPU (résultat plus précis, et plus rapide).
Le point faible de ces technos, c’est qu’il faut copier les données de la mémoire centrale vers la mémoire du GPU. Et c’est un vrai goulot d’étranglement. Et que, même si avec Cuda C tu as un langage “haut niveau”, c’est assez dur de faire des programmes efficaces (utilisation de la mémoire partagée, accès à la mémoire centrale ordonnée…)