Plus je m'intéresse à cette tendance du ratio CPU/GPU, plus je suis convaincu (me convaincant) que dans un centre de données dédié à l'inférence, les CPU seront plus nombreux que les GPU/XPUs. Cela n'était même pas une considération il y a un an, mais l'évolution des modèles avec des agents suggère cette direction.