TurboQuant : l'algorithme de Google qui change l'économie de l'IA
TurboQuant : l'algorithme de Google qui change l'économie de l'IA
Le 24 mars, Google Research a lâché une bombe discrète : TurboQuant , un algorithme de compression qui divise par 6 la mémoire nécessaire à l'inférence IA, sans perte de qualité. En quelques jours…