El entrenamiento de IA es donde se vuelve interesante, especialmente para las redes de entrenamiento distribuidas; están entrenando modelos que son más pequeños que las GPUs en las que están entrenando. La mayoría de las redes están haciendo entrenamiento de modelos de 1.5B, 3B y 8B para que quepan en GPUs de consumo.
Ver originales