Colossus: El superordenador de Elon Musk para luchar contra ChatGPT

No todo el mundo está impresionado por el nuevo y reluciente superordenador Colossus para alimentar la IA de Elon Musk. ¿Qué es Colossus? La empresa de IA de Elon Musk, xAI, ha presentado recientemente un nuevo superordenador llamado Colossus. Y como su nombre indica, es grande. El ordenador es un sistema de entrenamiento de inteligencia
 
serman, laboratorio de recuperación de datos en españa

No todo el mundo está impresionado por el nuevo y reluciente superordenador Colossus para alimentar la IA de Elon Musk.

¿Qué es Colossus?

La empresa de IA de Elon Musk, xAI, ha presentado recientemente un nuevo superordenador llamado Colossus. Y como su nombre indica, es grande.

El ordenador es un sistema de entrenamiento de inteligencia artificial que, según Musk, funciona con la friolera de 100.000 chips Nvidia H100. Una potente unidad de procesamiento gráfico que se ha convertido en fundamental en la carrera de la IA.

Para ponerlo en perspectiva, el gran modelo de lenguaje Llama 3 de Meta se entrenó en 16.000 chips H100. Meta dijo en marzo que seguiría invirtiendo en su infraestructura de IA añadiendo dos nuevos clusters de 24.000 chips.

En otras palabras, el Coloso de Musk es potente. Y podría ayudarle a alcanzar a los líderes de la industria de la IA.

Pero algunos destacados líderes tecnológicos no están tan seguros.

El cofundador de LinkedIn, Reid Hoffman, dijo a una popular revista de tecnología que el superordenador xAI no era más que «la apuesta mínima» en el competitivo campo de la IA generativa.

Según los expertos, Hoffman quería decir que Colossus sólo permite a xAI alcanzar a otras empresas de IA más avanzadas, como OpenAI y Anthropic.

Chris Lattner, director general de Modular AI, dijo durante una mesa redonda en la Cumbre de IA la semana pasada que la gran dependencia de Musk de los chips caros y finitos de Nvidia también es incoherente con el esfuerzo del multimillonario por construir su propia GPU, llamada Dojo.

Meta, Microsoft, Alphabet y Amazon están desarrollando sus propios chips de IA, aunque sigan acumulando GPU de Nvidia.

«La diferencia es que Elon lleva muchos años trabajando en Dojo», dijo Lattner.

El problema de Nvidia

Musk ha expresado su preocupación por las dificultades para adquirir más de los codiciados chips de Nvidia. Ha dicho que su proyecto Dojo ayudará a reducir la dependencia de su empresa del fabricante de chips.

«Vemos un camino para ser competitivos con Nvidia gracias a Dojo», dijo Musk en julio, durante una conferencia sobre los beneficios de Tesla. «No tenemos otra opción».

Al hablar de Colossus en X a principios de septiembre, Musk dijo que su objetivo es duplicar el tamaño del superordenador hasta 200.000 chips en unos meses.

Elon Musk dijo que el clúster se construyó en sólo 122 días, una hazaña impresionante que ninguna otra empresa ha igualado.

No está claro si Colossus ejecuta 100.000 GPU al mismo tiempo, lo que requeriría una sofisticada tecnología de redes y mucha energía.

Musk mencionó anteriormente que el clúster de 100.000 chips estaba en funcionamiento a finales de junio. Pero en aquel momento, una compañía eléctrica local dijo públicamente que xAI sólo tenía acceso a unos pocos megavatios de energía de la red local.

El mes pasado, la CNBC informó de que un grupo de defensa del medio ambiente se había quejado de que xAI estaba haciendo funcionar turbinas de gas para producir más energía para el centro de datos sin autorización.

El medio de comunicación informó de que el Southern Environmental Law Center escribió en una carta al departamento de sanidad local. El contenido denunciaba que xAI había instalado y ponía en funcionamiento al menos 18 turbinas no autorizadas «con más potencialmente en camino» para complementar sus ingentes necesidades energéticas.

La empresa local de servicios públicos dijo a la CNBC que había suministrado 50 megavatios de energía a xAI desde principios de agosto, pero que la instalación necesita otros 100 megavatios para funcionar.

Los desarrolladores de clústeres de datos dijeron que esto sólo podría alimentar unos pocos miles de GPU. La empresa de Musk necesitaría otra subestación eléctrica para obtener energía suficiente para hacer funcionar 100.000 chips.

serman, laboratorio de recuperación de datos en españa
 

Los comentarios están cerrados.