El éxito de DeepSeek podría ser una farsa, habiendo necesitado 50.000 H100 de NVIDIA

El éxito de DeepSeek podría ser una farsa, habiendo necesitado 50.000 H100 de NVIDIA

por Juan Antonio Soto Actualizado: 29/01/2025 7

Parece que detrás del éxito de DeepSeek hay algunas contradicciones en cuanto al sistema que han empleado para el entrenamiento de su modelo de lenguaje R1. DeepSeek presumía de haber empleado un coste de 5,5 millones de dólares para el entrenamiento de este lenguaje, pero en una entrevista a Alexander Wang de Scale AI, ha confesado que DeepSeek tienen acceso a más tarjetas NVIDIA H100 de las que la gente se piensa.

Geeknetic El éxito de DeepSeek podría ser una farsa, habiendo necesitado 50.000 H100 de NVIDIA 1

Concretamente ha desvelado que DeepSeek tiene acceso a más de 50.000 tarjetas NVIDIA H100, y que esto no lo pueden mencionar ya que no cumple con la normativa de exportación impuesta por Estados Unidos a China. Estas tarjetas están prohibidas desde hace algunos años, ya que incumplen el máximo de potencia referido por la administración encargada en Estados Unidos, para su venta a China, teniendo que recurrir el país asiático a soluciones adaptadas como la H800 mucho menos capaces. Pero las declaraciones de Wang aseguran que en China tienen más tarjetas H100 de lo que la gente piensa, donde una única tarjeta cuenta más de 27.000 dólares, un total en tarjetas H100 de 1.350 millones de dólares.

Pero parece que China se está haciendo con su inventario de este tipo de productos, comprándolas a otros países donde no existe este tipo de restricciones. Singapur parece ser el país elegido para “colar” este tipo de tarjetas en China, ya que se puede ver en el documento de ventas que más de un 20% han ido destinadas a este país en el último trimestre, pero que los envíos a Singapur fueron insignificantes.

Geeknetic El éxito de DeepSeek podría ser una farsa, habiendo necesitado 50.000 H100 de NVIDIA 2

Por otra parte, NVIDIA ha declarado que el avance conseguido por DeepSeek cumple con todas las normativas de exportación. Existen contradicciones entre los rumores, las ventas y las declaraciones en cuanto a las restricciones de exportación, que hacen que China se tenga que buscar sus propias soluciones para seguir avanzando, ya sea de una u otra forma.

Fin del Artículo. ¡Cuéntanos algo en los Comentarios!

Redactor del Artículo: Juan Antonio Soto

Juan Antonio Soto

Soy Ingeniero Informático y mi especialidad es la automatización y la robótica. Mi pasión por el hardware comenzó a los 14 años cuando destripé mi primer ordenador: un 386 DX 40 con 4MB de RAM y 210MB de disco duro. Sigo dando rienda suelta a mi pasión en los artículos técnicos que redacto en Geeknetic. Dedico la mayor parte de mi tiempo libre a los videojuegos, contemporáneos y retro, en las más de 20 consolas que tengo, además del PC.

Comentarios y Opiniones ¿Qué opinas? ¿Alguna pregunta?
  1. M·K·L admin
    #1 M·K·L 29/01/2025 11:11:19

    Que Singapur es la puerta de acceso de China y otros paises para conseguir tecnología americana y saltarse las restricciones, es un secreto a voces. Siempre se ha sabido. No sería sorprendente que se hayan podido hacer con 50.000 H100.

    La otra cuestión es, ¿por qué si es así DeepSeek ha mentido sobre el coste que ha tenido desarrollar su modelo? Pues tal vez sea precisamente para conseguir la fama que les ha llevado a las portadas de todos los periódicos y telediarios. Desdeluego les ha funcionado de maravilla.

    Todo el mundo sabe ahora de la existencia de DeepSeek y sea más económico de entrenar o no que sus adversarios, de la noche a la mañana se ha convertido en un contendiente que todo el mundo conoce.

    Responder
  2. Usuario Anónimo
    #2 Anónimo499 29/01/2025 11:23:14

    También está la opción que, aun teniendo acceso a 50000 tarjetas h100, hayan empleado una minima parte para entrenar R1. ?¿?

    Responder
    • M·K·L admin
      #4 M·K·Lrespondiendo a Anónimo499 29/01/2025 11:41:25

      No te gastas 1.350.000.000 Dolares en 50.000 GPUS H100 para tenerlas paradas ...

      Precisamente una de las premisas que soportaba el argumento de que lo habían hecho con menor coste es que teóricamente China no tiene acceso a tantas GPUs de NVIDIA.

      1 Responder
    • Usuario Anónimo
      #5 Anónimo499respondiendo a M·K·L 29/01/2025 12:35:05

      Hombre que tengan acceso también puede ser que las empleen para otras cosillas, como IA ocultas pagadas por el gobierno Chino, tenerlas sin uso si que es un delito pero caben más posibilidades...

      1 Responder
    • Usuario Anónimo
      #6 Anónimo331respondiendo a M·K·L 29/01/2025 19:01:07

      Pues finalmente no son Nvidia sino DeepSeek emplea aceleradoras HUAWEI Ascend 910C para inferencia, ahora el problema es aun mayor como ha conseguido Huawei tal potencial con estas graficas.
      De todos modos cuanta mas competencia mejor para el usuario final y si es codigo Abierto y GRATIS AUN MEJOR. Que el resto de compañias se pongan las pilas, lo que si es cierto es que el daño a Nvidia ha sido grande, aunque Nvidia la empresa mas poderosa en tecnologia lo tiene facil con la salida de sus nuevas RTX 5000 y a mediados de año una nueva CPU para portatiles que sera un torpedo en la linea de flotación de intel y AMD

      Responder
  3. Usuario Anónimo
    #3 Anónimo135 29/01/2025 11:29:11

    Es una guerra política, y a los chinos hace un par de días les salió perfecta la jugada desestabilizando los mercados occidentales. Da igual que haya sido una mentira gorda, el daño ya está hecho.

    Responder
  4. Usuario Anónimo
    #7 Anónimo331 29/01/2025 19:47:41

    Yo actualmente estoy usando Grok tiene 32 funciones y cosas que puedes hacer gratis con la inteligencia artificial de X solo tienes que tener una cuenta en X y estas son las que mas uso yo:
    Crea imágenes por IA,
    Imágenes por IA de famosos esta es una de las que mas me gusta.
    Puedes Cambiar el idioma de las respuestas ya que muchas que son muy tecnicas las hace en ingles y te las traduce
    Copiar o compartir una respuesta con gente que estes trabajando online esto lo hacemos mucho en el dpto de informatica.
    Edita el prompt que has escrito esto es super util para que la respuesta sea mas precisa y no sea un tocho de texto.
    Pedirle que te lo explique como si tuviera cinco años esto es util cuando estas comenzando a usarla y no estes muy puesto en el tema, util para los que no son muy expertos.
    Para los creadores de contenido Zanja debates exponiendo puntos a favor y en contra esto es muy util para tomar decisiones correctas al igual que hacer comparativas completas cuando estas indeciso entre 2 productos que puedas comprar o comparar.

    Espero que con la llegada de DeepSeek que les ha humillado a todos espero que Gork mejore mas y mejor y se pongan las pilas, lei que tienen pensado comprar una 50.000 Graficas de NVIDIA permite multiplicar por 1,93x el rendimiento de sus GPU H200 con la IA Llama 3.1 y algoritmo MEDUSA.

    Responder

ESCRÍBE UN NUEVO COMENTARIO ¿Qué opinas sobre este tema? ¿Alguna pregunta?

Se enviará como Anónimo.

IEM Feb 2024 Banner