La empresa china DeepSeek se suma a la carrera de la Inteligencia Artificial, ofreciendo gratuidad, un código abierto y eficiencia en su aplicación; se presenta como una fuerte alternativa a ChatGPT o Gemini
DeepSeek lanzó su modelo R1 el pasado 20 de enero y en estas últimas horas ha liderado las listas de descargas -aunque está habiendo restricciones en el proceso de alta de nuevos usuarios por ciberataques-, revolucionando a los internautas, pero también sacudiendo las bolsas de todo el mundo y abriendo las puertas a un posible cambio de las reglas del sector tecnológico.
Las claves de su éxito son su código abierto, los bajos costes de su desarrollo y su eficiencia.
Así lo señala Robert Clarisó, profesor de los Estudios de Informática, Multimedia y Telecomunicación de la UOC (Universitat Oberta de Catalunya), quien admite que, por las peculiaridades de este lanzamiento, “ahora todo el mundo de la IA está en estado de schock”.
Desde la empresa DeepSeek se ha conseguido entrenar un modelo de IA generativa muy competitivo, con un coste muy, muy inferior al que se consideraba estándar en el mercado, presentándose, además, como alternativa a ChatGPT o a Gemini (Google).
¿Qué ofrece DeepSeek?
Según la empresa china, su modelo fue entrenado durante 55 días con un presupuesto de 5.57 millones de dólares, utilizando procesadores gráficos H800 de Nvidia, una versión de capacidad reducida diseñada para el mercado chino. Este costo representa menos de una décima parte del gasto en el entrenamiento del modelo GPT4o de OpenAI o una vigésima parte del entrenamiento de o1, también de OpenAI.
DeepSeek se ha inspirado en el modelo o1 de OpenAI, que utiliza “chain of thought” o “cadena de pensamiento” para resolver problemas complejos, un enfoque estructurado por el que el chatbot desglosa primero las tareas y luego las ejecuta, similar al pensamiento humano. Todo esto ha reducido los tiempos de entrenamiento y por tanto su coste. Esto sumado a la posibilidad de descargarlo y usarlo de forma gratuita.
Su código abierto es otro de sus aspectos fundamentales, cualquier persona puede examinarlo, modificarlo y adaptarlo en función de sus necesidades, incluso para evitar, fuera de China, la censura que los internautas achacan a la aplicación, añade el profesor de la UOC.
DeepSeek está publicado con la licencia MIT, que permite su uso, copia, modificación y venta. Además, DeepSeek-R1 ha sido entrenada en inglés y chino, y en la resolución de problemas matemáticos, programación e inferencia del lenguaje natural, los resultados son muy parecidos, así que las diferencias, insiste Clarisó, están en los costes y en estar publicado como código abierto.
Alerta ante posibles ciberataques a nivel global
Los ataques maliciosos pueden tener distintos significados, según Kaspersky.
Marc Rivero, de esta compañía, explica que en este caso, DeepSeek ha limitado el registro de nuevos usuarios, por lo que es probable que se trate de un ataque de denegación de servicio distribuido (DDoS), en el que los servidores son saturados con tráfico masivo con el objetivo de interrumpir su funcionamiento.
Pero también podrían ser intentos masivos de acceso no autorizado o explotación de vulnerabilidades. Sin embargo, “es complicado” asegurar su naturaleza hasta que DeepSeek comparta más detalles técnicos, afirma en un comunicado.
Según Kaspersky, lo que destaca en el caso de DeepSeek es su carácter de código abierto, “un arma de doble filo”.
“Si bien los marcos de software de código abierto fomentan la transparencia, colaboración e innovación, también conllevan riesgos de seguridad y dilemas éticos”. De hecho, en 2024, el escáner de código abierto de Kaspersky detectó más de 12 mil paquetes maliciosos en repositorios abiertos.