DeepSeek es una empresa china de
Fundada en 2023 por Liang Wenfeng, un ex cofundador de un fondo de cobertura, la compañía tiene su sede en Hangzhou, Zhejiang. Su principal objetivo es desarrollar modelos de lenguaje de gran escala (LLM) y promover la inteligencia artificial general (AGI), facilitando su acceso a nivel global.
Innovación y Eficiencia en IA
DeepSeek ha sorprendido a la comunidad tecnológica al presentar DeepSeek-R1, un modelo de IA que ofrece un rendimiento comparable al de ChatGPT de OpenAI, pero con costos de desarrollo significativamente menores. Mientras que OpenAI invirtió alrededor de 100 millones de dólares en entrenar su modelo GPT-4 en 2023, DeepSeek logró entrenar DeepSeek-R1 con una inversión aproximada de 6 millones de dólares, utilizando alrededor de 2,000 chips Nvidia H800. Esta eficiencia ha generado debates sobre las estrategias de inversión en infraestructuras de IA en Silicon Valley.
Código Abierto y Accesibilidad
Una de las características distintivas de DeepSeek es su compromiso con el código abierto. A diferencia de muchas empresas occidentales que mantienen sus investigaciones en secreto, DeepSeek ha hecho público el código de DeepSeek-R1.
Esto permite a investigadores y desarrolladores de todo el mundo acceder, modificar y mejorar el modelo, fomentando la transparencia y la colaboración en la comunidad de IA.
Impacto en el Mercado Tecnológico
El lanzamiento de DeepSeek-R1 ha tenido repercusiones significativas en el mercado tecnológico global. Tras su debut, las acciones de empresas tecnológicas estadounidenses experimentaron caídas notables. Por ejemplo, Nvidia, proveedor clave de chips para IA, vio una disminución del 17% en el valor de sus acciones. Esta situación ha generado preocupaciones sobre la posición dominante de Estados Unidos en el sector de la IA y ha sido descrita como un «momento Sputnik» para la industria.
Desafíos y Consideraciones
A pesar de sus logros, DeepSeek enfrenta desafíos relacionados con la censura y la seguridad. Se ha observado que el modelo implementa mecanismos de censura en temas políticamente sensibles para el gobierno chino, como las protestas de la Plaza de Tiananmén de 1989 y los derechos humanos en China. Además, existen preocupaciones sobre el uso potencial del sistema de IA para operaciones de influencia extranjera, difusión de desinformación y vigilancia.
Perspectivas Futuras
DeepSeek continúa avanzando en el desarrollo de modelos de IA, habiendo lanzado versiones especializadas como DeepSeek-Coder y DeepSeek-Math, enfocadas en programación y razonamiento matemático, respectivamente. Su enfoque en la eficiencia y el código abierto podría redefinir las estrategias en el desarrollo de IA a nivel global, promoviendo una mayor colaboración…