El 27 de enero de 2025, un temblor recorrió los mercados financieros y la industria de la inteligencia artificial. La start-up china DeepSeek ha desarrollado un modelo de inteligencia artificial de código abierto y bajo costo que ha dejado a algunos analistas escépticos, pero que podría amenazar cientos de miles de millones invertidos en infraestructura de IA.
¿Una nueva amenaza para los gigantes de la IA?
La start-up DeepSeek presentó recientemente su modelo DeepSeek-V3, un asistente inteligente capaz de competir con las mejores soluciones del mercado, incluido ChatGPT de OpenAI. Lo que diferencia a este modelo, más allá de su rendimiento, es su sorprendentemente bajo costo de desarrollo, estimado entre 5 y 6 millones de dólares, una fracción de las sumas invertidas por compañías occidentales como OpenAI o Meta. El impacto en los mercados financieros fue inmediato, afectando no solo a gigantes de los semiconductores como Nvidia (-17% y una pérdida de casi 600,000 millones de dólares en capitalización de mercado) y Broadcom (-17%), sino también a proveedores de servicios como Oracle (-14%) y proveedores de infraestructura de centros de datos como Cisco (-5%).
Un modelo de código abierto que podría reorganizar el tablero
Uno de los aspectos más llamativos de DeepSeek-V3 es su apertura. A diferencia de la mayoría de sus competidores, DeepSeek ha optado por hacer su modelo de acceso gratuito y modificable bajo una de las licencias de código abierto más abiertas. Esta decisión podría transformar radicalmente el ecosistema de la IA, permitiendo que un gran número de actores fuera de las fronteras de China se beneficien de este avance tecnológico. Los precedentes históricos (los estándares de compatibilidad de PC de IBM en los años 80, el navegador web Mozilla Firefox en los 2000, el sistema operativo Android en los 2010) muestran que las arquitecturas abiertas han fomentado la innovación, al tiempo que reducen las barreras de entrada para nuevos participantes en el mercado.
Modelos de rendimiento de la IA puestos en duda
El anuncio de DeepSeek desafía la suposición predominante de que el rendimiento de los modelos de IA mejora con el aumento de los parámetros, los datos utilizados para el entrenamiento del modelo y la potencia de cálculo. Si el modelo de DeepSeek se confirma y se adoptara ampliamente en la industria, una gran parte de la masiva infraestructura de IA que actualmente se está construyendo podría terminar con capacidad excedente, lo que haría que los precios cayeran y se reconsideraran las estrategias de inversión en IA. Para las industrias de semiconductores, servicios en la nube y centros de datos, las apuestas son altas. Una reducción en la demanda de equipos de vanguardia podría precipitar una crisis de sobrecapacidad, llevando a una reevaluación de toda la cadena de valor de la IA.
Mercados financieros: mayor volatilidad a corto plazo
A corto plazo, los mercados deberían prepararse para un período de volatilidad mientras los inversores reevalúan la valoración de las empresas involucradas en la IA. Gigantes tecnológicos como Nvidia, Broadcom y ASML, que son proveedores principales de las tecnologías de semiconductores más avanzadas, podrían ver una caída sostenida en su valor. Pero los riesgos no se limitan a las empresas cotizadas. Los fondos de capital riesgo e inversores institucionales que han invertido fuertemente en IA en los últimos años también están bajo presión. Sin embargo, debemos diferenciar los efectos a lo largo del tiempo. Mientras que esta corrección es inevitable a corto plazo, podría, a mediano plazo, crear un entorno más favorable para la innovación, estimulando modelos de IA menos costosos y más específicos.
DeepSeek genera ondas de choque en la industria de la IA y los mercados financieros
El 27 de enero de 2025, un temblor recorrió los mercados financieros y la industria de la inteligencia artificial. La start-up china DeepSeek ha desarrollado un modelo de inteligencia artificial de código abierto y bajo costo que ha dejado a algunos analistas escépticos, pero que podría amenazar cientos de miles de millones invertidos en infraestructura de IA.
¿Una nueva amenaza para los gigantes de la IA?
La start-up DeepSeek presentó recientemente su modelo DeepSeek-V3, un asistente inteligente capaz de competir con las mejores soluciones del mercado, incluido ChatGPT de OpenAI. Lo que diferencia a este modelo, más allá de su rendimiento, es su sorprendentemente bajo costo de desarrollo, estimado entre 5 y 6 millones de dólares, una fracción de las sumas invertidas por compañías occidentales como OpenAI o Meta. El impacto en los mercados financieros fue inmediato, afectando no solo a gigantes de los semiconductores como Nvidia (-17% y una pérdida de casi 600,000 millones de dólares en capitalización de mercado) y Broadcom (-17%), sino también a proveedores de servicios como Oracle (-14%) y proveedores de infraestructura de centros de datos como Cisco (-5%).
Un modelo de código abierto que podría reorganizar el tablero
Uno de los aspectos más llamativos de DeepSeek-V3 es su apertura. A diferencia de la mayoría de sus competidores, DeepSeek ha optado por hacer su modelo de acceso gratuito y modificable bajo una de las licencias de código abierto más abiertas. Esta decisión podría transformar radicalmente el ecosistema de la IA, permitiendo que un gran número de actores fuera de las fronteras de China se beneficien de este avance tecnológico. Los precedentes históricos (los estándares de compatibilidad de PC de IBM en los años 80, el navegador web Mozilla Firefox en los 2000, el sistema operativo Android en los 2010) muestran que las arquitecturas abiertas han fomentado la innovación, al tiempo que reducen las barreras de entrada para nuevos participantes en el mercado.
Modelos de rendimiento de la IA puestos en duda
El anuncio de DeepSeek desafía la suposición predominante de que el rendimiento de los modelos de IA mejora con el aumento de los parámetros, los datos utilizados para el entrenamiento del modelo y la potencia de cálculo. Si el modelo de DeepSeek se confirma y se adoptara ampliamente en la industria, una gran parte de la masiva infraestructura de IA que actualmente se está construyendo podría terminar con capacidad excedente, lo que haría que los precios cayeran y se reconsideraran las estrategias de inversión en IA. Para las industrias de semiconductores, servicios en la nube y centros de datos, las apuestas son altas. Una reducción en la demanda de equipos de vanguardia podría precipitar una crisis de sobrecapacidad, llevando a una reevaluación de toda la cadena de valor de la IA.
Mercados financieros: mayor volatilidad a corto plazo
A corto plazo, los mercados deberían prepararse para un período de volatilidad mientras los inversores reevalúan la valoración de las empresas involucradas en la IA. Gigantes tecnológicos como Nvidia, Broadcom y ASML, que son proveedores principales de las tecnologías de semiconductores más avanzadas, podrían ver una caída sostenida en su valor. Pero los riesgos no se limitan a las empresas cotizadas. Los fondos de capital riesgo e inversores institucionales que han invertido fuertemente en IA en los últimos años también están bajo presión. Sin embargo, debemos diferenciar los efectos a lo largo del tiempo. Mientras que esta corrección es inevitable a corto plazo, podría, a mediano plazo, crear un entorno más favorable para la innovación, estimulando modelos de IA menos costosos y más específicos.
Geopolítica: un desafío a la influencia de EE. UU.
DeepSeek se está promoviendo en un contexto de rivalidad tecnológica entre Estados Unidos y China. Su fundador, Liang Wenfeng, opera un centro de IA en Hangzhou, China, y recientemente se reunió con el Primer Ministro chino Li Qiang. El enfoque frugal de DeepSeek y la atención mediática que ha atraído pueden verse como una respuesta estratégica a las crecientes restricciones al acceso de China a tecnologías avanzadas de Estados Unidos. Los modelos de IA más baratos reducirían significativamente el impacto de las restricciones de EE. UU. sobre el ecosistema de IA de China, que históricamente ha dependido en gran medida de las tecnologías estadounidenses (se dice que DeepSeek se entrenó utilizando chips avanzados, pero no de última generación, de Nvidia). También podrían ser beneficiosos para regiones del mundo con un gran interés en las aplicaciones de IA, pero con infraestructura de IA limitada, como Europa.
Más allá de estos anuncios iniciales, sin embargo, debemos cuestionar las posibles limitaciones de DeepSeek, en particular los costos subestimados asociados con la depuración de datos, el equipo de redes, el consumo de energía, los salarios de los ingenieros de IA y los recursos de código abierto. Como tal, el costo total de construir el modelo probablemente sea más alto de lo afirmado.
> Más sobre la guerra tecnológica entre EE. UU. y China en nuestra publicación económica.