Los avances chinos en la guerra tecnológica

Por Veja con edición dat0s
0
305
dragon china, inteligencia artificial

DeepSeek, desafía el dominio de los gigantes americanos, rediseña e intensifica la disputa entre las potencias.

computadora con IA

Sellar un cálculo sobre quién ganará esta batalla es una tarea riesgosa.

El pasado 9 de febrero, la audiencia récord de 127,7 millones de espectadores del Super Bowl, la gran final del campeonato nacional de fútbol americano, fue bombardeada con propaganda de grandes empresas de inteligencia artificial (IA). La monstruosa atención que recibe el juego lo convierte en el escenario publicitario más grande del país, y cada anuncio de 30 segundos se reproduce por un pago exorbitante de 8 millones de dólares.

Fue en uno de estos anuncios que Apple presentó el primer PC, el Macintosh, en 1984. En 2000, los sitios puntocom dominaban por intervalos y, en 2022, solo se hablaba de criptomonedas entre un touchdown a otro. En 2025, OpenAI (creador de ChatGPT), Meta (propietario de Facebook y de la herramienta de inteligencia artificial Llama) y Alphabet (Google y Gemini) estaban enfrascados en una batalla por los corazones, las mentes y los bolsillos de los fanáticos estadounidenses.

Entre bastidores, sin embargo, la preocupación de todos se centra en un enemigo común: DeepSeek, la empresa china de IA que, apenas diez días antes, había lanzado una versión de su herramienta tan poderosa y eficiente que borró más de 1 billón de dólares en valor de mercado de las empresas tecnológicas en un período de sólo 24 horas. “La idea predominante de que sólo los gigantes con una capacidad de inversión del orden de cientos de miles de millones de dólares podían competir en IA se hizo añicos con la llegada de DeepSeek”, afirma David Cox, vicepresidente de IA de IBM Research.

deepseek logo

Los desarrolladores chinos usaron herramientas que ya existían a precios ínfimamente menores.

La primera reacción de la mayoría de los inversores fue la negación. Después de todo, lo que DeepSeek afirma haber hecho contradice todo lo que se creía sobre la industria. Su modelo R1, que funciona como una de las herramientas de ChatGPT, fue calificado como “uno de los descubrimientos más increíbles e impresionantes que he visto jamás”. La declaración fue hecha por Marc Andreessen, inversionista de capital de riesgo y asesor del presidente Donald Trump, quien destacó el hecho de que DeepSeek ha alcanzado el nivel de calidad de los líderes del mercado estadounidense a una fracción del costo, utilizando chips mucho menos sofisticados. La herramienta habría costado apenas 5,6 millones de dólares en formación final, que es aproximadamente el salario anual que recibe un desarrollador cualificado en Estados Unidos. La cantidad no se acerca a los 100 millones gastados en el desarrollo de GPT-4, según el presidente de OpenAI, Sam Altman. El año pasado, el presidente de Anthropic (de la herramienta Claude), Dario Amodei, reveló que el coste de entrenar sus modelos oscilaba entre 100 millones y 1.000 millones de dólares.

Tan pronto como DeepSeek empezó a hacer ruido en todo el mundo, bancos y fondos lanzaron análisis que pusieron en duda las alegaciones chinas, acusándolos de mentirosos. Es digno de mención, sin embargo, que los directores ejecutivos de quienes perdieron más dinero (y la mayoría entiende el tema) ese fatídico 27 ​​de enero –cuando la estruendosa llegada de DeepSeek hizo que el precio de las acciones de las empresas de tecnología cayera en picado–, como Nvidia, Alphabet y el fondo de capital de riesgo Sequoia, felicitaron a DeepSeek por su logro.

¿Qué hazaña fue esa, de todos modos?

Dirigida por el ejecutivo Liang Wenfeng, DeepSeek es la startup de inteligencia artificial líder en China. Wenfeng posee un exitoso fondo de cobertura y en 2021 se propuso la tarea de liderar ingenieros de la Universidad de Zhejiang para construir una inteligencia artificial general (AGI) que sea tan inteligente como los humanos. Ese año, Wenfeng comenzó a comprar miles de GPU de Nvidia (a la que aún no se le había prohibido venderlas en China) y, en 2023, lanzó DeepSeek. “Para lograr AGI, necesitamos nuevos marcos para obtener modelos más fuertes con recursos limitados”, declaró en ese momento. Y eso es exactamente lo que hizo la compañía. Con algunos enfoques técnicos innovadores, que permitieron que su modelo se ejecutara de manera más eficiente, el equipo dice que el desarrollo de la herramienta R1 costó un 95% menos que la primera versión creada por OpenAI.

En lugar de empezar de cero, DeepSeek construyó su IA utilizando modelos existentes de código abierto. En concreto, los investigadores utilizaron como base el modelo Llama da Meta. Además de partir de una base ya preparada, R1 utilizó dos trucos de optimización principales: un entrenamiento previo más eficiente y un aprendizaje por refuerzo. Para ser más claro: a diferencia de sus competidores, la empresa no quería replicar la lógica del pensamiento humano. En otras palabras, las IA disponibles anteriormente en el mercado procesan todo lo que las personas producen para llegar a sus conclusiones.

liang DeepSeek

El creador de DeepSeek se propuso la tarea de liderar ingenieros de la Universidad de Zhejiang para construir una inteligencia artificial general (AGI) que sea tan inteligente como los humanos.

Mientras tanto, R1 se centra en el proceso conocido en la industria como “prueba y error”. Su inteligencia se alimenta de una serie de procesos. Cada vez que lo hace bien, aprende y replica el proceso a partir de ese momento. Si cometes un error, no lo vuelvas a repetir. Al final de la capacitación, los investigadores desecharon lo que ya no era útil, reduciendo drásticamente la cantidad de información que necesitaban para ejecutar el sistema. Menos procesamiento significa utilizar chips GPU más baratos para entrenar su IA, en cantidades más pequeñas y usando menos energía.

Esta combinación permitió que el modelo lograra el mismo rendimiento que la primera edición de ChatGPT y al mismo tiempo empleara mucha menos potencia computacional y dinero. “DeepSeek-V3, y también DeepSeek-V2 antes, son básicamente el mismo tipo de modelo que GPT-4, pero con trucos de ingeniería más inteligentes para obtener más rendimiento por GPU”, dice Miles Brundage, ex investigador de políticas de OpenAI.

Su inteligencia se alimenta de una serie de procesos

Cada vez que lo hace bien, aprende y replica el proceso a partir de ese momento. Si cometes un error, no lo vuelve a repetir. Al final de la capacitación, los investigadores desecharon lo que ya no era útil, reduciendo drásticamente la cantidad de información que necesitaban para ejecutar el sistema. Menos procesamiento significa utilizar chips GPU más baratos para entrenar su IA, en cantidades más pequeñas y usando menos energía. Esta combinación permitió que el modelo lograra el mismo rendimiento que la primera edición de ChatGPT y al mismo tiempo empleara mucha menos potencia computacional y dinero. “DeepSeek-V3, y también DeepSeek-V2 antes, son básicamente el mismo tipo de modelo que GPT-4, pero con trucos de ingeniería más inteligentes para obtener más rendimiento por GPU”, dice Miles Brundage, ex investigador de políticas de OpenAI.

musk multimillonario quier comprar openAI

Musk propuso comprar OpenAI en 97.000 millones de dólares poco antes de que DeepSeek depreciara los activos de las tecnológicas norteamericanas. La oferta no llegó a buen puerto. | Reuters

Lo que sorprende al mundo no es solo la arquitectura que condujo a estos modelos, sino el hecho de que DeepSeek pudo replicar tan rápidamente los logros de OpenAI en cuestión de meses, en lugar de la brecha de un año o más que normalmente se observa entre los principales avances en IA. La creadora de ChatGPT vende la narrativa de que la única manera de que la tecnología avance es aumentando exponencialmente el poder de procesamiento de chips y el centro de datos, e incluso pidió 1 trillón de dólares al gobierno del demócrata Joe Biden el año pasado, para que Estados Unidos siguiera siendo líder en el sector.

Junto con los socios de computación en la nube Oracle y los fondos de inversión SoftBank y MGX, la compañía ha conseguido el apoyo del presidente Trump para el proyecto Stargate, que promete invertir 500 mil millones de dólares para 2030 en la infraestructura del centro de datos de inteligencia artificial más grande del mundo. Pero la rápida replicación de DeepSeek muestra que las ventajas técnicas no duran mucho, incluso cuando las empresas intentan mantener sus métodos en secreto.

Y este es el punto crucial del tsunami que derribó las acciones de los gigantes de la IA en el mercado de valores. Como ocurre con cualquier tecnología nueva, los inversores no necesariamente entienden a qué se enfrentan, lo que genera un optimismo indebido. La idea detrás de la apreciación de las acciones desde el lanzamiento de ChatGPT, en noviembre de 2022, era que la productividad industrial aumentaría drásticamente. En una encuesta publicada en diciembre por la consultora PwC, dos tercios de los inversores dijeron que esperaban notables aumentos de productividad gracias a la IA generativa, y un número similar proyectó un aumento de ganancias.

La fiebre del oro de la IA

La empresa que más se benefició del ciclo de exageración fue Nvidia, fabricante de los sofisticados chips que utilizan las empresas de inteligencia artificial. La idea que persistió durante un tiempo fue que, en la fiebre del oro de la IA, comprar acciones de Nvidia era invertir en la empresa que estaba detrás de todo el desarrollo del sector. No importa quién emergiera dominante en la carrera de la IA, necesitarían una reserva de chips Nvidia para ejecutar los modelos. Pero si DeepSeek realmente utiliza chips de manera más eficiente, otras empresas empezarán a hacer lo mismo. Eso podría significar menos mercado para los chips más avanzados de Nvidia a medida que las empresas intentan reducir costos. “Las expectativas de crecimiento de Nvidia eran definitivamente demasiado optimistas, por lo que veo esto como una reacción necesaria”, dice Naveen Rao, vicepresidente de IA de la empresa de software estadounidense Databricks. “Los ingresos actuales que genera Nvidia probablemente no estén amenazados, pero el crecimiento de los últimos dos años sí está”.

bill gates invertir en IA

El cofundador de Microsoft, dijo que si tuviera que empezar todo desde cero invertiría todas sus energías en una empresa de inteligencia artificial | The New York Times

Nvidia no fue la única empresa impulsada por la nueva tesis de inversión que atrajo a una legión de entusiastas. Los Siete Magníficos (Nvidia, Meta, Amazon, Tesla, Apple, Microsoft y Alphabet) han superado consistentemente al mercado de valores estadounidense en general, en gran parte debido al atractivo irresistible de los avances tecnológicos. Son empresas tan ricas que una propuesta de Elon Musk (propietario de Tesla y xAI, del modelo Grok) para comprar OpenAI por la asombrosa cifra de 97 mil millones de dólares fue rápidamente rechazada.

Así, el entusiasmo por la IA está lejos de terminar. En una entrevista con la cadena estadounidense CNBC, Bill Gates, cofundador de Microsoft, dijo que, si tuviera que empezar todo desde cero ahora, invertiría todas sus energías en una empresa de inteligencia artificial.

La lucha geopolítica por el liderazgo tecnológico

Detrás de las disputas por el liderazgo tecnológico y de mercado también hay una lucha geopolítica. Como es sabido, Estados Unidos simplemente prohibió a Nvidia vender sus chips más avanzados a China por una cuestión de seguridad nacional. La tensión es aún mayor si se tiene en cuenta que los chips se fabrican en Taiwán, a 700 kilómetros de la costa china.

Nvidia edificio

La compañía ha sido prohibida de vender microprocesadores a DeepSeek que fabrica chips en Taiwán (a 700 km de China) | Jason O’Rear/Gensler San Francisco.

En febrero, se celebró una cumbre con líderes políticos y de la industria de la IA en París, y el vicepresidente estadounidense, J.D. Vance, pronunció un duro discurso acusando, por un lado, a las dictaduras que utilizan la tecnología para robar información y ganar poder y, por el otro, a las democracias que crean regulaciones e “impiden el pleno desarrollo de la inteligencia artificial”. Si había alguna duda sobre a quién se refería, la negativa a firmar el documento final del evento, encabezado por Francia y China, puso fin a cualquier cuestionamiento. “Simplemente no está claro si existe una estrategia coherente para frenar los abusos asiáticos sin reglas europeas”, dice Lennart Heim, del centro de investigación Rand.

Una gran noticia para Brasil

Sin el poder de fuego de las grandes potencias para invertir cientos de millones de dólares en un modelo de IA, Sudamérica parecía destinada a presenciar esta batalla desde lejos. En 2022, el fabricante de GPU se interesó en un proyecto de una empresa brasileña, WideLabs, que utilizaba sus chips para ejecutar un programa de inteligencia artificial llamado bAIgrapher. Ayuda a recrear virtualmente los recuerdos de los pacientes con Alzheimer para retrasar su olvido. El software tuvo tanto éxito que Nvidia propuso una asociación para crear un LLM 100% brasileño.

amazonia ia de widelabs brasil

El año pasado nació Amazonia, familia de modelos de IA generativa que cuesta incluso menos que el R1 chino.

Así, en julio del año pasado nació Amazonia, una familia de modelos de IA generativa (texto, imagen y chatbot) que cuesta, según Nelson Leoni, presidente de WideLabs, incluso menos que el R1 chino. Y ya ha demostrado su eficacia, adoptada tanto por entidades públicas, como el Ministerio Público de Rio Grande do Sul, como por entidades privadas, como la empresa de azúcar y alcohol Raízen. “La apuesta que hicimos entonces por un modelo más económico está resultando más segura, ya que Amazonia mantiene toda la información dentro de nuestra frontera, en centros de datos en São Paulo, y cumple con las regulaciones locales”, dice Leoni.

Nadie sabe cómo terminarán las batallas. Existe un escenario posible en el que la disputa no genere grandes ganancias para nadie. Si la tecnología se vuelve relativamente barata y fácil de replicar, los márgenes de ganancia se aplanan. Esto es lo que ocurrió, por ejemplo, con las computadoras personales: de ser un gran negocio en los años 1980 y 1990, se convirtieron en un bien barato. “Ya no hay duda de que la IA genera mucho valor, pero todavía no sabemos quién se apropiará de ella”, afirma Aswath Damodaran, profesor de la Universidad de Nueva York y uno de los mayores expertos en evaluar el precio de acciones y corporaciones del mundo. “Es muy posible que sea el consumidor final”. No es difícil imaginar que, en un futuro próximo, alguien podrá crear modelos de última generación en su propio garaje. Incluso si ese alguien es un robot.

 

Publicado en febrero de 2025 (VEJA Negocios Nº 11)


"Es posible que las mentiras sirvan para engañar a alguien en determinado momento; pero también sirven, sobre todo, para revelar una verdad indiscutible: la debilidad de quienes ocultan la verdad"

Tom Wolfe (periodista norteamericano)
Aporta voluntariamente al periodismo independiente

Qr dat0s