DeepSeek: Qué es (y quién está detrás) de la IA china que asusta a las gigantes tecnológicas

Saltó a la fama en cosa de horas y generó un terremoto en Wall Street por su modelo de inteligencia artificial, aparentemente, muchísimo más barato que el de su competencia.

Saltó a la fama en cosa de horas, generó un terremoto en Wall Street y le plantó frente a ChatGPT, el -hasta ayer- indiscutido líder de la inteligencia artificial generativa. Se trata de la china DeepWeek, que causó asombro y consternación en Silicon Valley al presentar un modelo de IA de rendimiento comparable al de los mejores chatbots del mundo, pero con un costo que sería solo una fracción al de su competencia.

Así, sembró importantes dudas sobre la fortaleza del liderazgo de Estados Unidos en el campo de la inteligencia artificial y, por supuesto, dejó damnificados en su meteórico paso.

Es que las acciones en Nueva York sufrieron un duro golpe. El S&P 500 cayó un 1,75 y el Nadsaq 100 un 3,2%. Mientras que Nvidia Corp, la figura emblemática del frenesí de la IA , se hundió hasta un 18% ayer, eliminando US$560 mil millones y anotando la mayor pérdida de capitalización de una empresa en la historia.

Además, arrebató a su rival ChatGPT el codiciado puesto de la aplicación gratuita más descargada de Estados Unidos en la App Store de Apple, siendo descargada 1,6 millones de eces hasta el 25 de enero y ocupó el primer lugar en las tiendas de aplicaciones para iPhone en EE.UU., así como en australia, Canadá, China, Singapur y el Reino Unido, según datos de App Figures.

También se ha ubicado entre las principales descargas de Play Store de Google. De hecho, se especula que todo esto pudo haber generado una gran presión en los sistemas de la startup china, lo que pudo haber provocado intermitencias en su funcionamiento, incluso dejó de funcionar ayer por más de una hora. Sin embargo, la empresa justificó esto acusando un “ataque malicioso a gran escala” y limitó las inscripciones a aquellos con números de teléfono de China continental.

DeepSeek

¿Qué es DeepSeek? La IA china fue fundada en 2023 por Liang Wenfeng, el jefe del fondo de cobertura cuantitativo basado en inteligencia artificial High-Flyer, y desde hace días que se viene hablando en los circulos especializados de una empresa emergente de inteligencia artificial de origen chino que se opondría a ChatGPT.

En el Foro Económico Mundial de Davos la semana pasada, algunos mencionaron a DeepSeek, con sede en Hangzhou, y su modelo R1 recientemente lanzado como una de las principales razones para que países como Estados Unidos estén redoblando sus esfuerzos en materia de IA.

En los foros de debate sobre tecnología, los ingenieros habían comenzado a comparar su rendimiento de programación con los modelos líderes de empresas como OpenAI y Microsoft Corp. Su producto ascendió silenciosamente en las clasificaciones de los mejores en una tabla de clasificación de IA afiliada a la UC Berkeley.

Luego, en las últimas horas, el interés por la startup se disparó. Los pesos pesados ??de Silicon Valley, entre ellos el inversor Marc Andreessen y el padrino de la inteligencia artificial y científico jefe de Meta Platforms Inc., Yann LeCun, comenzaron a sumarse a la conversación, y Andreessen calificó el modelo de DeepSeek como “uno de los avances más asombrosos e impresionantes” que haya visto jamás.

DeepSeek tiene implicaciones de largo alcance para la industria tecnológica global, y la cadena de suministro y ofrece un contrapunto a la creencia generalizada de que el futuro de la inteligencia artificial requerirá cantidades cada vez mayores de potencia y energía para desarrollarse.

Pese a que el costo exacto de desarrollo y el consumo de energía de DeepSeek no están completamente documentados, la startup ha presentado cifras que sugieren que su costo fue solo una fracción de los últimos modelos de OpenAI.

¿Cómo se compara DeepSeek con OpenAI o Meta AI?

La aplicación DeepSeek se distingue de otros chatbots como ChatGPT de OpenAI al articular su razonamiento antes de dar una respuesta a una solicitud. La empresa afirma que su versión R1 ofrece un rendimiento a la par con la última de OpenAI y ha otorgado licencia a las personas interesadas en desarrollar chatbots con esta tecnología para que la utilicen.

DeepSeek R1 está cerca o mejor que los modelos rivales en varios puntos de referencia líderes, como AIME 2024 para tareas matemáticas, MMLU para conocimientos generales y AlpacaEval 2.0 para rendimiento de preguntas y respuestas. También se ubica entre los de mejor desempeño en una tabla de clasificación afiliada a UC Berkeley llamada Chatbot Arena.

Asimismo, la eficiencia del modelo pone en tela de juicio la necesidad de grandes gastos de capital para adquirir los aceleradores de IA más recientes y potentes de empresas como Nvidia Corp. Eso también aumenta la atención sobre las restricciones estadounidenses a la exportación de semiconductores tan avanzados a China, que tenían como objetivo evitar un avance del tipo que DeepSeek parece representar.

El éxito de DeepSeek puede impulsar a OpenAI y otros proveedores estadounidenses a reducir sus precios para mantener su liderazgo establecido. También pone en tela de juicio el enorme gasto de empresas como Meta y Microsoft Corp. (cada una de las cuales se ha comprometido a realizar gastos de capital de US$65.000 millones o más este año, principalmente en infraestructura de IA) si los modelos más eficientes pueden competir con un desembolso mucho menor.

Los desarrolladores de todo el mundo ya están experimentando con el software de DeepSeek y buscan crear herramientas con él. Eso podría acelerar la adopción de modelos avanzados de razonamiento de IA, al tiempo que podría generar una preocupación adicional sobre la necesidad de establecer límites en su uso. Los avances de DeepSeek pueden acelerar la regulación para controlar cómo se desarrolla la IA.

Además, al igual que todos los demás modelos de inteligencia artificial chinos, DeepSeek se autocensura en temas considerados sensibles en China. desvía consultas sobre la Plaza de Tiananmen o cuestiones geopolíticamente conflictivas como la posibilidad de que China invada Taiwán. En las pruebas, el bot DeepSeek es capaz de dar respuestas detalladas sobre figuras políticas como el primer ministro indio Narendra Modi, pero se niega a hacerlo sobre el presidente chino Xi Jinping.

¿Qué está causando alarma en Estados Unidos?

El hecho de que un modelo de IA pequeño y eficiente surgiera de China, que ha sido objeto de crecientes sanciones comerciales de Estados Unidos sobre los chips avanzados de Nvidia, pone en tela de juicio la eficacia de tales medidas.

Washington ha prohibido la exportación de tecnologías de punta como semiconductores para GPU a China, en un intento de frenar los avances del país en inteligencia artificial, la frontera fundamental en la contienda entre Estados Unidos y China por la supremacía tecnológica. Pero el progreso de DeepSeek sugiere que los ingenieros de inteligencia artificial chinos han sorteado las restricciones, centrándose en una mayor eficiencia con recursos limitados. Si bien no está claro a cuánto hardware avanzado de entrenamiento de inteligencia artificial ha tenido acceso DeepSeek, la empresa ha demostrado lo suficiente como para sugerir que las restricciones comerciales no han sido del todo efectivas para obstaculizar el progreso de China.

“Estados Unidos es excelente en investigación e innovación, y especialmente en innovación de vanguardia, pero China es mejor en ingeniería“, dijo el informático Kai-Fu Lee a principios de este mes en el Foro Financiero Asiático en Hong Kong. “En esta época, cuando se tiene un poder de cómputo y un dinero limitados, se aprende a construir cosas de manera muy eficiente“.

“Si bien aún queda por ver si DeepSeek demostrará ser una alternativa viable y más barata a largo plazo, las preocupaciones iniciales se centran en si el poder de fijación de precios de los gigantes tecnológicos estadounidenses está siendo amenazado y si su enorme gasto en IA necesita una reevaluación”, dijo Jun Rong Yeap de IG Asia.

¿Quién es el fundador de DeepSeek?

Nacido en Guangdong en 1985, Liang obtuvo una licenciatura y una maestría en ingeniería electrónica e informática en la Universidad de Zhejiang. Fundó DeepSeek con solo 10 millones de yuanes (US$1,4 millones) de capital registrado, según la base de datos de la empresa Tianyancha.

El obstáculo para futuros avances no es la recaudación de fondos, dijo Liang en una entrevista con el medio chino 36kr, sino las restricciones de Estados Unidos al acceso a los mejores chips. La mayoría de sus principales investigadores son recién graduados de las mejores universidades chinas, dijo, y enfatizó la necesidad de que China desarrolle su propio ecosistema nacional similar al construido alrededor de Nvidia y sus chips de inteligencia artificial.

“Una mayor inversión no necesariamente conduce a una mayor innovación. De lo contrario, las grandes empresas se apoderarían de toda la innovación”, afirmó Liang.

¿Dónde se sitúa DeepSeek en el panorama de la inteligencia artificial de China?

Los líderes tecnológicos de China, desde Alibaba Group Holding Ltd. y Baidu Inc. hasta Tencent Holdings Ltd., han invertido una cantidad significativa de dinero y recursos en la carrera por adquirir hardware y clientes para sus emprendimientos de inteligencia artificial. Junto con la startup 01.AI de Kai-Fu Lee, DeepSeek se destaca por su enfoque de código abierto, diseñado para reclutar la mayor cantidad de usuarios rápidamente antes de desarrollar estrategias de monetización sobre esa gran audiencia.

Debido a que los modelos de DeepSeek son más asequibles, ya han jugado un papel en ayudar a reducir los costos para los desarrolladores de IA en China, donde los actores más grandes se han involucrado en una guerra de precios que ha visto sucesivas oleadas de recortes de precios durante el último año y medio.

Por otro lado, esta irrupción sacudió los mercados bursátiles de Asia, ya que los inversores buscaron nombres chinos vinculados a DeepSeek, como Iflytek Co., y se alejaron de los nombres de la cadena de suministro de fabricación de chips como Advantest Corp. que pueden estar expuestos a cualquier déficit en la demanda esperada de semiconductores de IA.

Además, las empresas tecnológicas chinas vinculadas a DeepSeek, como Iflytek Co., subieron el lunes, mientras que los fabricantes de herramientas para la fabricación de chips, desde ASML Holding NV de los Países Bajos hasta Advantest Corp. de Japón, cayeron ante la posible amenaza a la demanda de los aceleradores de inteligencia artificial de Nvidia Corp. Los futuros de los índices bursátiles estadounidenses también cayeron en medio de las preocupaciones de que los modelos de inteligencia artificial de DeepSeek puedan alterar el liderazgo tecnológico estadounidense.

Es probable que la infraestructura en la nube de DeepSeek se vea puesta a prueba por su repentina popularidad. La empresa sufrió una breve interrupción importante el 27 de enero y tendrá que gestionar aún más tráfico a medida que los usuarios nuevos y antiguos envíen más consultas a su chatbot.

Fuente: Emol

Vistas: 173

DeepSeek

¿Cómo se compara DeepSeek con OpenAI o Meta AI?

¿Qué está causando alarma en Estados Unidos?

¿Quién es el fundador de DeepSeek?

¿Dónde se sitúa DeepSeek en el panorama de la inteligencia artificial de China?

Noticias Relacionadas