La Gran Mentira China: Deepseek y porque los mercados se equivocan (o te están engañando)
🫧 ¿Explota la burbuja de la IA? La verdad tras el pánico financiero (y por qué NVIDIA y las Big Tech 🇺🇸 mantendrán su dominio)
Esta Newsletter no estaba programada hasta el próximo domingo, pero…
🚨
…dado todo lo que está pasando en las últimas horas y el interés por una actualización rápida en un tema donde algunos incluso pueden perder mucho dinero (si sois inversores).
He decidido trabajar unas horas extras este bonito martes y contaros que esta pasando, con datos y un mínimo de conocimiento sobre las IA.
Así que si yo me paso 4h escribiendo un martes por la noche, que menos que tú te suscribas pedazo de “legislador europeo”… (no se me ocurría un insulto peor 😂)
💡 Si todavía no estás suscrito, apúntate Gratis a la newsletter de IA.
Si no estabas suscrito esto son alguno de los post que te has perdido:
Google lanza sus mejores herramientas IA casi en "secreto". Descubre como usarlas Gratis 🏞️
Ni ChatGPT, Ni Claude, Ni Gemini. Esta es la mejor IA para crear contenido 🚀
¿Explota la burbuja de la IA? La verdad tras el pánico financiero (y por qué NVIDIA y las Big Tech 🇺🇸 mantendrán su dominio)
🔍 Contexto: DeepSeek y la reacción de los mercados
El lanzamiento del modelo DeepSeek-R1, un sistema de razonamiento de código abierto y gratuito, ha sacudido Wall Street. (nosotros ya hablamos de Deepseek 6 días antes de que ocurriera esta tormenta).
NVIDIA perdió un 17% de su valor en un solo día (es la mayor caída de cotización de una empresa de la historia), arrastrando a otras tecnológicas como Alphabet (-4.03%) y Microsoft (-2.14%)…
La causa: DeepSeek demostró que modelos de IA avanzados pueden desarrollarse con costos de entrenamiento de menos de $6 millones, frente a los miles de millones invertidos por empresas como OpenAI, Microsoft o Google para llegar a un punto similar.
Detalles clave del entrenamiento de DeepSeek-R1 y su coste:
Costo por billón de tokens: 180K H800 GPU hours, lo que se traduce en 3.7 días en un clúster con 2048 H800 GPUs. (fuentes)
Duración total del entrenamiento: Menos de dos meses.
Costo total estimado: $5.576 millones (a $2 por GPU/hora). Según los informes.
Test Time Scaling: Es el núcleo de la innovación de DeepSeek. A diferencia de los modelos tradicionales que priorizan respuestas instantáneas, R1 usa más tiempo computacional para "razonar", mejorando la calidad de sus outputs. NVIDIA lo califica como un "ejemplo perfecto" de optimización.
💡 3 Lecciones clave que los mercados no entendieron
1️⃣ El costo bajo no elimina la demanda de hardware
Sí, DeepSeek reduce costos, pero la inferencia (ejecución del modelo) sigue requiriendo grandes cantidades de GPUs de NVIDIA y redes de alta velocidad.
La paradoja de Jevons lo explica bien: cuanto más accesible se vuelve una tecnología, mayor es su uso total. Cada modelo "económico" como DeepSeek multiplica la necesidad de chips avanzados.
La conclusión es clara: Cuando la IA se abarata → más gente usando este tipo de IA → demanda global de computación ↑↑↑.
2️⃣ NVIDIA no está muerta, es más necesaria que nunca y además está reinventándose
Aunque el pánico bursátil sugiere lo contrario, NVIDIA sigue siendo clave:
Inferencia > Entrenamiento: El 80% del ciclo de vida de un modelo de IA ocurre en la fase de inferencia, donde sus GPUs son insustituibles.
Nueva narrativa: NVIDIA ya promueve el "Test Time Scaling" como parte de su estrategia, alineándose con innovaciones como R1.
3️⃣ China no está ganando, está forzando la siguiente fase. 💥 China vs USA
China tiene restricciones por las que no puede comprar la última tecnología de NVIDIA (al menos oficialmente, aunque se sospecha que las adquiere via Singapore): Limitaciones a GPUs occidentales → optimización de modelos → + innovación
Las innovaciones de las empresas Chinas son fácil (y rápidamente) aprovechables por el resto de empresas. Así que la siguiente generación de modelos seguirá siendo dominada por quienes tengan más y mejores Chips.
Pero quien controle centros de datos como Stargate (500B$) tendrá la sartén por el mango: más cómputo = mejores modelos iterativos.
Pequeño paréntesis: Si quieres saber de que va esto de StarGate, aquí te lo explicamos en un vídeo de 3 minutos 👇
🎯Ganadores y perdedores: Un análisis más preciso
Mi abuela solía decir que lo importante era participar.
LLegados a una edad todos sabemos que esto no es verdad 😂
Sobre todo si te estas jugando, prácticamente, el destino de la humanidad.
Así que recapitulemos…
🏆 Ganadores
Las Grandes Compañías Tecnológicas o Big Tech (Google, Microsoft, Amazon): Su infraestructura en la nube es crítica para escalar IA, incluso con modelos más eficientes. Microsoft ya planea gastar $80 mil millones en 2025 en IA.
Startups y usuarios finales: DeepSeek-R1 es gratuito y su API cuesta un 93% menos que la de OpenAI, democratizando el acceso.
⚠️ Perdedores
Laboratorios privados (OpenAI, Anthropic): Su modelo de suscripción premium está bajo presión. Sam Altman ya reconoció que DeepSeek es "impresionante", pero insiste en que más poder computacional sigue siendo clave.
Inversores especulativos a corto plazo: El derrumbe de NVIDIA refleja el miedo a que la reducción de costos de IA afecte los márgenes de las tecnológicas, aunque sea una reacción exagerada.
🌍 Lección geopolítica: No es una carrera, es una guerra
EE.UU. intenta frenar a China con sanciones, pero DeepSeek prueba que la innovación en software puede compensar las limitaciones de hardware.
La Energía, es el próximo cuello de botella: Los centros de datos de IA consumirán 4.5% de la electricidad global para 2030. Quien controle energía barata y renovable dominará la próxima fase.
💡 ¿Y ahora qué?
Para inversores: Enfócate en empresas de infraestructura (AWS, Azure, NVIDIA) y energía limpia. La IA no colapsa; se expande. (no tomarse esto como un consejo de inversión) ;)
Para emprendedores: Usa modelos como R1 para reducir costos, pero invierte en personalización y propiedad intelectual.
Para reguladores: El enfoque debe ser colaborar, no restringir. La IA avanza más rápido que las políticas… ¡Hola Europa! 👋 estás ahí?
Conclusión Final
DeepSeek no es el fin de la burbuja de IA, sino un acelerador. La revolución sigue su curso, pero con nuevos actores y reglas.
¿La burbuja? No existe. El pánico de ayer fue un ajuste miope.
La revolución sigue su curso: más rápida, más hambrienta de recursos... y más rentable para quienes inviertan en sus cimientos.
*Notas y fuentes importantes:
[1] https://arxiv.org/html/2412.19437v1
[2] https://github.com/deepseek-ai/DeepSeek-V3
[3] https://www.nvidia.com/en-us/data-center/h100/
[4] https://catalog.ngc.nvidia.com/orgs/nvidia/teams/nemo/models/llama-3_1-70b-nemo
[5] https://ai.meta.com/blog/meta-llama-3-1/
Y RECUERDA 👉 COMPARTE ESTA NEWSLETTER CON ALGUIEN A QUIÉN LE PUEDA AYUDAR ❤️
Otras Noticias IA de la semana que tienes que conocer 🍏
🚀 StarGate: El proyecto tecnológico que puede cambiar la Historia de la Humanidad.
OpenAI acaba de anunciar «El Proyecto Stargate», (en este vídeo te contamos que es en 3 minutos), una nueva empresa dispuesta a invertir 500.000 millones de dólares en infraestructura de IA en Estados Unidos junto a SoftBank, Oracle y otros gigantes tecnológicos, que llega junto a la derogación de la orden de seguridad de IA de la era Biden durante los primeros días del presidente Donald Trump en el cargo.
💡 Los detalles:
La empresa desplegará inmediatamente una cantidad inicial de 100.000 millones de dólares, comenzando con centros de datos masivos en Texas antes de expandirse por todo el país.
El proyecto tiene como objetivo crear «cientos de miles» de empleos estadounidenses al tiempo que asegura el liderazgo de Estados Unidos en el desarrollo avanzado de IA.
Entre los principales socios tecnológicos se encuentran Nvidia, Microsoft y Arm, que se basan en colaboraciones ya existentes en el desarrollo de chips de IA y la infraestructura en la nube.
La iniciativa se dio a conocer tras la derogación por parte de Trump de la OE de IA de Biden, que exigía a los laboratorios compartir los resultados de las pruebas de seguridad y creó el Instituto de Seguridad de IA.
⭐️ Por qué es importante: El enorme presupuesto de 500.000 millones de dólares de Stargate, junto con una colaboración sin precedentes entre gigantes tecnológicos, podría remodelar por completo todo el panorama de la IA. El movimiento marca un momento decisivo en la carrera global de la IA y la AGI para Estados Unidos, y el momento también señala una clara priorización de la velocidad sobre la seguridad, para bien o para mal.
🏞️ DeepSeek también ha sacado una IA de imágenes Open Source
DeepSeek, ha lanzado un nuevo conjunto de modelos de imágenes de IA multimodal que, según afirma, pueden superar al DALL-E 3 de OpenAI. 😂 Sí… La verdad que parece que le ha cogido manía a OpenAI
💡 Los detalles:
La nueva familia de modelos Janus-Pro genera imágenes de alta calidad a partir de descripciones de texto, con modelos de parámetros 1B y 7B disponibles.
Janus-Pro superó a DALL-E 3 y Stable Diffusion en pruebas de referencia clave del sector en cuanto a calidad y precisión de las imágenes, como GenEval y DPG-Bench.
Los modelos se han publicado bajo licencia MIT, lo que permite a los desarrolladores utilizarlos y modificarlos libremente para proyectos comerciales.
🚀 Qwen lanza Agentes de IA que controlan dispositivos
Seguimos con las compañías Chinas rompiendo el mercado esta vez de los Agentes IA.
El equipo Qwen de Alibaba acaba de lanzar Qwen2.5-VL, una nueva familia de modelos de lenguaje de visión que pueden interactuar con ordenadores y teléfonos, junto con nuevas capacidades avanzadas de análisis de documentos y vídeos.
💡 Los detalles:
El modelo insignia 72B supera a GPT-4o y Claude 3.5 Sonnet en pruebas clave de análisis sintáctico de documentos y comprensión de vídeos.
El sistema puede analizar vídeos de una hora de duración y extraer momentos concretos mientras procesa documentos complejos como facturas y formularios.
Una nueva función permite a la IA controlar aplicaciones para teléfonos inteligentes y ordenadores, con demostraciones que incluyen la reserva de billetes de avión, la edición de imágenes y la instalación de código.
Las versiones más pequeñas de 3B y 7B son de libre acceso, mientras que el modelo de 72B requiere autorización para usos comerciales a gran escala.
⭐️ Por qué es importante: Un nuevo «operador» ha entrado en la conversación: el modelo de visión artificial de Qwen llega apenas una semana después del publicitado lanzamiento de OpenAI.
Entre los lanzamientos de Qwen y DeepSeek de la semana pasada, la brecha entre los modelos abierto y cerrado y entre China y Estados Unidos sigue pareciendo más estrecha que nunca.
¿Te ha gustado esta edición de AI Mafia Club?
✅ Compártelo con uno o dos amigos. ¡Ayuda a tus compañeros a crecer!
❌ Si odiaste este newsletter - compártelo con un enemigo 😂
Además ganarás recompensas por los amigos que traigas a la mafia!
Nota: va a haber una recompensa muy importante en las próximas semanas. Luego que no se diga que no AVISÉ! ;)
❤️ Gracias por leer AI Mafia.
Si te ha gustado esta edición, no te olvides de dar al ♡ y de compartirla por redes sociales o por email con otras personas a las que creas que les pueda gustar. Si lo haces, etiquétanos en @aimafiaclub, nos encantaría saber de ti. 🙏
También nos gustaría escuchar tus opiniones y sugerencias, así que no dudes en responder a este correo. O dejar un comentario abajo.
Si quieres mantenerte al día con las últimas novedades IA:
📺 Youtube: IA para emprendedores en Youtube
📢 Comunidad en Telegram: https://t.me/AImafiaClub. (Ya somos +1k 💪🏾)
🐦 X: @aimafiaclub
PD: Este correo electrónico fue escrito totalmente por un humano. En concreto por mi ☝️ @alex_dc 😉
Nos vemos en la próxima edición de La Maf-IA…