NVIDIA Vera Rubin: El salto hacia la era de la IA Agéntica y los 50 Petaflops
La industria tecnológica se encuentra en un punto de inflexión donde la capacidad de respuesta de los chatbots tradicionales está dejando paso a la autonomía total de los agentes inteligentes. NVIDIA, consciente de este cambio de paradigma, ha revelado los detalles de su arquitectura de próxima generación: Vera Rubin. Esta plataforma no es una simple evolución incremental; es un rediseño sistémico pensado para dotar a las máquinas de «razonamiento» y permitir la ejecución simultánea de miles de agentes autónomos en un solo bastidor.
Un salto de rendimiento sin precedentes en inferencia
La cifra que ha sacudido al sector es el salto en la capacidad de inferencia. Mientras que la actual arquitectura Blackwell se sitúa en los 20 petaflops, la GPU Rubin alcanza los 50 petaflops gracias al nuevo motor NVFP4 Transformer Engine. Este incremento de más del doble de potencia bruta está diseñado específicamente para manejar modelos de billones de parámetros con una eficiencia que reduce el coste por token a una décima parte en comparación con las generaciones anteriores.

Este rendimiento se apoya en la adopción de la memoria HBM4, que proporciona un ancho de banda masivo y una capacidad de hasta 288 GB por GPU. El resultado es un sistema que no solo es más rápido, sino que puede mantener contextos de millones de tokens, eliminando el «cuello de botella» de la memoria que limitaba la complejidad de las tareas de IA actuales.
Vera: El procesador diseñado para el razonamiento agéntico
La gran sorpresa de esta arquitectura es el procesador NVIDIA Vera CPU. A diferencia de los chips tradicionales, la CPU Vera ha sido construida desde cero para la gestión de datos y el razonamiento agéntico. Con 88 núcleos personalizados «Olympus» y soporte para multihilo espacial, este procesador está optimizado para orquestar las complejas capas de lógica que requieren los sistemas de aprendizaje por refuerzo y la toma de decisiones autónoma.
Cuando se integran en el sistema NVL72, 36 CPUs Vera trabajan en armonía con 72 GPUs Rubin, creando una «supercomputadora en un rack». Esta infraestructura permite que una sola unidad de servidor gestione ecosistemas enteros de agentes que colaboran entre sí en tiempo real, permitiendo aplicaciones que van desde fábricas totalmente autónomas hasta asistentes digitales que ejecutan flujos de trabajo complejos sin supervisión humana constante.
El centro de datos como la nueva unidad de cómputo
NVIDIA ha dejado claro que ya no vende chips individuales, sino sistemas integrados. La plataforma Vera Rubin introduce el NVLink 6, que ofrece un ancho de banda de 3,6 TB/s de GPU a GPU, y el ConnectX-9 SuperNIC, que eleva la transferencia de red a 1,6 Tb/s. Esta conectividad extrema garantiza que el procesamiento no se detenga mientras los datos se mueven entre los distintos componentes del clúster.
Este enfoque de «co-diseño extremo» busca anticiparse a la demanda de las grandes tecnológicas como OpenAI, Microsoft y Google, que ya están redirigiendo sus esfuerzos de la IA generativa básica hacia la IA agéntica de sistema 2, aquella capaz de planificar, razonar y corregirse a sí misma.
