Nvidia ha presentado un modelo de inteligencia artificial (IA) que compite con los sistemas más sofisticados de OpenAI, Google y Meta. El algoritmo se conoce como NVLM 1.0 y podría ampliar el dominio de la empresa más valiosa del mundo en el mundo de la tecnología.
La compañía define a NVLM 1.0 como “una familia de grandes modelos de lenguaje multimodales (LLM) fronterizos que logra resultados de vanguardia en tareas de lenguaje y visión”. Además, detalla que NVLM-D-72B, la variante más potente de su nuevo producto, puede gestionar hasta 72,000 millones de parámetros y rivaliza en directo con propuestas como GPT-4o, Llama 3-V-70B y Gemini 1.5 Pro. Destaca su rendimiento en el procesamiento de imágenes, texto y problemas matemáticos.
El equipo de desarrollo explica que empleó una arquitectura mejorada de entrenamiento y de razonamiento. “NVLM-D-72B demuestra capacidades versátiles en varias tareas multimodales al utilizar conjuntamente tecnologías de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés), razonamiento, localización, sentido común, conocimiento del mundo y habilidades de codificación”, puntualiza. En términos prácticos, esto significa que el programa de Nvidia puede entender el humor detrás de un meme, realizar razonamientos de codificación en función de elementos gráficos como tablas, generar descripciones detalladas de una imagen y producir una guía paso a paso para resolver problemas matemáticos.
La empresa asegura que la data de preentrenamiento y capacitación fue seleccionada “meticulosamente” con un ajuste fino supervisado. Afirma que su trabajo demostró que “la calidad de los conjuntos de datos y la diversidad de tareas son más importantes que la escala, incluso durante la fase de aprendizaje previo”.
El potente algoritmo ha sido lanzado bajo los estándares de código abierto. El modelo así como las instrucciones y los parámetros de entrenamiento están disponibles sin costo para su uso, modificación y distribución desde Megatron-Core, la biblioteca de desarrollo de la firma.
La decisión marca un hito en la industria. Nvidia está facilitando que organizaciones pequeñas e investigadores independientes contribuyan de manera más significativa a los avances de la IA, al brindar acceso a una herramienta con características similares a las vistas en los sistemas patentados por las big tech. El nuevo LLM le permitirá ampliar su base de usuarios y clientes en favor de su ya lucrativo negocio.
La corporación ha ganado una posición protagónica en la industria de la IA gracias a una estrategia de empresarial híbrida. Contempla tanto el desarrollo y producción de chips como la venta de sistemas avanzados que impulsan el funcionamiento de diversos algoritmos de IA. Esto le ha permitido acelerar la generación de ingresos y obtener el beneplácito de los inversionistas. Durante el primer trimestre fiscal, la organización reportó beneficios por 26,044 millones de dólares. La cifra representa un crecimiento interanual de 262%. La utilidad neta aumentó 628% respecto al mismo periodo del año anterior y se situó en 14,881 millones.
C.