Nvidia presenta NVLM 1.0, su nuevo modelo de IA de código abierto

Nvidia presenta NVLM 1.0,

Nvidia ha presentado un modelo de inteligencia artificial (IA) que compite con los sistemas más sofisticados de OpenAI, Google y Meta. El algoritmo se conoce como NVLM 1.0 y podría ampliar el dominio de la empresa más valiosa del mundo en el mundo de la tecnología.

La compañía define a NVLM 1.0 como “una familia de grandes modelos de lenguaje multimodales (LLM) fronterizos que logra resultados de vanguardia en tareas de lenguaje y visión”. Además, detalla que NVLM-D-72B, la variante más potente de su nuevo producto, puede gestionar hasta 72,000 millones de parámetros y rivaliza en directo con propuestas como GPT-4o, Llama 3-V-70B y Gemini 1.5 Pro. Destaca su rendimiento en el procesamiento de imágenes, texto y problemas matemáticos.

El equipo de desarrollo explica que empleó una arquitectura mejorada de entrenamiento y de razonamiento. “NVLM-D-72B demuestra capacidades versátiles en varias tareas multimodales al utilizar conjuntamente tecnologías de reconocimiento óptico de caracteres (OCR, por sus siglas en inglés), razonamiento, localización, sentido común, conocimiento del mundo y habilidades de codificación”, puntualiza. En términos prácticos, esto significa que el programa de Nvidia puede entender el humor detrás de un meme, realizar razonamientos de codificación en función de elementos gráficos como tablas, generar descripciones detalladas de una imagen y producir una guía paso a paso para resolver problemas matemáticos.

La empresa asegura que la data de preentrenamiento y capacitación fue seleccionada “meticulosamente” con un ajuste fino supervisado. Afirma que su trabajo demostró que “la calidad de los conjuntos de datos y la diversidad de tareas son más importantes que la escala, incluso durante la fase de aprendizaje previo”.

El potente algoritmo ha sido lanzado bajo los estándares de código abierto. El modelo así como las instrucciones y los parámetros de entrenamiento están disponibles sin costo para su uso, modificación y distribución desde Megatron-Core, la biblioteca de desarrollo de la firma.

La decisión marca un hito en la industria. Nvidia está facilitando que organizaciones pequeñas e investigadores independientes contribuyan de manera más significativa a los avances de la IA, al brindar acceso a una herramienta con características similares a las vistas en los sistemas patentados por las big tech. El nuevo LLM le permitirá ampliar su base de usuarios y clientes en favor de su ya lucrativo negocio.

La corporación ha ganado una posición protagónica en la industria de la IA gracias a una estrategia de empresarial híbrida. Contempla tanto el desarrollo y producción de chips como la venta de sistemas avanzados que impulsan el funcionamiento de diversos algoritmos de IA. Esto le ha permitido acelerar la generación de ingresos y obtener el beneplácito de los inversionistas. Durante el primer trimestre fiscal, la organización reportó beneficios por 26,044 millones de dólares. La cifra representa un crecimiento interanual de 262%. La utilidad neta aumentó 628% respecto al mismo periodo del año anterior y se situó en 14,881 millones.

C.

Nvidia es la compañía más valiosa del mundo

NVIDIA

Nvidia es la compañía más valiosa del mundo. Así, el martes alcanzó un valor de U$D 3.34 billones, por delante de Microsoft (U$D 3.32 billones), Apple (U$D 3.27 billones), Alphabet (U$D 2.169 billones) y Amazon (U$D 1.90 billones); completando así los cinco primeros puestos.

Hace ocho años, cada acción valía menos del 1% de su precio actual. La feroz competencia entre los desarrolladores de Inteligencia Artificial (IA) como Microsoft, Alphabet (propietario de Google), Meta o Apple beneficia a Nvidia, que acapara más del 80% del mercado de procesadores.

Aquí les dejo 3 razones que explican el éxito de la empresa, que, de acuerdo a Bloomberg, podría alcanzar los 5 billones de dólares.

1. De videojuegos a Inteligencia Artificial:

Hace más de 30 años Nvidia comenzó como una empresa que fabricaba chips para el desarrollo de videojuegos. Sus unidades de procesamiento de gráficos comenzaron a ser muy demandadas para el desarrollo de funciones de visualización como renderizar videos, imágenes y animaciones, ideales para videojuegos de alta exigencia.

Pronto la empresa descubrió que sus GPU también eran útiles para otras tareas exigentes, como acelerar el rendimiento informático de los cerebros de las computadoras, es decir, las unidades centrales de procesamiento. Gigantes como Google, Microsoft y Amazon se interesaron en los procesadores de Nvidia para potenciar sus enormes centros de datos.

Al mismo tiempo, los ingenieros empezaron a utilizar sus chips para hacer cálculos de inteligencia artificial, dado que el tipo de matemática necesaria para construir sistemas complejos encajaba con la forma en que funcionan los chips gráficos. Hoy, las GPU más avanzadas de Nvidia, como las llamadas H100, se utilizan en la creación de los sistemas de inteligencia artificial más sofisticados.

2. Ir más rápido que los competidores

A partir de 2006, Nvidia dejó clara su apuesta por la inteligencia artificial. En esa época, la empresa anunció la creación de CUDA, un lenguaje de programación que hizo posible que los chips de la firma pudieran resolver complejos problemas matemáticos. Así fue como la firma entró con sus procesadores en el mundo de la inteligencia artificial antes que sus grandes competidores, como Intel o AMD. Esa ventaja inicial podría verse acortada si las otras firmas aceleran su paso, dado están haciendo grandes inversiones para conseguir una mayor cuota de mercado.

3. Demanda en crecimiento

Durante último año ha subido aceleradamente el interés por los costosos procesadores gráficos para los servidores que alimentan los grandes modelos de inteligencia artificial. Nvidia, que solía ser una firma tecnológica menos conocida que el resto de los gigantes, pasó rápidamente a primer plano con el lanzamiento de ChatGPT. Los chips de Nvidia parecen ser, dicen los expertos, los más adecuados para entrenar a los modelos de inteligencia artificial.

La demanda de los microchips ha llevado a empresas como OpenAI, Microsoft, Alphabet, Amazon, Meta y otros a emprender una carrera para hacerse con los procesadores necesarios para construir modelos de IA más capaces.

Durante el trimestre más reciente, los ingresos en el negocio de centros de datos de Nvidia aumentaron 427% por ciento respecto al año anterior, a U$D 22,600 millones de dólares. Esto representa alrededor del 86% de las ventas totales de la compañía.

C.

Chatbots personalizados de ChatGPT ahora serán gratuitos para todos

 ChatGPT

OpenAI sigue mejorando la experiencia de los usuarios de ChatGPT de forma gratuita, al permitirles el acceso a los chatbots personalizados, una opción que antes únicamente estaba disponible para los suscriptores de ChatGPT Plus, Teams y Enterprise.

Esto significa que será posible utilizar los GPTs creados por otros usuarios y desarrolladores para ejecutar una amplia gama de acciones: analizar la información de tablas y gráficos, consultar a la inteligencia artificial (IA) sobre imágenes y fotos, encontrar sinónimos en inglés a partir de un diccionario fiable, organizar la decoración de tu nuevo hogar con la ayuda de un catálogo de alguna tienda personalizada, etc. En resumen, todo lo que es capaz de hacer la IA de ChatGPT, pero recurriendo directamente a un modelo construido para la función que se necesite, sin el inconveniente de tener que explicarle cada vez al chatbot lo que necesitas.

Sin embargo, los suscriptores seguirán teniendo algunas ventajas sobre quienes usen ChatGPT de forma totalmente gratuita. Estos últimos, de hecho, tendrán acceso a los chatbots personalizados, pero no podrán crear los suyos propios, lo que quiere decir que deberán conformarse con lo que encuentren en la plataforma.

Pero eso no es todo. Los usuarios que hayan optado por aprovechar la versión de pago del chatbot de OpenAI se benefician de un número ilimitado de instrucciones para interactuar con su inteligencia artificial. Se trata de una función con la que no cuentan los usuarios del servicio gratuito, pues estos solo poseen cierta cantidad de prompts disponibles en el modelo más reciente GPT-4o; una vez que se les terminen, serán redirigidos automáticamente a la versión antigua GPT-3.5 para seguir con sus consultas.

En general, OpenAI está intentando reducir al máximo las diferencias entre la versión de ChatGPT reservada a los suscriptores y la diseñada para los usuarios del servicio gratuito. Un movimiento que tiene un objetivo claro: convencer a las personas que aún no se han inscrito en la plataforma de pago para que lo hagan cuanto antes, ofreciéndoles una vista previa de todo lo que harían con una versión premium del chatbot de IA.

C.

La OMS lanza Sarah, un chatbot que responde a consultas de temas de salud

Sarah OMS

La Organización Mundial de la Salud (OMS) anunció el lanzamiento de Sarah, un chatbot basado en inteligencia artificial (IA) que responde a consultas relacionadas con diferentes problemas de salud.

El nombre del asistente está compuesto por las siglas de Smart AI Resource Assistant for Health. El lanzamiento de Sarah se ha producido en vísperas del Día Mundial de la Salud, que tendrá lugar el próximo domingo 7 de abril de 2024 bajo el lema “Mi salud, mi derecho”. En estos primeros compases desde su lanzamiento estará disponible en ocho idiomas (entre ellos está el español).La OMS define el desarrollo como un prototipo digital promotor del bienestar, con capacidad para brindar atención las 24 horas del día.

La herramienta ofrece recomendaciones generales para evitar, tratar y sobrellevar ciertas enfermedades. Enlista los síntomas básicos relacionados con diversas afecciones físicas y mentales, factores de riesgo y promueve hábitos saludables con base en reportes de fuentes confiables. La organización informó que el objetivo “es proporcionar una herramienta adicional para que las personas puedan hacer tangibles sus derechos a la salud, dondequiera que estén. Puede ayudar a las personas a acceder a información actualizada sobre cómo dejar el tabaco, mantenerse activo, llevar una dieta saludable y desestresarse, entre otras cosas”.

Tedros Adhanom Ghebreyesus, director general de la OMS, sostiene que “Sarah nos da una idea de cómo se podría utilizar la inteligencia artificial en el futuro para mejorar el acceso a la información sanitaria de una manera más interactiva”.

¿Cómo funciona Sarah, el asistente virtual de la OMS?

El asistente fue creado por la empresa de diseño de personajes digitales con IA Soul Machines, en colaboración con la comunidad de desarrolladores de software Rooftop. El sistema procesa solicitudes en texto y por voz. No admite consultas ni entrega resultados basados en imagen, aunque pide habilitar el uso del micrófono y la cámara del dispositivo “para mejorar la experiencia conversacional”.

Para hablar con este chatbot, lo único que hace falta es pulsar en este enlace y hacer clic en el botón ‘Habla con Sarah’. A continuación, hay que conceder a la plataforma acceso al micrófono y a la cámara del ordenador o teléfono móvil. Este es uno de los aspectos más controvertidos de la plataforma, ya que muchos usuarios no entienden por qué es necesario dejar que la IA registre voces y, sobre todo, rostros. En cualquier caso, la OMS ha dejado claros algunos aspectos muy importantes que vienen a indicar que no se hace responsable de los comentarios realizados por su IA y que no sustituye al asesoramiento profesional bajo ninguna circunstancia.

Por ejemplo, en su web se puede leer advertencias del tipo “es posible que las respuestas no siempre sean exactas, ya que se basan en patrones y probabilidades fundamentados en los datos disponibles”. Además, indica que “la OMS no se hace responsable del contenido de las conversaciones creadas por IA generativa”, puesto que “no representa ni comprende nuestras opiniones y creencias”.

Finalmente, la OMS asegura que los datos recopilados se resguardan bajo la condición de anonimato y que los procesos de Sarah cumplen con las prácticas y regulaciones de privacidad vigentes.

C.

OpenAI despide a Sam Altman, director ejecutivo de la empresa

OpenAI Sam Altman

OpenAI despidió a su director ejecutivo y cofundador, Sam Altman. La empresa de inteligencia artificial anunció un cambio de dirección en donde que Altman dejará su cargo como CEO con efecto inmediato. Mira Murati, directora de tecnología de la compañía, tomará el puesto de forma interina.

“La junta directiva de OpenAI, Inc. que actúa como órgano rector general de todas las actividades de OpenAI, anunció hoy que Sam Altman dejará el cargo de director ejecutivo y dejará la junta directiva”, indicó la empresa en una publicación de su blog.

Por otro lado, OpenAI dio el voto de confianza a Mira Murati, quien se ha desempeñado como directora de tecnología y es responsable de ChatGPT. “Mira aporta un conjunto de habilidades único, comprensión de los valores, operaciones y negocios de la empresa, y ya dirige las funciones de investigación, productos y seguridad”, mencionó.

La compañía señaló que su misión es garantizar que la inteligencia artificial general (AGI) beneficie a toda la humanidad y considera que es necesario un cambio de liderazgo. La salida de Sam Altman se da a escasos días de liderar su primera conferencia para desarrolladores DevDay, en donde presentó GPT-4 Turbo y los GPTs. En ese evento, Altman reveló que ChatGPT ya contaba con 100 millones de usuarios semanales.

De acuerdo con el comunicado oficial, OpenAI despidió a Sam Altman debido a que no confía más en él. Tras realizar un proceso de revisión, descubrió que no fue sincero en sus comunicaciones con la junta directiva. La empresa no menciona incidentes específicos, aunque ofrece algunas pistas sobre la salida de su cofundador.

El comunicado indica que OpenAI se fundó con la misión principal de garantizar que la inteligencia artificial general beneficie a la humanidad. La compañía sufrió una reestructuración con el fin de garantizar la entrada de capital para volverse rentable y alcanzar su objetivo. La inversión multimillonaria de Microsoft a inicios de 2023 representó un hito, sin embargo, no fue suficiente.

OpenAI hace hincapié en conceptos como investigación, desarrollo de productos y seguridad como eje de su estrategia para avanzar. Debido a que Sam Altman ya no es sujeto de confianza, la más calificada para liderar durante este proceso de transición es Mia Murati, directora de tecnología.

La junta directiva declaró que Murati está “excepcionalmente calificada para el puesto”, aunque solo será temporal. OpenAI confirmó que su CTO fungirá como interina mientras llevan a cabo una búsqueda formal de un director ejecutivo permanente.

Sam Altman no será el único afectado en la reestructuración. OpenAI confirmó que Greg Brockman dejará su cargo como presidente de la junta directiva, aunque conservará su puesto en la empresa.

OpenAI se fundó como una organización sin fines de lucro en 2015, cuando Sam Altman y Elon Musk se comprometieron a hacer avanzar la tecnología en beneficio de la humanidad. Las cosas cambiaron en 2019, cuando Microsoft invirtió U$D1, 000 millones y anunció una asociación exclusiva de varios años. Musk renunció a la junta directiva de OpenAI en 2018 citando posibles conflictos de intereses con Tesla.

Actualmente, OpenAI está dividida en dos entidades: OpenAI Incorporated y OpenAI LP. La primera es la organización sin fines de lucro fundada en 2015, mientras que la segunda es una subsidiaria con ganancias limitadas establecida en 2019 tras la salida de Elon Musk. Tras la inversión de U$D 10,000 millones, Microsoft es dueña del 49 % de OpenAI LP.

C.

Olympus: La inteligencia artificial de Amazon que competirá con OpenAI

Amazon Olympus

Olympus. Así se llama el gran modelo de lenguaje (LLM) en el que están trabajando en Amazon, y que según Reuters, que cita a fuentes cercanas al proyecto, tiene como objetivo rivalizar con los mejores modelos de OpenAI o de Alphabet. El desarrollo de este nuevo modelo está a cargo de Rohit Prasad, jefe de la división de inteligencia artificial en Amazon. Las fuentes aseguran que Olympus impulsaría servicios como Alexa, los altavoces Echo y su unidad Amazon Web Services (AWS). La tecnológica podría anunciarlo en diciembre y estaría disponible para sus clientes empresariales.

Olympus tendría 2 billones de parámetros, el doble de GPT-4, lo que lo convertiría en uno de los modelos más grandes que se han entrenado. Actualmente, Amazon ofrece una familia de modelos fundacionales conocidos como Titan a través de su plataforma Bedrock. Titan permite desarrollar aplicaciones basadas en texto — como ChatGPT —, o con funciones de búsqueda semántica. Este último está disponible para los clientes de Amazon Web Services, quienes pueden mejorar la precisión de la búsqueda y las recomendaciones personalizadas.

De acuerdo con The Information,, Olympus sería más poderoso que Titan y colocaría a Amazon en un lugar competitivo dentro de la carrera de la inteligencia artificial. La empresa lleva más de un año trabajando en modelos de lenguaje, aunque no ha conseguido desarrollar uno que pueda hacer frente a OpenAI.

Un reporte anterior menciona que Amazon estuvo a punto de adelantarse a ChatGPT. Dos días antes de que el chatbot tomara por asalto el mundo, la empresa tuvo una oportunidad para pegar primero con Bedrock. Desafortunadamente, los ejecutivos de AWS pospusieron la presentación en el último minuto debido a problemas técnicos.

La estrategia de Amazon para competir con OpenAI y otras empresas de inteligencia artificial está por iniciar una nueva fase. No hay una fecha definida de lanzamiento de Olympus, pero según fuentes cercanas al proyecto la empresa cree que tener modelos de IA propios hará que su oferta en AWS (Amazon Web Services) sea más atractiva para clientes empresariales que quieran acceder a los modelos más potentes.

Hace unas semanas, Amazon presentó una nueva versión de su asistente inteligente durante su evento de hardware y servicios. Alexa abrazará un modelo de lenguaje hecho a medida que le permitirá entablar conversaciones y ofrecer información en tiempo real.

De acuerdo con la compañía, Alexa ofrecerá respuestas fluidas en menos tiempo y con una modulación del tono según el contexto. En algunos dispositivos con pantalla, la asistente podrá comenzar una conversación sin que la invoques. Amazon mencionó que esta es la mayor integración de un modelo LLM en servicios de tiempo real y un conjunto de dispositivos.

Sumado a Alexa y los altavoces Echo, Olympus tendrá presencia en las experiencias de su tienda en línea. Amazon ya cuenta con una herramienta que modifica imágenes de productos para hacerlas más atractivas y generar más ventas. La compañía también podría utilizar su modelo para combatir las reseñas falsas, uno de sus problemas más grandes.

C.

¿Qué Es Claude 2? – Todo Lo Que Necesitas Saber

Novedades de Claude 2

Claude 2 es un nuevo modelo de IA de lenguaje natural desarrollado y anunciado por Anthropic, una empresa fundada por Dario Amodei, antiguo empleado de OpenAI. Está diseñado para tener una mayor capacidad de entrada y salida y un rendimiento mejorado en comparación con su predecesor. Además, este nuevo modelo lingüístico genera una salida más segura y dispuesto a competir GPT-4 de OpenAI y el PaLM 2 de Google.

Claude 2 utiliza los parámetros para generar la salida y predecir la siguiente palabra. Gracias a sus datos entrenados, entiende las entradas de los usuarios y genera una respuesta de acuerdo con las indicaciones dadas. Además, Claude 2 utiliza la tecnología de Procesamiento del Lenguaje Natural (NLP) para comprender los significados que hay detrás de las frases y generar una salida adecuada a la información lingüística del usuario.

Como es un gran modelo lingüístico, puedes obtener cualquier tipo de salida basada en texto proporcionándole indicaciones. Por ejemplo, si necesitas palabras clave, descripciones de productos o preguntas frecuentes para tu comercio electrónico, puedes utilizar la herramienta

Si necesitas responder a cientos de correos electrónicos cada día, puedes utilizar Claude 2 para obtener el correo electrónico templates y completar tareas que normalmente te llevarían 8 horas en sólo 3 horas.

Además, permitirte generar código en lenguajes de programación populares, gracias a sus avanzadas habilidades de codificación. Gracias a sus avanzadas habilidades matemáticas, de razonamiento y de codificación, puede comprender mejor las entradas de los usuarios y generar código según las instrucciones.

Aquí te dejo los principales beneficios de usar Claude 2:

  1. Es Gratuita: Mientras que GPT-4 cobra 20 dólares mensuales por su versión Plus, Claude 2 ofrece su servicio de manera gratuita, facilitando a un público más amplio experimentar con inteligencia artificial de alta calidad.
  2. Interacción Avanzada con Archivos: Más allá de la simple interacción con archivos básicos como Excel, PDF y TXT, la herramienta te permite manejar hasta 75,000 palabras, es decir, alrededor de 100,000 tokens Así, puedes cargar informes completos y obtener análisis detallados sin problema alguno.
  3. Procesamiento de Textos Extensos: Claude es capaz de procesar y comprender textos extensos con una eficiencia envidiable. No estamos hablando solo de artículos, sino de libros enteros, algo que amplía enormemente las aplicaciones potenciales de esta herramienta.
  4. Conversaciones Continuas: La naturalidad en una conversación es crucial. Aquí, Claude 2 puede recortar hasta 75,000 palabras de contexto en una conversación, garantizando diálogos más largos, fluidos y que realmente sientan como una interacción humana.
  5. Velocidad de Escritura: Claude 2 destaca al producir cerca de 100 caracteres por segundo. Esta eficiencia se traduce en respuestas rápidas y generación de contenido en tiempo real.
  6. Actualización de Datos; Mientras que GPT-4 tiene información hasta 2021, Claude 2 se mantiene al día con datos hasta 2023 En un mundo que cambia rápidamente, tener acceso a la información más reciente puede ser vital.
  7. Plantillas de PromptsLas plantillas de prompts son una herramienta esencial. Ayudan a dirigir y optimizar la generación de contenido.

Para utilizar Claude 2, todo lo que tienes que hacer es dirigirte a su sitio web oficial y crear una cuenta. Por ahora, sólo está disponible en el Reino Unido y Estados Unidos. Sin embargo, el equipo de desarrolladores de Anthropic está trabajando para que esté disponible en otras regiones.

C.

OpenAI compra Global Illumination para potenciar su participación en la IA

OpenAI

OpenAI anunció la adquisición de Global Illumination, una startup con sede en Nueva York dedicada al desarrollo de infraestructura, herramientas creativas y experiencias digitales basadas en inteligencia artificial (IA). Sin dar a conocer los detalles financieros alrededor del acuerdo, la compañía dirigida por Sam Altman afirmó que el equipo de la empresa neoyorkina se unirá a sus filas para nutrir sus principales productos, incluido ChatGPT.

Global Illumination es una empresa fundada en 2021 por Thomas Dimson, Taylor Gordon y Joey Flynn, excolaboradores de Instagram. Los cofundadores han participado en proyectos relacionados con Facebook, YouTube, Google, Pixar y Riot Games. La trayectoria de Dimson destaca por haber ocupado una posición decisiva en el entrenamiento de los algoritmos de descubrimiento de Instagram.

“Estamos muy emocionados por el impacto que tendrán [Global Illumination] aquí en OpenAI. Todo el equipo se ha unido para trabajar en nuestros productos principales, incluido ChatGPT”, dijo la empresa en un comunicado publicado en su blog oficial.

OpenAI nació como una organización sin fines de lucro en 2015. Tres años más tarde perdió dicha condición cuando impuso una política que prometió que cada socio podría recuperar su inversión multiplicada hasta por 100. Con la compra de Global Illumination las intenciones de la empresa por convertirse en un negocio son claras y necesarias.

La empresa comenzó a establecer un modelo de negocio a través del lanzamiento de ChatGPT Plus y una API de pago para su bot con la intención de recuperar los más de 540 millones de dólares que invirtió el año pasado para desarrollar su popular chatbot, según cifras de The Information. Aunque las soluciones de pago de OpenAI incrementaron los ingresos de la empresa, también aceleraron el ritmo de gastos destinados a optimizar los productos y la infraestructura que los respalda.

Así, OpenAI consiguió ingresos por 300 millones de dólares el año pasado. Según su CEO, la intención es incrementar la cifra a 200 millones al cierre de este año y conseguir 1,000 millones en 2024. La compra de Global Illumination es clave para cumplir la meta.

Con la compra, además de la infraestructura y el talento humano que garantiza la empresa cofundada por Dimson, OpenAI gana un activo interesante que puede expandir el uso de sus modelos de lenguaje IA al servicio del entretenimiento, un rubro hasta ahora no considerado por la empresa.

Biomes, es un un juego multiplayer en línea de código abierto (MMORPG, por sus siglas en inglés) creado por Global Illumination que emula las cualidades de Minecraft. Enfocado solo al terreno web, el producto tiene las características necesarias para expandir el negocio de OpenAI a un nuevo mercado.

La presión para OpenAI crece al mismo ritmo que la competencia dentro del segmento de ChatGPT. Lejos de Bard de Google o Bing IA de Microsoft, ChatGPT ahora rivaliza con un sin fin de desarrollos basados en código abierto. Con Llama2, Meta se perfila como el gran competidor a vencer.

La popularidad del chatbot de OpenAI abrió una nuevo terreno de competencia ahora minado por miles de desarrollos con capacidades similares que, gracias a modelos de lenguaje open source, proponen menos inversiones y ganancias más elevadas a corto plazo.

C.

Microsoft anuncia grandes novedades a través de Bing Chat

Bing Microsoft

Tras el lanzamiento de la inteligencia artificial de Bing en febrero de este 2023, Microsoft ha apostado por esta tecnología. A partir del día de ayer, Bing Chat pasará de una vista previa limitada a una vista previa abierta, lo que significa que todos pueden acceder al chatbot sin necesidad de unirse a una lista de espera. Todo lo que se necesita hacer ahora para acceder es iniciar sesión en Bing con la cuenta de Microsoft y ya está todo listo.

Una de las actualizaciones más importantes que Microsoft es la búsqueda multimodal. Además de las consultas basadas en texto, el nuevo chatbot Bing aceptará imágenes que se peguen en la interfaz o que se arrastren y suelten desde el escritorio o la carpeta. Además si se le hace una pregunta al chatbot y se puede responder mejor con un elemento visual, como un gráfico o tabla, este así lo hará.

A esto hay que sumar que una de las características más importantes del modelo de aprendizaje de idiomas GPT-4 de OpenAI es que los usuarios también podrán generar imágenes de IA a partir de texto en su idioma nativo.

Otras actualizaciones incluyen la capacidad de guardar todas las sesiones de chat anteriores de Bing, a las que puedes acceder fácilmente en un panel de la ventana de la barra lateral, como en ChatGPT

También hay algunas integraciones en Bing como un mensaje “organizar mis pestañas” que agrupa las pestañas por temas y el chat también puede ayudar a encontrar funciones ocultas de Edge, como la capacidad de importar contraseñas desde otro navegador.

Por último y de nuevo de manera similar a ChatGPT, Microsoft está trabajando en la creación de complementos de terceros en la experiencia de chat.

Dos ejemplos proporcionados por Microsoft fueron un complemento Wolfram Alpha que permitiría que se realizaran gráficos y cálculos matemáticos avanzados en Bing Chat y un complemento Open Table que le daría al chatbot la capacidad de hacer reservas por el usuario

Con todo esto, Microsoft busca llevar la experiencia con Bing a otro nivel y dar el golpe definitivo sobre la mesa para que esta herramienta adquiera todo el potencial de GPT-4 y realmente muestre el potencial de la inteligencia artificial generativa del siglo XXI

C.

Google DeepMind, la respuesta de Google para posicionarse en la IA

Google DeepMind

Google, de Alphabet Inc., ha consolidado sus grupos de investigación de Inteligencia Artificial (IA) en una sola unidad. El cambio une al equipo Brain de Google Research y DeepMind de Alphabet en un solo equipo y busca “combinar todo este talento en un equipo enfocado, respaldado por los recursos computacionales de Google, acelerará significativamente nuestro progreso en IA”, de acuerdo al director ejecutivo, Sundar Pichai. Demis Hassabis liderará el grupo como CEO de DeepMind.

DeepMind de Alphabet, con sede en Londres, ha sido conocida durante mucho tiempo como la unidad de la empresa matriz de Google que introdujo regularmente avances en inteligencia artificial, incluido su trabajo en AlphaFold, la tecnología que puede predecir la forma de las proteínas, así como AlphaGo, el software que aprendió por sí mismo a jugar el juego de estrategia Go mejor que cualquier humano en la tierra. Internamente, la unidad generalmente se ha visto como un grupo que trabaja en conceptos de inteligencia artificial que pueden no tener aplicaciones directas en los productos de Google.

Mientras tanto, Google Research fue responsable de la tecnología de “transformadores”, componentes clave para grandes modelos linguisticos. Esa tecnología impulsa la cosecha actual de chatbots, incluidos Bard de Google y ChatGPT de OpenAI Inc.

Ahora, la reorganización de Google parece consolidar ese trabajo de investigación bajo un mismo paraguas, Google DeepMind, lo que indica una integración más estrecha con el resto de Alphabet. Durante el reporte de resultados del cuarto trimestre de Alphabet en febrero, la compañía anunció que, a partir de este año, DeepMind se incluiría en los costos corporativos de Alphabet para reflejar cómo se está incorporando la tecnología a otros negocios, y no en la categoría de “Otras apuestas”, que tiene un impacto menos inmediato, dijo Alphabet.

James Manyika, vicepresidente sénior de tecnología y sociedad de Google, asumirá el cargo de director de Google Research. La unidad está destinada a continuar su trabajo en áreas como privacidad y seguridad, computación cuántica, salud, clima e inteligencia artificial responsable. Manyika también amplió su alcance cuando el ejecutivo de Google Clay Bavor, dejó la compañía asumiendo la responsabilidad de los proyectos de tecnología emergente que había supervisado anteriormente.

Google DeepMind quiere reunir al talento mundial que existe en relación a la IA con toda la infraestructura y recursos que se disponen para “crear la próxima generación de avances y productos de IA en Google y Alphabet”. Y es que algo que tiene Google sin duda son recursos económicos para poder avanzar en los grandes retos que enfrenta este tipo de tecnología y las limitaciones que se encuentran en la actualidad.

En la nota de Google, el CEO Sundar Pichai, ha querido ir un poco más allá afirmando que el primer proyecto en el que estará involucrado este equipo son los modelos de IA multimodales (y que también son los más poderosos). Pero no ha detallado los productos de Google donde se terminarán aplicando, salvo el recordatorio que tanto en YouTube como en la propia cámara de los Google Pixel se encuentra este tipo de tecnología.

C.