Meta presenta SAM: una IA que potencia el desarrollo de la visión artificial

Demo de SAM presentada por META

Meta presentó hoy un modelo de Inteligencia Artificial (IA) que puede seleccionar elementos individuales dentro de una imagen. Le llamaron SAM: Segment Anything Model. Sus desarrolladores explicaron que con el sistema pretenden democratizar un aspecto clave de la visión artificial.

Esta nueva IA logra lo que se conoce como “segmentación”, que es la capacidad de identificar qué píxeles de una imagen pertenecen a un objeto específico. SAM funciona de forma muy sencilla: solo hay que hacer clic en el elemento que se quiere seleccionar o escribir su nombre. En una demostración, al apuntar la palabra “gato”, la herramienta dibujó cuadros alrededor de varios gatos que aparecían en una foto.

El lanzamiento de SAM vino acompañado de la presentación de SA-1B (Segment Anything 1-Billio), el conjunto de datos de segmentación más grande hasta la fecha, asegura Meta en un comunicado. Esta IA ha sido entrenada para tener una “noción general” de lo que son los objetos, lo que le permite encontrar todo tipo de cosas en cualquier imagen o video.

¿Cuál podría ser su uso práctico? La aplicación más obvia está en la edición de fotografías. Pero Meta explica que, en el futuro, SAM podría usarse para identificar artículos cotidianos a través de lentes de Realidad Aumentada. Los usuarios podrían, de esta manera, recibir recordatorios o instrucciones. La compañía también destacó su posible aplicación en el análisis de imágenes científicas.

El nuevo modelo de IA está capacitado en un conjunto de datos de más de mil millones de “máscaras de segmentación”, el sistema de visión artificial que permite singularizar un objeto por medio de una sección delimitadora. Esto es lo que le permite generalizar nuevos tipos de elementos más allá de lo que observó durante el entrenamiento. Meta destaca, además, que SAM permite recopilar nuevas máscaras de manera interactiva en menos de 14 segundos.

Meta, la casa matriz de Facebook e Instagran, ya utiliza una tecnología similar para tareas internas como clasificar imágenes, filtrar contenido inapropiado y sugerir publicaciones a los usuarios de sus redes sociales. El modelo y el conjunto de datos SAM se pueden descargar para uso no comercial. Los usuarios que quieran probar un prototipo con sus propias imágenes también deben aceptar que sea solo para fines de investigación.

Además del desarrollo de SAM, Meta se ha puesto como objetivo clave para este año integrar más “herramientas creativas”de IA generativa en sus aplicaciones, según ha explicado director ejecutivo, Mark Zuckerberg.

La empresa anunció en febrero pasado el lanzamiento de LLaMA, su propio modelo de lenguaje. A diferencia ChatGPT (de OpenAI) o de Bard (creado por Google), Meta presentó su propuesta como una herramienta más “pequeña y de mayor rendimiento”. Fue puesta a disposición a grupos de investigación específicos también bajo una licencia no comercial.

C.

Microsoft implementará ChatGPT y DALL-E 2

Microsoft

Satya Nadella, CEO de Microsof reveló que la empresa comercializará el uso de DALL-E 2 o ChatGPT, integrándolos en todos sus productos.

La intención de Microsoft es que tanto usuarios finales como empresariales puedan incorporar dichas herramientas en sus propias aplicaciones. ¿Y cómo planea lograrlo? A través de Azure, por supuesto. Las palabras de Nadella llegaron justo cuando su compañía ha anunciado que planea abrir el acceso a un servicio llamado Azure OpenAI.

“Con el servicio Azure OpenAI ahora disponible de forma general, más empresas pueden solicitar acceso a los modelos de IA más avanzados del mundo, incluidos GPT-3.5, Codex y DALL-E 2, respaldados por capacidades de nivel empresarial confiables e infraestructura optimizada para inteligencia artificial de Microsoft Azure, para crear aplicaciones de vanguardia. Los clientes también podrán acceder muy pronto a ChatGPT, una versión mejorada de GPT-3.5 que ha sido entrenada y ejecuta inferencias en la infraestructura de Azure AI, a través del servicio Azure OpenAI”, indicó la firma.

De acuerdo con Satya Nadella, la intención es convertir a Azure en “el lugar para cualquiera que piense sobre inteligencia artificial”. Pero no se detuvo allí, puesto que aseguró que todos los productos de Microsoft incorporarán algún tipo de herramienta basada en IA que los transformará por completo.

De esta forma, la empresa afirman su intención de sacarle provecho al máximo a su vínculo con OpenAI. No olvidemos que en los últimos días se conoció que la compañía trabajaría para implementar ChatGPT en Bing, para por fin competir cara a cara con Google, como así también en las principales aplicaciones de Office, como Word y PowerPoint.

Vale aclarar que el servicio Azure OpenAI no es algo precisamente nuevo. La plataforma se encuentra a prueba desde fines de 2021 y, de hecho, es la que potencia Copilot, la herramienta bajo suscripción mensual de GitHub que se ha vuelto muy popular entre los programadores.

Al integrar ChatGPT, DALLE-2 y otros desarrollos de OpenAI en Azure, Microsoft pretende que las personas, empresas y organizaciones cuenten con más instrumentos para mejorar su productividad. De acuerdo con Satya Nadella, los trabajadores deberían aprovecharlos y no creer que en el futuro les dejarán sin empleo.

El caso de Microsoft y OpenAI también es interesante no solo desde la óptica tecnológica, sino también desde la empresarial.

El vínculo entre ambas empresas data de 2019, cuando Microsoft invirtió U$D 1,000 millones en OpenAI. En 2020, en tanto, los de Redmond adquirieron una licencia exclusiva para utilizar la tecnología que potencia el modelo de lenguaje GPT-3. Y con la explosión en popularidad de ChatGPT, ahora van por más.

Microsoft realizar una nueva inversión en OpenAI, pero de U$D 10,000 millones. La financiación, de acuerdo con Semafor, elevaría la valoración de la firma de inteligencia artificial a los U$D 29,000 millones.

Así, de concretarse, Microsoft recibiría el 75% de los ingresos de OpenAI hasta recuperar su inversión. Y una vez que ello ocurra, los de Redmond quedarían como dueños del 49% de la compañía dirigida por Sam Altman. Otro 49% pertenecería a los demás inversores, mientras que el 2% restante quedaría en manos de OpenAI Inc., la casa matriz sin fines de lucro que maneja el laboratorio de IA.

C.

ChatGPT: Qué es y cómo usarlo

ChatGPT inteligencia artificial

ChatGPT es un un sistema de chat con inteligencia artificial que está entrenada para mantener conversaciones, de manera que solo se tienen que hacer preguntas de manera convencional y las entenderá.

A una inteligencia artificial se la entrena a base de texto, se le hacen preguntas y se le añade información, de manera que este sistema, a base de correcciones a lo largo del tiempo, va “entrenándose” para realizar de forma automática la tarea para la que ha sido diseñada. Este es el método para entrenar a todas las IA, tanto a la de ChatGPT como otras del estilo de los Magic Avatars de Lensa.

ChatGPT es un sistema de chat basado en el modelo de lenguaje por Inteligencia Artificial GPT-3, desarrollado por la empresa OpenAI. Es un modelo con más de 175 millones de parámetros, y entrenado con grandes cantidades de texto para realizar tareas relacionadas con el lenguaje, desde la traducción hasta la generación de texto.

En el caso de ChatGPT, esta IA ha sido entrenada para mantener conversaciones con cualquier persona. Sus algoritmos deberían ser capaces de entender lo que le estés preguntando con precisión, incluyendo adjetivos y variaciones que añadas en tus frases, y de responderte de una manera coherente.

Lo más sorprendente de este chat por IA concreto es que es capaz de dar respuestas muy acertadas y completas, incluso de varios párrafos. Además, en estas respuestas es capaz de expresarse de manera natural y con información muy exacta, lo que hace muy complicado distinguir que el texto ha sido generado por IA.

Esta IA es tan potente y capaz de generar respuestas completas e informadas que hay quien dice que podría acabar con Google y buscadores similares. Sin embargo, en muchos temas es poco precisa, sobre todo en nombres y algunos conceptos, por lo que todavía no está a la altura de permitirte copiar lo que ha escrito y pegarlo, aunque hace que sientas que ese momento está cada vez más cerca para las IA.

Además de responder a la pregunta, esta AI tiene un sentido del contexto y reconoce todo lo que se ha estado hablando hasta ahora, por lo que si se le hace alguna pregunta relacionada con una respuesta que ya ha dado, sabrá identificar si te refieres a ello sin tener que darle toda la explicación.}

Para poder usarla hay que entrar a su web oficial, que es https://chat.openai.com. La primera vez se tendrá que crear una cuenta en la web de OpenAI, pero todo es completamente gratuito, y también el chat.

Luego de iniciar sesión se entra al chat y se podría escribir en la barra lo que se quiera. Se podrán ver algunos ejemplos en inglés y cosas que se pueden preguntar en cualquier idioma.

A la hora de utilizarlo, es recomendable experimentar con distintos tipos de peticiones para explorar todas las funciones de la IA. En casos como este, el ingenio a la hora de realizar preguntas o peticiones puede ser clave para obtener resultados sorprendentes.

Es importante recordar que todo lo que se escriba quedará registrado, y podrá ser revisado después por los desarrolladores de OpenIA para seguir entrenando a ChatGPT. Por lo tanto, se recomienda no incluir información personal ni peticiones que sean potencialmente peligrosas o delictivas.

ChatGPT es una de esas herramientas cuyas funciones completas todavía no han sido descubiertas, porque en parte depende del ingenio de las personas que interactúan con ella. Lo más sencillo es pedirle que explique cualquier cosa, evento o concepto, y la IA lo hará a través de los datos con los que se la ha entrenado.

El cielo es el límite. Se pueden pedir líneas de códigos, escribir ensayos de hechos históricos, fichas de especificaciones de productos, comparativas, poemas, chistes, listas de página web, etcétera. Se le puede pedir que realice textos como si le hablara a un niño de 5 años, y en definitiva, cualquier cosa relacionada con el lenguaje o que pueda ser expresada a través de él.

 Hay muchos ejemplos, y se pueden preguntar cosas que nadie haya preguntado antes y esto servirá para descubrir nuevas funciones.

C.

Xiaomi presenta CyberOne, su primer robot humanoide  

CyberOne

La empresa de tecnología Xiaomi presentó a CyberOne, el primer “robot humanoide de tamaño completo. Según el CEO de la compañía, Lei Jun, los robots inteligentes serán “parte de la vida de las personas en el futuro”.

Como el miembro más nuevo de la serie Cyber de Xiaomi, CyberOne está equipado con brazos y piernas avanzados, admite el equilibrio de la postura del movimiento bípedo y alcanza un par máximo de hasta 300 Nm. También cuenta con la capacidad de detectar emociones humanas, capacidades de visión avanzada y una funcionalidad que le permite crear reconstrucciones virtuales tridimensionales del mundo real, junto a otras tecnologías avanzadas.

Las capacidades mecánicas y de inteligencia artificial de CyberOne han sido todas desarrolladas por Xiaomi Robotics Lab. “Hemos invertido mucho en investigación y desarrollo que abarcan varias áreas, incluida la innovación de softwarehardware y algoritmos”, ha asegurado Jun. “Con IA en su núcleo y un cuerpo humanoide de tamaño completo como recipiente, esta es una exploración de las posibilidades del futuro ecosistema tecnológico de Xiaomi y un nuevo avance para la empresa”.

CyberOne  mide 177 cm de altura y 52 kg de peso, con una envergadura de brazos de 168 cm. En comparación con un robot cuadrúpedo, este robot humanoide es más complejo mecánicamente y requiere motores más potentes, más grados de libertad y complejos algoritmos de control de bípedos humanoides. Admite hasta 21 grados de libertad en movimiento y logra una velocidad de respuesta en tiempo real de 0.5 ms por cada grado de libertad, lo que le permite simular por completo los movimientos humanos.

El rendimiento de movimiento de un robot depende del rendimiento de cada motor de articulación. El requerimiento tecnológico para construir tales motores es extremadamente alto ya que es necesario generar más energía cinética sin aumentar el tamaño de los componentes. Para garantizar la flexibilidad de las extremidades superiores de CyberOne, Xiaomi ha desarrollado un motor de alta eficiencia que pesa solo 500 gramos con un par de salida nominal de hasta 30 Nm para el motor de la articulación de las extremidades superiores. El motor de la articulación de la cadera también es capaz de alcanzar un par máximo instantáneo de hasta 300 Nm. Gracias al algoritmo de control bípedo humanoide de desarrollo propio, la postura al caminar de CyberOne ha sido programada para ser natural y estable. Además de eso, CyberOne es capaz de soportar hasta 1,5 kg de peso con una sola mano y programación por demostración. 

Los robots humanoides dependen de la visión para procesar su entorno; por eso, CyberOne ha sido equipado con un módulo de visión de profundidad Mi-Sense de desarrollo propio y combinado con un algoritmo de interacción de IA. De esta forma el robot es capaz de percibir el espacio 3D, así como de reconocer individuos, gestos y expresiones, lo que le permite no solo ver, sino también procesar su entorno. Asimismo, para comunicarse con el mundo CyberOne está equipado con un motor de reconocimiento de semántica ambiental MiAI de desarrollo propio y un motor de identificación de emociones vocales, lo que le permite reconocer 85 tipos de sonidos ambientales y 45 clasificaciones de emociones humanas.

La robótica se considera la “joya de la corona de la fabricación”, siendo los robots humanoides el objetivo final para muchos en la industria. Como consecuencia, el desarrollo de CyberOne es un símbolo de la dedicación de Xiaomi para incubar un ecosistema tecnológico centrado en un solo punto y conectarlo con el mundo de formas nunca antes vistas. Lei Jun señala que los robots biónicos humanoides requieren el más alto grado de integración técnica y presentan el mayor desafío en el campo de la robótica inteligente. Xiaomi está dando sus primeros pasos en el campo y CyberOne agrega constantemente nuevas capacidades. “Creemos que los robots inteligentes definitivamente serán parte de la vida de las personas en el futuro”, concluyó Jun. 

C.

Esto es lo que nos dejó el CES 2022

CES 2022

El CES 2022 ha concluido tras una semana repleta de miles de presentaciones de productos que han desvelado innovaciones que mejorarán el mundo y resolverán los retos globales. Después de casi dos años, el CES regresó a Las Vegas para acoger a más de 40,000 asistentes en persona, incluidos 1,800 medios de comunicación de todo el mundo, en 11 recintos interiores y exteriores. La feria fue un acontecimiento mundial, ya que el 30% de los asistentes viajaron desde fuera de Estados Unidos, representando a 119 países.

Además, más de 800 startups de 19 países se presentaron en Eureka Park, el centro de startups para CES 2022. El taxi aéreo SkyDrive; la perfumería algorítmica EveryHuman de ScenTronix; y Orbisk, un sistema de monitoreo de desperdicio de alimentos totalmente automatizado impulsado por IA, fueron algunas de las propuestas presentadas. Por su lado, la Venetian Expo también contó con un pabellón europeo que destacó los últimos avances tecnológicos de Europa.

Las tendencias más destacadas de CES 2022

Tecnologías transformadoras capaces de estimular los negocios y cambiar los mercados fueron las grandes protagonistas de CES 2022. Algunas de las grandes marcas del sector, como Bosch, Canon, Hisense, HTC, LG Electronics, Nvidia, Samsung Electronics, Sony, Panasonic y Qualcomm, son las responsables de los innovadores productos que se presentaron.

Por ejemplo, LG inicia su año con importantes lanzamientos. Bajo el lema ‘The Better Life You Deserve’, la compañía surcoreana tiene como objetivo mejorar la vida diaria de los usuarios mediante la innovación y el diseño. Así, se incluyen productos como LG PuriCare AeroTower, una solución todo-en-uno de purificación del aire para el hogar que está diseñada para ofrecer los beneficios de un purificador y de un ventilador y calefactor; o LG Tiiun, un equipo de jardinería interior. Además acaba de lanzar su nueva gama de televisores, liderada por sus últimos paneles OLED. Estos dispositivos presentan una tecnología visual y un sistema operativo webOS mejorado e integrando muchas funciones y servicios aún más inteligentes.

Por su parte HP anunció sus nuevos monitores LG UltraFine OLED Pro2022 (modelos 32BP95E, 27BP95E). Estas soluciones de sonido ofrecen la reproducción precisa del color y un gran rendimiento HDR y SDR que demandan los artistas de efectos visuales, los editores de video y otros profesionales de la industria creativa.

Samsung refuerza su apuesta por el gaming con varios anuncios importantes entre los que se encuentra su asociación con los principales servicios de streaming de juegos (NVIDIA, Google Stadia y Utomik), aunque añadirá más en el futuro, incorporando sus bibliotecas de juego al completo a Samsung Gaming Hub, una nueva plataforma que estará disponible a nivel mundial en casi todos los modelos de Samsung Smart TV 2022. Las nuevas Micro LED de Samsung suben el nivel de su calidad de imagen con 25 millones de LEDs de tamaño micrométrico que producen luz y color individualmente. La nueva serie llega con tres grandes tamaños de 110, 101 y 89 pulgadas. Por otra parte, Samsung está ampliando el uso de envases ecológicos para abarcar una gama más amplia de productos, como aspiradoras, electrodomésticos, hornos microondas y purificadores de aire, entre otros, permitiendo a los consumidores reutilizar las cajas en las que vienen sus productos. Este proceso se ha iniciado ya en Corea del Sur y se extenderá durante 2022 de manera progresiva a otros mercados.

En el caso de smartphones, OnePlus fue desvelando poco a poco la información sobre su nuevo smartphone, el OnePlus 10 Pro que dará a conocer oficialmente el próximo 11 de enero para el mercado chino. Por el momento se conoce su diseño y que montará el Snapdragon 8 Gen 1. El equipo contará con algunas características importantes como una batería mejorada de 5.000mAh con carga rápida de 80W y un sistema de triple cámara de 50MP. El smartphone tiene unas dimensiones de 16,3×7,39×0,85cm.

Finalmente, TCL presentó su nueva familia de smartphones, los TCL 30 5G, con los que busca democratizar el acceso a la tecnología 5G. El lanzamiento llega acompañado de la presentación de la nueva tableta 5G, TCL TAB 10s 5G. La familia de los TCL 30 está formada por el TCL 30XE 5G, TCL 30 V 5G y el TCL 30 5G, pero sólo el último llegará a Europa, mientras que los otros dos se comercializarán exclusivamente en Estados Unidos.

Asimismo, durante el acontecimiento se pudieron detectar otras tendencias clave. Entre ellas destacaron la tecnología de vehículos. MW, Hyundai, Indy Autonomous Challenge, Stellantis y VinFast, el primer fabricante de automóviles de Vietnam, son algunas de las firmas que anunciaron novedades.

También destacaron novedades enfocadas en telemedicina. Se trata de dispositivos de salud conectados y mejoras de las características y funcionalidades de salud disponibles en dispositivos portátiles. Dichas presentaciones permitieron a los consumidores tomar un mejor control de su propia salud. Abbott, Essence y Baracoda Daily Healthtech, fueron las compañías más relevantes de esta categoría.

Sin embargo, la protagonista absoluta de todo el CES 2022 fue la Inteligencia Artificial. La posibilidad de convertir los productos y tecnologías en más eficientes y personalizables permitió avanzar a casi todas las industrias principales. Desde el sector de la agricultura hasta la atención médica, la automoción, la fabricación y el entretenimiento, se benefician de la cada vez más frecuente y actualizada IA. Algunas de las muestras más destacadas fueron el primer tractor completamente autónomo, de John Deere, y un robot con IA que prepara y cocina comidas personalizables, de Beyond Honeycomb.

Una de las características que definen el CES 2022 es el repertorio de conferencias magistrales que ofrece a sus asistentes. Líderes y altos ejecutivos de todas las industrias globales acudieron al escenario principal de la feria para presentar sus discursos. Entre las conferencias más relevantes se encuentran las de J.H. Han, vicepresidente, director ejecutivo y director de la división DX (Device eXperience) de Samsung Electronics; Mary Barra, presidenta y directora ejecutiva de General Motors; y Robert B. Ford, presidente y director ejecutivo de Abbott. Este último llevó a cabo la primera conferencia magistral sobre atención médica en la historia de CES.

Además, la presentadora de FOX Business ganadora del premio Emmy, Liz Claman, así como los propietarios de Sierra Nevada Corporation (SNC), Erin y Faith Ozmen, hablaron durante la Cena de Líderes en Tecnología de CES.

Por su parte, la organización del acontecimiento recibió elogios por los protocolos de salud que se implementaron. Además, para aquellos que por alguna de las medidas de seguridad no pudieron acudir al evento en persona, se generó un evento paralelo en formato virtual. Se trata de una plataforma digital a la que los usuarios podrán acceder desde la comodidad de sus hogares hasta el 31 de enero.

Tras el éxito del regreso de la presencialidad de CES, las ventas de espacios para CES 2023 ya cuentan con un buen comienzo.

C.

Project Wing entregará paquetes mediante drones

 project wing

Project Wing, la iniciativa de la empresa X que es parte de Alphabet, casa matriz de Google, ahora podrá entregar paquetes a domicilio con drones. Wing lanzó su primer servicio público en Canberra, Australia, después de que la autoridad aeronáutica del país, Seguridad de la Aviación Civil de Australia (CASA), le concediera la aprobación regulatoria. El servicio de pedidos funciona al asociarse con negocios locales que incluyen cafeterías y farmacias para entregar sus productos “en minutos”.

Alrededor de 100 hogares en los suburbios de Crace, Palmerston y Franklin inicialmente tendrán acceso al servicio, pero en los próximos meses la compañía planea expandirlo en áreas de Harrison y Gungahlin. Los usuarios que quieran usar el servicio deberán descargar una app de Wing en su celular, con la que podrán elegir productos populares como café, comida, helado y medicina, que recibirán en un dron minutos después de haber ordenado.

De acuerdo con Buisiness Insider, CASA envió las siguientes directrices necesarias para utilizar el servicio: 

  • Los drones tendrán permitido volar sobre calles y hogares, pero no sobre avenidas principales. 
  • Los drones pueden volar cinco metros por encima de las personas y dos metros antes de hacer una entrega. 
  • Los vuelos no están permitidos antes de las 07:00 horas de la mañana entre lunes y sábado y no antes de las 08:00 horas del domingo. 
  • Las personas elegibles para recibir entregas recibirán un curso de seguridad para acercarse a los drones.

Project Wing predice que las entregas de aviones no tripulados podrían entregar hasta uno de cada cuatro pedidos de comida para 2030.

Project Wing empezó en 2014 como parte del equipo de Google X para después pasar a formar parte de Alphabet, pero no han tenido un camino fácil. Hubo problemas financieros y un intento en 2017 de aliarse con la cadena de comida Chipotle y la farmacéutica Chemist Warehouse, pero la regulación norteamericana, en este caso la FAA, no les ha dado todavía el permiso para operar.

A diferencia de EEUU, sí lo han conseguido ahora en Australia, donde CASA ha autorizado que los drones mensajeros de Project Wing operen en días laborables, después de las siete de la mañana, y envíen comida, bebida o medicamentos. En diciembre, Wing anunció que lanzaría un servicio de prueba en Finlandia donde ofrecería entregas de 10 minutos gratis dentro de la capital del país.

Estos drones no llegan a aterrizar y simplemente depositan el paquete en el jardín de la casa. Un mecanismo bastante seguro aunque no se ha detallado todavía cómo sería este servicio en un bloque de pisos.

Pese a no ser los primeros en tener un servicio de mensajería aérea —la empresa Flytrex lo hizo primero en Islandia en 2017— Alphabet sí le ganó a los drones de Amazon, quienes se suponía lo lanzarían en 2018.

La empresa de entrega de aviones no tripulados de Google se ha adelantado en ofrecer un servicio comercial al público en general. A pesar de una serie de entregas de prueba de alto perfil en el Reino Unido y EEUU, el servicio de Amazon aún no se ha lanzado comercialmente, señaló Business Insider.

El año pasado, un portavoz de Amazon dijo a The Associated Press que la compañía todavía está “comprometida a hacer realidad nuestro objetivo de entregar paquetes de drones en 30 minutos o menos de hasta 2.3 kilos”.

No solo Amazon compite con Wing para ofrecer entregas de drones. La empresa israelí Flytrex comenzó a probar su propio servicio de logística de drones en Islandia en 2017 y Flirtey estaba haciendo entregas de aviones no tripulados comerciales para 7-Eleven en los EEUU desde 2016.

Más recientemente, UPS se asoció con Matternet para experimentar con el uso de aviones no tripulados para entregar servicios médicos. Suministros en Carolina del Norte.

C.