Cómo 2024 será el “salto adelante” para la IA

Un bronceado evento en san francisco En noviembre, se le preguntó a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas traería este campo en 2024.

Los chatbots en línea como ChatGPT de OpenAI darán «un salto adelante que nadie esperaba», respondió Altman de inmediato.

Sentado a su lado, James Manyika, un ejecutivo de Google, asintió y dijo: “Ni uno más”. »

Este año, se espera que la industria de la IA se defina por una característica principal: una mejora notablemente rápida en la tecnología a medida que los avances se complementan entre sí, lo que permite a la IA generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras e infiltrarse en el mundo. mundo físico. gracias a una nueva generación de robots.

En los próximos meses, los generadores de imágenes basados ​​en IA como DALL-E y Midjourney entregarán instantáneamente videos e imágenes fijas. Y poco a poco se irán fusionando con chatbots como ChatGPT.

Esto significa que los chatbots irán mucho más allá del texto digital y manejarán fotografías, vídeos, diagramas, tablas y otros medios. Demostrarán un comportamiento que se parece más al razonamiento humano, abordando tareas cada vez más complejas en áreas como matemáticas y ciencias. A medida que la tecnología se expanda hacia los robots, también ayudará a resolver problemas más allá del mundo digital.

Muchos de estos desarrollos ya han comenzado a surgir en los mejores laboratorios de investigación y productos tecnológicos. Pero en 2024, la potencia de estos productos aumentará significativamente y serán utilizados por mucha más gente.

«El rápido progreso en IA continuará», dijo David Luan, director ejecutivo de Adept, una startup de IA. «Es inevitable.»

OpenAI, Google y otras empresas de tecnología están haciendo avanzar la IA mucho más rápido que otras tecnologías debido a la forma en que están construidos los sistemas subyacentes.

La mayoría de las aplicaciones de software son creadas por ingenieros una línea de código informático a la vez, lo que suele ser un proceso lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales. Al identificar patrones en datos como artículos de Wikipedia, libros y textos digitales recuperados de Internet, una red neuronal puede aprender a generar texto por sí sola.

Este año, las empresas de tecnología planean alimentar a los sistemas de inteligencia artificial con más datos (incluidas imágenes, sonidos y más texto) de los que la gente puede imaginar. A medida que estos sistemas aprendan las relaciones entre estos diferentes tipos de datos, aprenderán a resolver problemas cada vez más complejos, preparándolos para la vida en el mundo físico.

(El New York Times demandó a OpenAI y Microsoft el mes pasado por infracción de derechos de autor sobre contenido de noticias relacionado con sistemas de inteligencia artificial).

Nada de esto significa que la IA pronto podrá igualar al cerebro humano. Si bien las empresas y los empresarios de IA pretenden crear lo que llaman “inteligencia general artificial” (una máquina capaz de hacer todo lo que el cerebro humano puede hacer), sigue siendo una tarea de enormes proporciones. A pesar de su rápido progreso, la IA todavía está en su infancia.

Aquí hay una guía sobre cómo evolucionará la IA este año, comenzando con avances a corto plazo que conducirán a mayores avances en sus capacidades.

Hasta ahora, las aplicaciones impulsadas por IA han generado principalmente texto e imágenes fijas en respuesta a indicaciones. DALL-E, por ejemplo, puede crear imágenes fotorrealistas en segundos después de consultas como «buceo con rinocerontes en el puente Golden Gate».

Pero este año, empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, probablemente lanzarán generadores de imágenes que también permitirán a los usuarios generar videos. Estas empresas ya han creado herramientas prototipo que pueden crear videos instantáneamente a partir de mensajes de texto breves.

Es probable que las empresas de tecnología integren los poderes de los generadores de imágenes y videos en los chatbots, haciendo que estos últimos sean más poderosos.

Los chatbots y los generadores de imágenes, originalmente desarrollados como herramientas independientes, se están fusionando gradualmente. Cuando OpenAI lanzó una nueva versión de ChatGPT el año pasado, el chatbot podía generar tanto imágenes como texto.

Las empresas de IA están construyendo sistemas «multimodales», lo que significa que la IA puede manejar múltiples tipos de medios. Estos sistemas aprenden habilidades analizando fotografías, textos y potencialmente otros tipos de medios, incluidos diagramas, gráficos, sonidos y vídeos, para luego poder producir sus propios textos, imágenes y sonidos.

No es todo. Dado que los sistemas también aprenden las relaciones entre diferentes tipos de medios, podrán comprender un tipo de medio y responder con otro. En otras palabras, alguien puede ingresar una imagen en el chatbot y este responderá con texto.

«La tecnología será más inteligente y más útil», afirmó Ahmad Al-Dahle, que dirige el grupo de IA generativa en Meta. «Hará más cosas».

Los chatbots multimodales cometerán errores, al igual que los chatbots basados ​​en texto cometen errores. Las empresas de tecnología están trabajando para reducir los errores mediante la creación de chatbots que puedan razonar como un humano.

Cuando Altman habla del avance de la IA, se refiere a los chatbots que son mejores en “razonamiento” y, por lo tanto, pueden asumir tareas más complejas, como resolver problemas matemáticos complejos y generar programas informáticos detallados.

El objetivo es construir sistemas que puedan resolver un problema de forma cuidadosa y lógica a través de una serie de pasos discretos, cada uno de los cuales se basa en el siguiente. Así razonan los humanos, al menos en algunos casos.

Los principales científicos no están de acuerdo sobre si los chatbots realmente pueden razonar así. Algunos argumentan que estos sistemas simplemente parecen razonar repitiendo el comportamiento que han observado en los datos de Internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de manera más confiable preguntas complejas que involucran materias como matemáticas, programación de computadoras, física y otras ciencias.

«A medida que los sistemas se vuelvan más confiables, se volverán más populares», dijo Nick Frosst, un ex investigador de Google que ayuda a administrar Cohere, una startup de inteligencia artificial.

Si los chatbots razonan mejor, pueden transformarse en “agentes de IA”.

A medida que las empresas enseñan a los sistemas de inteligencia artificial cómo resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en su nombre.

Básicamente, los investigadores están transformando los chatbots en un nuevo tipo de sistema autónomo llamado agente de inteligencia artificial. Esto significa que los chatbots pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, incluidas hojas de cálculo, calendarios en línea y sitios de viajes. Entonces la gente podría dejar el tedioso trabajo de oficina en manos de chatbots. Pero estos agentes también podrían eliminar puestos de trabajo por completo.

Los chatbots ya funcionan como agentes a pequeña escala. Pueden programar reuniones, editar archivos, analizar datos y crear gráficos de barras. Pero estas herramientas no siempre funcionan tan bien como deberían. Los agentes se descomponen por completo cuando se aplican a tareas más complejas.

Este año, se espera que las empresas de inteligencia artificial presenten agentes más confiables. «Debería poder delegar cualquier tedioso trabajo diario de TI en un agente», afirmó Luan.

Esto podría incluir el seguimiento de gastos en una aplicación como QuickBooks o el registro de días de vacaciones en una aplicación como Workday. A largo plazo, esto se extenderá más allá del software y los servicios de Internet y llegará al mundo de la robótica.

En el pasado, los robots estaban programados para realizar la misma tarea una y otra vez, como recoger cajas que siempre tenían el mismo tamaño y forma. Pero al utilizar el mismo tipo de tecnología que sustenta a los chatbots, los investigadores están dando a los robots el poder de manejar tareas más complejas, incluidas algunas que nunca antes habían visto.

Así como los chatbots pueden aprender a predecir la siguiente palabra de una oración analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que sucederá en el mundo físico analizando innumerables videos de objetos empujados, levantados y desplazados.

“Estas tecnologías pueden absorber enormes cantidades de datos. Y a medida que absorben datos, pueden aprender cómo funciona el mundo, cómo funciona la física, cómo se interactúa con los objetos”, dijo Peter Chen, ex investigador de OpenAI que dirige Covariant, una startup de robótica.

Este año, la IA impulsará robots que operan detrás de escena, como los brazos mecánicos que doblan camisas en una lavandería o clasifican montones de cosas en un almacén. Titanes de la tecnología como Elon Musk también están trabajando para dar un paso al frente robots humanoides en hogares.