El CEO de DeepMind afirma que su próximo algoritmo "opacará" a ChatGPT
Allá por 2016, un programa de inteligencia artificial llamado AlphaGo, del laboratorio de IA DeepMind de Google, hizo historia al derrotar a un campeón del juego de mesa llamado Go. Ahora Demis Hassabis, cofundador y director ejecutivo de DeepMind, afirma que sus ingenieros están utilizando técnicas de AlphaGo para crear un sistema de IA llamado Gemini que, asegura, será más capaz que el que hay detrás de ChatGPT de OpenAI.
Gemini, de DeepMind, aún en desarrollo, es un gran modelo lingüístico que trabaja con texto y es de naturaleza similar a GPT-4, que impulsa ChatGPT. Pero, como recoge el medio Wired, Hassabis dice que su equipo combinará esa tecnología con técnicas utilizadas en AlphaGo con el objetivo de dotar al sistema de nuevas capacidades como la planificación o la capacidad de resolver problemas.
"A alto nivel, puedes pensar en Gemini como una combinación de algunos de los puntos fuertes de los sistemas tipo AlphaGo con las asombrosas capacidades lingüísticas de los grandes modelos", afirma Hassabis. "También tenemos algunas innovaciones que van a ser muy interesantes", añadió.
Gemini se presentó por primera vez en la conferencia de desarrolladores de Google del mes pasado, cuando la empresa anunció una serie de nuevos proyectos de IA.
AlphaGo, por su parte, se basaba en una técnica pionera de DeepMind llamada aprendizaje por refuerzo, en la que el software aprende a enfrentarse a problemas difíciles que requieren elegir qué acciones realizar, como en el Go o en los videojuegos, haciendo intentos repetidos y recibiendo información sobre su rendimiento. También utilizó un método llamado búsqueda en árbol para explorar y recordar posibles movimientos en el tablero. El próximo gran salto de los modelos lingüísticos puede consistir en que realicen más tareas en Internet y en ordenadores.
Gemini aún está en fase de desarrollo, un proceso que llevará varios meses, afirma Hassabis. Podría costar decenas o cientos de millones de dólares. Sam Altman, CEO de OpenAI, dijo en abril que crear GPT-4 costó más de 100 millones de dólares.
Gemini podría tener un papel clave
Cuando Gemini esté terminado, podría desempeñar un papel fundamental en la respuesta de Google a la amenaza competitiva que suponen ChatGPT y otras tecnologías de IA generativa. La empresa de búsquedas fue pionera en muchas de las técnicas que permitieron el reciente torrente de nuevas ideas de IA, pero optó por desarrollar y desplegar productos basados en ellas con cautela.
Desde el debut de ChatGPT, Google ha lanzado su propio chatbot, Bard, y ha incorporado la IA generativa a su motor de búsqueda y a muchos otros productos. Para impulsar la investigación en IA, la empresa combinó en abril la unidad DeepMind de Hassabis con el principal laboratorio de IA de Google, Brain, para crear Google DeepMind. Hassabis afirma que el nuevo equipo reunirá a dos potencias que han sido fundamentales para el reciente progreso de la IA.
"Si nos fijamos en dónde estamos en IA, yo diría que el 80 o 90% de las innovaciones provienen de uno u otro", dice Hassabis. "Hay cosas brillantes que han hecho ambas organizaciones en la última década". Hassabis tiene experiencia a la hora de sortear la fiebre del oro de la IA que sacude a los gigantes tecnológicos, aunque la última vez fue él mismo quien desató el frenesí.
En 2014, DeepMind fue adquirida por Google tras demostrar resultados sorprendentes de un software que utilizaba el aprendizaje por refuerzo para dominar videojuegos sencillos, como apunta el citado medio. Durante los años siguientes, DeepMind demostró cómo la técnica hace cosas que antes parecían exclusivamente humanas, a menudo con una habilidad sobrehumana. Cuando AlphaGo venció al campeón de Go Lee Sedol en 2016, muchos expertos en IA se quedaron atónitos, porque habían creído que pasarían décadas antes de que las máquinas llegaran a dominar un juego de tal complejidad.
Aprendizaje automático
Entrenar un gran modelo lingüístico como el GPT-4 de OpenAI implica introducir grandes cantidades de texto de libros, páginas web y otras fuentes en un software de aprendizaje automático conocido como transformador. Este utiliza los patrones de esos datos de entrenamiento para convertirse en un experto en la predicción de las letras y palabras que deben seguir a un fragmento de texto, un mecanismo sencillo que resulta sorprendentemente potente a la hora de responder preguntas y generar texto o código.
Un paso adicional importante en la creación de ChatGPT y otros modelos lingüísticos similares es el uso del aprendizaje por refuerzo basado en los comentarios de los humanos sobre las respuestas de un modelo de IA para perfeccionar su rendimiento. La amplia experiencia de DeepMind en el aprendizaje por refuerzo podría permitir a sus investigadores dotar a Gemini de nuevas capacidades.
Hassabis y su equipo también podrían tratar de mejorar la tecnología de grandes modelos lingüísticos con ideas de otras áreas de la IA. Los investigadores de DeepMind trabajan en áreas que van desde la robótica a la neurociencia, y a principios de esta semana la empresa demostró un algoritmo capaz de aprender a realizar tareas de manipulación con una amplia gama de brazos robóticos diferentes.
Aprender de la experiencia física del mundo, como hacen los humanos y los animales, se considera importante para aumentar la capacidad de la IA. El hecho de que los modelos lingüísticos aprendan sobre el mundo indirectamente, a través del texto, es considerado por algunos expertos en IA como una limitación importante.
Futuro obscuro
A Hassabis se le ha encomendado la tarea de acelerar los esfuerzos de Google en el campo de la IA y, al mismo tiempo, gestionar riesgos desconocidos y potencialmente graves. Los recientes y rápidos avances en los modelos lingüísticos han hecho que muchos expertos en IA (incluidos algunos que construyen los algoritmos) estén preocupados por si la tecnología se utilizará con fines malévolos o será difícil de controlar. Algunos expertos en tecnología han pedido incluso que se detenga el desarrollo de algoritmos más potentes para evitar crear algo peligroso.
Como apunta Wired, Hassabis afirma que los extraordinarios beneficios potenciales de la IA, por ejemplo, para el descubrimiento científico en áreas como la salud o el clima, hacen imperativo que la humanidad no deje de desarrollar la tecnología. También cree que imponer una pausa es poco práctico, ya que sería casi imposible de aplicar. "Si se hace correctamente, será la tecnología más beneficiosa para la humanidad", afirma sobre la IA. "Tenemos que ir audaz y valientemente a por esas cosas".
Eso no significa que Hassabis abogue por que el desarrollo de la IA proceda a toda prisa. DeepMind lleva explorando los riesgos potenciales de la IA desde antes de que apareciera ChatGPT, y Shane Legg, uno de los cofundadores de la empresa, dirige desde hace años un grupo de "seguridad de la IA" dentro de la compañía. El mes pasado, Hassabis se unió a otras figuras destacadas de la IA para firmar una declaración en la que advertía de que la IA podría suponer algún día un riesgo comparable a una guerra nuclear o una pandemia.
Uno de los mayores retos actuales, según Hassabis, es determinar cuáles pueden ser los riesgos de una IA más capaz. "Creo que hay que investigar más en este campo -con mucha urgencia- sobre cosas como las pruebas de evaluación", afirma, para determinar lo capaces y controlables que son los nuevos modelos de IA.
Para ello, DeepMind podría poner sus sistemas a disposición de científicos externos. "Me encantaría que el mundo académico tuviera un acceso temprano a estos modelos de vanguardia", afirma, una idea que, de llevarse a cabo, podría ayudar a abordar la preocupación de que los expertos ajenos a las grandes empresas se estén quedando fuera de las investigaciones más recientes sobre IA.
¿Hasta qué punto hay que preocuparse? Hassabis afirma que nadie sabe con certeza si la IA se convertirá en un peligro grave. Pero está seguro de que si el progreso continúa al ritmo actual, no queda mucho tiempo para desarrollar salvaguardas. "Veo bien el tipo de cosas que estamos incorporando a la serie Gemini, y no tenemos motivos para creer que no vayan a funcionar", afirma.
Fuente: Wired