The Washington Post experimenta con la IA pero pone límites

Jugar con la IA generativa es un asunto serio para The Washington Post. La mayoría de la gente considera ChatGPT una herramienta experimental y se está acostumbrando a sus excentricidades y errores. Pero los grandes modelos lingüísticos (LLM) como ChatGPT tienen un desafortunado historial de inventar historias, algo inaceptable para cualquier publisher preocupado por la integridad y la precisión periodísticas.

"Para nosotros, como empresa periodística es inaceptable", afirma Sam Han, director de IA y aprendizaje automático de The Washington Post y responsable de Zeus Technology. Sin embargo, a medida que los lectores se adaptan a nuevas formas de obtener información, como las interfaces conversacionales, "queremos ofrecerles opciones similares".

Sin sobrepasar límites

Para mantener a raya a los LLM, The Washington Post ha establecido unas directrices. Por ejemplo, si se pregunta a ChatGPT sobre el impacto del cambio climático en la economía, podría escanear información online y producir una respuesta no muy correcta. En cambio, The Washington Post introduce selectivamente en el modelo fragmentos o frases de sus propios artículos para estar seguro de generar una respuesta fiable.

The Washington Post está experimentando con LLM comerciales, como ChatGPT de Open AI, Google Bard y el despliegue de GPT a través de AWS. También está probando LLM de código abierto, incluyendo variedades de LLaMA de Meta, para ver si se pueden refinar. "No queremos estar técnicamente atados a un modelo concreto", recalcan desde el medio.

Pero The Washington Post tiene otra razón para estudiar los LLM de código abierto. "Así podemos tener nuestra versión para procesos confidenciales", afirma Han. Según tienen entendido, si un usuario accede a la interfaz web de ChatGPT, OpenAI puede rastrear la conversación y utilizar los datos con fines de formación. Pero si alguien utiliza una API, OpenAI conserva los datos durante 10 días con fines de depuración y luego los descarta.

Las cuestiones jurídicas, como si los LLM se están formando en los datos del Post sin permiso, son cuestiones políticas que entran en el ámbito del Grupo de Trabajo sobre IA del periódico.

No se innova sin experimentar

A finales de mayo, The Washington Post anunció la creación de dos equipos multifuncionales centrados en la IA. El AI Task Force establece las directrices y prioridades de la política de IA. Este comité directivo podría decir que un humano tiene que estar en el bucle antes de que The Washington Post publique cualquier contenido generado por IA o que el contenido generado por IA debe incluir un descargo de responsabilidad claro o una notificación declarándose como tal. Han dirige el AI Hub de The Washington Post, un equipo operativo que recoge ideas relacionadas con la IA de toda la organización y pone en marcha pruebas de concepto (POC) para las ideas más prometedoras.

El equipo presenta las POC al Grupo de Trabajo de IA. Si se llega a un consenso para llevar a producción determinadas POC, el AI Hub las asigna a los equipos adecuados. El AI Hub ha aportado algunas ideas viables, como un chatbot que podría responder a las preguntas de los lectores, una herramienta de documentación automática y una herramienta de generación de titulares. Un pequeño subgrupo de redactores está evaluando actualmente la viabilidad de la generación de titulares con IA.

Pero The Washington Post no es ajeno a la IA. Anteriormente, creó modelos de aprendizaje automático para ejecutar una serie de tareas, como predecir la propensión a la suscripción y la rotación, moderar comentarios, recomendar artículos a los lectores y realizar análisis de sentimiento.

Y durante el ciclo electoral de 2016, el periódico creó un sistema de generación automática de contenidos llamado Heliograf que tomaba datos en tiempo real de Associated Press para crear automáticamente actualizaciones de cientos de elecciones a gobernador y estatales. Posteriormente, Heliograf se expandió a otras áreas de cobertura, como los deportes locales, antes de que The Washington Post lo desconectara porque "la tecnología no estaba ahí", aseguraba Han. "El lenguaje no era lo suficientemente bueno".

Actualmente, The Washington Post está probando modelos de IA generativa frente a sus modelos tradicionales de aprendizaje automático. Su modelo de análisis de sentimientos, que The Washington Post utiliza para alimentar las recomendaciones de los lectores y satisfacer las necesidades de los anunciantes, es un buen ejemplo.

Históricamente, un data scientist pasaba tres o cuatro meses construyendo un modelo, tras lo cual The Washington Post recopilaba datos utilizando Amazon Mechanical Turk. Después, entre tres y cinco revisores calificaban manualmente los artículos según su opinión.

Ahora, The Washington Post entrega una clave API a un desarrollador de software, que puede compartir un ejemplo de artículo positivo y otro negativo con un LLM y pedir al modelo que clasifique el sentimiento de un nuevo artículo. Sin embargo, aún no se sabe si el nuevo modelo puede superar al anterior, porque las pruebas no han hecho más que empezar.

Aspiraciones de la IA

Aun así, The Washington Post tiene grandes ambiciones. En la "redacción del futuro", dice Han, cada periodista podría tener un asistente de inteligencia artificial que recopilara, analizara y resumiera la información para los artículos. A lo largo del proceso de redacción y edición, el agente de IA podría hacer sugerencias sobre el texto o los titulares, generar distintos resúmenes y traducir el artículo a varios idiomas.

"En la fase de distribución, también veo un gran potencial", afirma Han, como generar distintas versiones de un artículo para diferentes audiencias. También podría reempaquetar el contenido original en distintos formatos para TikTok o Facebook.

Otro campo en el que la IA podría brillar es el de facilitar interacciones más personalizadas entre lectores y reporteros. Según Han, un avatar de un periodista que adopte su voz podría interactuar con los lectores en tiempo real, recoger información de esas conversaciones y devolvérsela al periodista.

Han reconoce que las medios como The Washington Post tienen por delante muchos obstáculos prácticos y técnicos en lo que respecta a las tecnologías de IA. Al igual que las redes sociales cambiaron la forma de consumir información, ChatGPT y sus similares modificarán los hábitos y gustos de lectura de formas difíciles de prever.

Fuente: Adexchanger

NC27 de julio de 2023Comentario