Una startup desarrolla un marketplace de datos con IA que permite monetizar contenidos

Trainspot, una startup estadounidense emergente, ha lanzado un marketplace de datos de IA que promete revolucionar la forma en que los creadores de contenido pueden monetizar su propiedad intelectual para entrenar las herramientas de inteligencia artificial (IA). Este espacio permitirá a desarrolladores y empresas acceder a datos de entrenamiento con licencia, al mismo tiempo que dará la opción a creadores de contenido (escritores, cineastas, artistas...) de vender libros, imágenes, vídeos o código para el entrenamiento de modelos de IA.

En la industria de IA, existen preocupaciones sobre la legalidad, fiabilidad y transparencia de los datos que se utilizan y, por ello, Trainspot busca abordar estos desafíos ofreciendo una plataforma que garantice un acceso seguro y transparente a datos de entrenamiento de calidad, con técnicas avanzadas como la generación aumentada por recuperación (RAG) para mejorar la precisión de los modelos.

Esta startup ofrece un marketplace bidireccional con opciones tanto para compradores como para vendedores, según explica Digiday. Los creadores pueden establecer perfiles, fijar precios, ofrecer contenido de forma gratuita o incluso restringir el uso de sus datos por parte de modelos de IA. La plataforma verifica la identidad de los creadores para asegurar la autenticidad antes de permitirles vender, donar o bloquear su contenido. Las empresas, por su parte, pueden filtrar y comprar datos en función de formato, términos de licencia y temas específicos, todo gestionado a través de un sistema de pago electrónico.

Los cofundadores, Ron Palmeri y David Temkin, describen a Trainspot como el "Spotify de los datos de entrenamiento" o el "eBay para el comercio de datos de IA", ofreciendo un enfoque accesible y transparente para definir precios en este emergente mercado.

Precios justos y transparencia

La transparencia es uno de los principales retos en este sector. En este sentido, Trainspot ofrece un entorno abierto donde los precios son claros, a diferencia de los acuerdos opacos que suelen caracterizar la industria. Temkin señala que el valor de los datos en IA aún es incierto, pero que con un mercado transparente, será posible establecer estándares claros para los precios y la compensación de creadores.

“Puede ser difícil determinar los precios justos de los datos”, afirma Soren Larson, cofundador de Crosshatch, una startup que crea una capa de identidad para la personalización del usuario. “Esto se debe a que el valor real de los datos para aplicaciones específicas de IA suele ocultarse a los vendedores, lo que provoca disparidades en los precios”, dijo. Larson mencionó que las tácticas estratégicas de fijación de precios, como las utilizadas por los fondos de cobertura, pueden distorsionar aún más el mercado.

Según Palmeri y Temkin, la primera prioridad a la hora de escalar es suministrar al mercado suficientes datos antes de centrarse en aumentar la demanda. Para empezar, habrá una gran cantidad de contenidos disponibles públicamente, gratuitos y con licencia previa. Trainspot también quiere permitir a los creadores subir sus contenidos desde plataformas como YouTube y GitHub, pero también pueden subirlos directamente.

Plataformas como Shutterstock, Adobe, Picsart y Bria AI ya están explorando diversos modelos de pago. Otras empresas, como la startup de IA musical Rightsify, han creado grupos comerciales que promueven datos obtenidos de forma ética.

Además, analistas como Andrew Frank de Gartner destacan la necesidad de crear confianza de marca en plataformas como Trainspot, de manera similar a cómo los consumidores confían en medios de noticias reconocidos. Trainspot podría ofrecer esta credibilidad para asegurar que los datos utilizados en IA provienen de fuentes fiables.

Masa crítica de creadores

No obstante, Trainspot se enfrenta a ciertos desafíos al intentar generar interés suficiente tanto de creadores como de empresas que busquen datos de calidad. Para alcanzar el éxito, la plataforma deberá atraer una masa crítica de creadores y consolidarse como una fuente fiable de datos para modelos de IA en un entorno donde la competencia y los cambios tecnológicos avanzan rápidamente.

“Realmente se requiere una masa crítica de personas que entran en estas diferentes categorías (ya sean autores de libros o YouTubers o personas que tienen sitios web) para entender que esta es una acción que pueden tomar”, dijo Palmeri. “Es una acción que podría ayudar a protegerlos y establecer sus derechos, pero también es una forma de que participen en la oportunidad”.

En este sentido, Nikolaos Vasiloglou, vicepresidente de investigación de ML en RelationalAI, señaló que las empresas se están quedando sin datos de calidad y se enfrentan a límites a la hora de utilizar datos de terceros. Como Larson, dijo que la fijación de precios de los productos en nuevos mercados puede ser un reto, pero añadió que el primer paso es hacer que los datos estén disponibles para que, con el tiempo, demuestren su valor. En su opinión, Trainspot podría tener en cuenta la estrategia de crecimiento inicial de YouTube, que se centró en los contenidos generados por los consumidores antes de buscar licencias de contenidos de los grandes estudios.

“Nos falta un hueco en el mercado para esto, pero quizá ahora no sea el momento oportuno”, afirma Vasiloglou. “Puede que aún no hayamos llegado al punto en el que las empresas hayan adoptado tanto los modelos lingüísticos que ansíen nuevos datos. Ese es el mayor riesgo”, comentó.

“La plataforma parece tener potencial para empoderar a los creadores de contenidos y hacer frente a la creciente demanda de datos de alta calidad”, dijo, por su parte, Frank, quien también hizo hincapié en la necesidad de tener mecanismos que mantengan esta confianza a lo largo del proceso de entrenamiento de la IA, permitiendo a los desarrolladores rastrear los orígenes y evaluar la fiabilidad de los datos de entrenamiento.

NCTrainspot