Descubriendo el landscape de herramientas de IA Generativa por Xavi Garrido

El panorama de aplicaciones de inteligencia artificial (IA) generativa ha experimentado un rápido crecimiento en los últimos años, abarcando una amplia gama de dominios y aplicaciones. En este artículo, presentaremos una descripción general del panorama de aplicaciones de IA generativa y cómo está construido en diferentes categorías, con el objetivo de proporcionar una comprensión clara de su estructura y alcance.

La IA generativa se divide en varias categorías, entre las que se encuentran texto, generación de código, imagen, discurso, vídeo, 3D y otros dominios. Cada una de estas categorías se basa en diferentes modelos de IA generativa y cada uno tiene diversas aplicaciones.

Para poder entender el landscape de soluciones que hay en el mercado, la empresa Sequoia, ha creado un cuadro muy ilustrativo para entender esto y poder clasificar cada aplicación del mercado:

En el eje central tenemos las diferentes categorías, en la parte inferior están los modelos de IA generativa que se usan para esa categoría, y finalmente en la parte superior en verde esta la capa de aplicación.

De esta manera tenemos que para: 

  • Texto: Esta es la categoría más avanzada, con aplicaciones que incluyen marketing (contenido), ventas (correo electrónico), soporte (chatbots y correo electrónico), escritura general, toma de notas y más. A medida que los modelos mejoren, podemos esperar ver contenidos de mayor calidad y longitud, así como una mejor adaptación específica al sector. Aquí encontramos lo modelos más conocidos, OpenaI GPT-4 y chatGPT, Deepmind de Google, Facebook Opt, etc… 

  • Código: Con la aparición de herramientas como GitHub Copilot, la generación de código promete tener un gran impacto en la productividad de los desarrolladores a corto plazo y facilitar el uso creativo del código para personas no especializadas en el desarrollo. Aquí podemos ver cómo las aplicaciones son la generación de código, la documentación del mismo, pasar texto a SQL o generar web app.

  • Imagen: Aunque es un fenómeno más reciente, la generación de imágenes se ha vuelto viral debido a su facilidad para compartir en redes sociales. Estamos presenciando la aparición de modelos de imágenes con diferentes estilos estéticos y técnicas para editar y modificar las imágenes generadas. Las aplicaciones incluyen generación de imágenes, social y consumo, publicidad, medios y diseño.

  • Discurso: Aunque la síntesis de voz existe desde hace tiempo (¡hola, Siri!), las aplicaciones para consumidores y empresas están mejorando. Para aplicaciones de alta calidad, como películas y podcasts, la calidad del habla sintética es esencial. Los modelos actuales ofrecen un punto de partida para el refinamiento adicional o la producción final para aplicaciones utilitarias.

  • Vídeo: La generación y edición de vídeo está avanzando rápidamente, y su potencial para desbloquear mercados creativos masivos como el cine, los videojuegos, la realidad virtual, la arquitectura y el diseño de productos físicos es emocionante. Los modelos de vídeo y 3D están siendo desarrollados por organizaciones de investigación en este momento.

  • 3D: Modelos 3D y escenas. Esta categoría está emergiendo rápidamente y promete revolucionar áreas como la arquitectura, el diseño de productos y la industria del entretenimiento.

  • Otros dominios: La investigación y desarrollo de modelos fundamentales en IA generativa está ocurriendo en numerosos campos, como el audio y la música, la biología y la química (proteínas y moléculas generativas), los videojuegos, la automatización de procesos robóticos (RPA) y más.

En resumen, el panorama de aplicaciones de IA generativa se compone de diversas categorías basadas en diferentes modelos de IA generativa, cada una con aplicaciones específicas. A medida que la tecnología avance, podemos esperar ver mejoras significativas en la calidad, la personalización y la amplitud de las aplicaciones de IA generativa, lo que tendrá un impacto profundo en la forma en que trabajamos, nos comunicamos y nos entretenemos.

A medida que el panorama de aplicaciones de IA generativa continúe evolucionando, es probable que surjan nuevas categorías y aplicaciones. Además, es posible que veamos una convergencia de estas tecnologías, lo que permitirá a los usuarios y empresas aprovechar múltiples tipos de IA generativa de manera integrada. Por ejemplo, podríamos ver aplicaciones que combinen texto, imágenes y síntesis de voz para crear experiencias multimedia interactivas y envolventes.

También podemos esperar que la IA generativa se vuelva más accesible y fácil de usar, con interfaces de usuario más intuitivas y una mayor interoperabilidad entre diferentes plataformas y dispositivos. Esto permitirá a un público más amplio, incluidos aquellos sin habilidades técnicas especializadas, beneficiarse de las potentes capacidades de la IA generativa. 

En el ámbito empresarial, las aplicaciones de IA generativa tienen el potencial de impulsar la eficiencia y la productividad, al tiempo que reducen costos y aceleran la innovación. Por ejemplo, en el marketing y las ventas, la IA generativa puede ayudar a crear contenido personalizado y persuasivo a gran escala, mejorando la efectividad de las campañas y el compromiso del cliente.

En la educación, la IA generativa podría revolucionar la enseñanza y el aprendizaje al proporcionar recursos educativos personalizados y adaptativos que se ajusten a las necesidades y habilidades individuales de los estudiantes. También podría facilitar la colaboración y el intercambio de conocimientos entre profesionales de diversas disciplinas y regiones geográficas.

En resumen, el panorama de aplicaciones de IA generativa es un campo en rápida evolución y expansión, que abarca una amplia gama de categorías y aplicaciones. A medida que la tecnología avance, podemos esperar un impacto significativo en la forma en que trabajamos, nos comunicamos y nos entretenemos, así como en la aparición de nuevos desafíos éticos y de seguridad. Esto ha provocado la salida masiva en los últimos meses de centenares de aplicaciones que usan estos modelos y es por ello que desde NextBigThing creemos necesario ordenarlos para que todos sepamos que usar y como usarlo.

Xavi Garrido, Senior Digital Marketing Executive

NCComentario