IA Generativa: Qué es y tipos de aplicaciones

Categorías: Tecnología
ia-generativa

La IA generativa o Inteligencia Artificial generativa —en inglés, Generative AI, GEN AI— abre un mundo repleto de posibilidades en lo que respecta a la creación de contenido nuevo y original. Esta rama de la IA es capaz de generar texto, código software, imágenes, vídeos, sonido y diseños de productos y estructuras. Todo ello, a partir del uso de algoritmos y modelos de aprendizaje automático, como las Redes Generativas Antagónicas (GANs) o las Transformer, que tienen la capacidad de aprender teniendo en cuenta un amplio conjunto de datos.

 

Una vez entrenados, estos modelos pueden generar contenido nuevo a partir de una entrada inicial o, simplemente, generando muestras aleatorias. Esta capacidad de generar contenido inédito convierte a la IA Generativa en una tecnología poderosa y con multitud de aplicaciones prácticas. No obstante, entraña ciertos desafíos, en tanto en cuanto, el contenido generado puede tener ciertas implicaciones sociales y culturales significativas.

 

Por todo ello, en el presente artículo de nuestra sección de tecnología, haremos un viaje por la historia de la IA Generativa, descubriremos diferentes tipos y ejemplos de aplicaciones que la utilizan, así como los posibles riesgos que puede entrañar su uso.

 

¿Quiere implementar soluciones IA en su empresa para mejorar la atención al cliente, incrementar la productividad y detectar anomalías o incidencias? Haga clic aquí y solicite una demo gratuita de AuraQuantic.

 

 

Cómo hemos llegado hasta la IA Generativa

El concepto de Inteligencia Artificial (IA) fue acuñado por primera vez en el documento titulado A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence (1955), redactado por John McCarthy y con la participación de un reconocido grupo de investigadores entre los cuales figuran los nombres de Marvin Lee Minsky, Nathaniel Rochester y Claude Shannon. Dicho texto recogía una propuesta formal para llevar a cabo un estudio sobre la inteligencia artificial, durante el verano de 1956, en el Dartmouth College de Hanover (New Hampshire), bajo la premisa de que “cada aspecto del aprendizaje o cualquier otra característica de la inteligencia, puede ser descrito de manera tan precisa que se pueda simular en una máquina”. Además, se buscaba dar respuesta a “cómo hacer que las máquinas utilicen el lenguaje, formen abstracciones y conceptos, resuelvan problemas reservados para los humanos y se mejoren a sí mismas”.

 

Toda una declaración de intenciones por parte de los autores responsables de esta iniciativa y que terminaría fraguando, poco tiempo después, en la definición aportada por McCarthy sobre IA, entendida como “la ciencia y tecnología de crear máquinas inteligentes, especialmente programas informáticos inteligentes”.

 

Años más tarde, en 1966, Joseph Weizenbaum del MIT AI Laboratory, creó el primer chatbot o bot conversacional que bautizó bajo el nombre de ELIZA. Este programa informático podía simular a un psicoterapeuta, con la finalidad de mantener conversaciones con un paciente.

 

En la década de los 80 y 90, tuvo lugar unos de los hitos más importantes en el desarrollo de la IA generativa, con el surgimiento de los modelos generativos probabilísticos, como las Redes Bayesianas y los Modelos Ocultos de Markov —en inglés, Hidden Markov models, HMMs—. Estos permitían a los sistemas de IA tomar decisiones más complejas y generar resultados más diversos. Sin embargo, la generación de contenido de alta calidad continuó siendo un desafío hasta bien entrados los 2000.

 

En concreto, fue en la década de 2010 cuando la IA generativa experimentó un importante avance con los modelos de aprendizaje profundo, como las Redes Generativas Antagónicas (GAN) y, después, los Autocodificadores Variacionales, —en inglés, Variational Autoencoders, VAE.

 

Las GAN, propuestas por Ian Goodfellow en 2014 y su equipo de investigación, son dos redes neuronales que pueden interactuar entre sí y aprender de los datos, con la finalidad de generar un contenido completamente nuevo. En el proceso, una red neuronal generadora y otra discriminadora trabajan conectadas, de forma que el generador crea muestras sintéticas y el discriminador intenta distinguir entre las muestras generadas y las reales. A medida que estas redes compiten entre sí, el generador mejora su capacidad para crear contenido más realista y convincente.

 

Por otra parte, los VAE son un tipo de redes neuronales que se utilizan en un contexto de aprendizaje no supervisado. El proceso comienza a través de una red neuronal llamada “codificador” que captura datos de entrada, procedentes de imágenes o texto, y los transforma en una representación numérica. Después, se introduce un cierto nivel de incertidumbre en esa representación, para que la otra red neuronal llamada “decodificador” pueda generar otras representaciones inciertas y, a partir de estas, generar datos nuevos y variados que permitan crear, por ejemplo, nuevas imágenes o textos. Finalmente, y tras una fase de entrenamiento, con ejemplos de datos reales, los VAE aprenden a generar versiones únicas y diferentes, de imágenes o textos, pero relacionadas con los datos originales.

 

En 2017, varios investigadores procedentes de Google Brain, Google Research y la Universidad de Toronto, entre ellos, Ashish Vaswani, Noam Shazeer y Niki Parmar, publicaron Attention is All You Need. Un artículo científico que marcó un hito en la historia de la IA, al introducir la arquitectura de red neuronal, denominada Transformer, que revolucionó el campo del Procesamiento del Lenguaje Natural — en inglés, Natural Language Processing, NLP—, y que es la base de los Grandes Modelos de Lenguaje —en inglés, Large Language Models, LLMs— existentes hoy en día.

 

A modo de aclaración, cabe señalar aquí que los modelos de lenguaje de Inteligencia artificial son fruto de la combinación del Procesamiento del Lenguaje Natural (NLP) y la Generación del Lenguaje Natural (NLG). En concreto, el NLP dota a los ordenadores de herramientas que les permiten comprender y procesar el lenguaje natural (aquel que es utilizado por los seres humanos para comunicarse, ya sea escrito o hablado); mientras que, el NLG lo hace para la generación de texto o, incluso, voz utilizando el lenguaje natural. Así, los LLMs se utilizan para comprender y generar lenguaje humano de forma automática, realizando tareas como la traducción, generación, resumen y corrección de texto, y la respuesta a preguntas. Una labor para la que utilizan algoritmos de aprendizaje automático y grandes conjuntos de datos (corpus), con la finalidad de aprender patrones y reglas lingüísticas.

 

La arquitectura de red neuronal Transfomer demostró ser altamente efectiva en una variedad de tareas de NLP, entre las cuales se incluyen la traducción automática, generación de textos, respuestas a preguntas, identificación de identidades, desambiguación de textos, entre otros. Además, a diferencia de las arquitecturas tradicionales basadas en capas recurrentes, este nuevo modelo de Deep Learning o Aprendizaje Profundo se basa en un mecanismo de atención que le permite ponderar diferentes partes de una entrada como, por ejemplo, un texto, en función de su importancia. Además, aprende contexto y, por lo tanto, significado mediante el seguimiento de relaciones en datos secuenciales, como las palabras que forman parte de una oración. BERT (Bidirectional Encoder Representations for Transformers) fue el primer LLM creado en 2018 por Google, basado en redes Transformer. Posteriormente, vendría GPT con sus diferentes versiones y BARD.

 

Por otra parte, el mercado tecnológico actual ofrece una amplia y variada carta de aplicaciones de IA generativas, las cuales veremos a continuación y que agruparemos en diferentes categorías según el contenido.

 

 

Tipos de aplicaciones de IA Generativa

 

texto 1. Texto: Dentro de este apartado se encuentran aquellas aplicaciones destinadas a la generación de textos creativos, resúmenes automáticos de textos extensos, corrección de contenido y chatbots que pueden mantener conversaciones con los usuarios.

 

  • ChatGPT: Desarrollado por la compañía OpenAI, este chatbot es capaz de generar contenido, al igual que un ser humano, y responder a preguntas completas. Adicionalmente, AuraQuantic dispone en su marketplace de un conector de integración con Azure OpenAI Service que proporciona acceso a los modelos de lenguaje de OpenAI, garantizando la privacidad en los datos usados, con la garantía de Microsoft Azure. Estos se pueden adaptar para que realicen tareas específicas y, también, combinarlos con las funcionalidades que ofrece esta plataforma software.

 

  • Copy.ai: Herramienta basada en IA que permite crear contenidos para comercio electrónico, publicaciones alojadas en blogs, anuncios, redes sociales y sitios web. 

 

  • Grammarly: Ofrece sugerencias mientras se redacta un texto en tiempo real para mejorar la gramática, la puntuación y el estilo. 

 

 

imagen2. Imágenes: Aplicaciones para la generación y edición automática de imágenes realistas e, incluso, generación de obras de arte originales de cualquier estilo.

 

  • DALL·E: OpenAI está detrás de este sistema de IA para la creación de imágenes y arte realista, a partir de descripciones en lenguaje natural.

 

  • Stable Diffusion: Diseñada para generar imágenes digitales a partir de texto natural.

 

  • NVIDIA Canvas: Utiliza la IA para producir imágenes fotorrealistas partiendo de simples bocetos.

 

 

código3. Código: Estas herramientas de IA generativa se utilizan para agilizar el proceso de desarrollo de software, por medio de la generación automática de nuevo código.

 

  • GitHub Copilot: Sirve de apoyo a los programadores, a la hora de escribir código de una forma más rápida. Funciona con OpenAI Codex, un modelo de lenguaje generativo preentrenado y creado por la compañía responsable de ChatGPT.

 

  • Tabnine: Complemento para varios entornos de desarrollo integrados (IDE) que utiliza técnicas de IA para generar sugerencias útiles y en tiempo real, mientras se escribe código de programación.

 

  • DeepCode: Impulsada por la plataforma Snyk, ayuda a los desarrolladores a mejorar la calidad y seguridad del código fuente proporcionando sugerencias y detectando errores.

 

 

audio4. Audio: Para la creación de composiciones musicales y mejora de la calidad del audio en las grabaciones.

 

  • Amper Music: Uno de los generadores de música con IA más fáciles de usar del mercado, ya que, no requiere de conocimientos en composición musical.

 

  • Auphonic: Herramienta web de posproducción de audio para conseguir resultados con una calidad profesional.

 

  • Murf.ai: Se trata de uno de los generadores de voz con IA más populares. Cualquier usuario puede convertir texto a voz (TTS), voz en off y dictado, siendo de gran utilidad para desarrolladores de productos, atención al cliente, podcasters y marketers entre otros perfiles profesionales.

 

 

video5. Vídeo: Este tipo de herramientas de IA generativa están destinadas a la generación de vídeos sintéticos —utilizando algoritmos y técnicas de renderizado en computadora— y deepfakes.

 

  • Synthesia: Plataforma de creación de vídeos con IA que promete resultados profesionales en tan solo 15 minutos, sin necesidad de equipos ni habilidades especiales de edición.

 

  • Runway Gen-1: Utiliza palabras e imágenes para generar vídeos nuevos, a partir de los existentes. Además, Runway Gen-1 fue utilizada en algunas escenas de la película ganadora de 7 premios Óscar, Everything everywhere all at once.

 

  • Reface: Aplicación de intercambio de rostros en videoclips y GIFs para la creación de deepfakes.

 

 

diseño6. Diseño: Aplicaciones de IA generativa enfocadas en el diseño de productos, tanto para la fase de generación de ideas, como para la optimización del diseño y su personalización.

 

  • Generative Design: Autodesk es la compañía responsable de esta herramienta que utiliza algoritmos de IA para el diseño y la fabricación de productos en base a los requisitos establecidos.

 

  • Ansys Discovery: Herramienta de diseño impulsada por simulación, la cual revela información crítica en las primeras fases del proceso de diseño (creación de prototipos).

 

  • nTop: Anteriormente conocida como nTopology, se trata de una herramienta CAD que ha revolucionado la forma en que los ingenieros diseñan piezas para la fabricación aditiva, relacionadas con el sector aeroespacial, médico, construcción, automoción y consumo.

 

 

Riesgos de la IA Generativa

El apartado final de este post está dedicado a la identificación de los principales riesgos de la IA generativa. Una cuestión que, hoy en día, genera controversias entre diversos actores y grupos sociales, como la comunidad científica, órganos reguladores y legisladores, empresas, grupos de defensa y activistas, además de usuarios y público en general.

 

Así lo manifiesta la publicación trimestral y de carácter científico Entrepreneurial Business and Economics Review (EBER), subvencionada por la Universidad de Economía de Cracovia, en un artículo titulado “The dark side of generative artificial intelligence: A critical analysis of controversies and risks of ChatGPT” (2023). El texto firmado por un amplio equipo de investigadores de diferentes instituciones académicas identifica y proporciona una comprensión exhaustiva, acerca de los desafíos y oportunidades asociados con el uso de los modelos generativos, entre los cuales figuran:

 

  1. Falta de regulación del mercado de IA y necesidad urgente de establecer un marco normativo.
  2. Mala calidad de la información, falta de control sobre la calidad, desinformación, contenido deepfake y sesgo algorítmico.
  3. Pérdidas de empleos impulsadas por la automatización.
  4. Violación de los datos personales, vigilancia social y violación de la privacidad.
  5. Manipulación social, debilitamiento de la ética y la buena voluntad.
  6. Aumento de las desigualdades socioeconómicas.
  7. Tecnología relacionada con el estrés tecnológico.

 

Ante estas amenazas, algunos países han decidido tomar cartas en el asunto. A finales de 2023, se espera que la UE alcance un acuerdo sobre la forma o estructura que adoptará la Ley de Inteligencia Artificial en el Consejo Europeo, junto a los estados miembros. Así, la primera ley integral sobre IA en el mundo tendrá por objeto garantizar unas condiciones favorables en el desarrollo y aplicación de esta tecnología en diferentes ámbitos. Todo un desafío de cara a conseguir que los sistemas de IA utilizados en la UE sean seguros, transparentes, trazables, no discriminatorios y respetuosos con el medio ambiente.

 

ia-generativa