Qué es ChatGPT y para qué sirve
ChatGPT ha abierto un mundo de infinitas posibilidades en sectores e industrias muy dispares. Esto incluye diferentes áreas del sector cuaternario, como la educación, la investigación, los medios de comunicación, la industria informática y las TIC; frente a otras, totalmente independientes a esta, como las finanzas, el transporte o el retail. Una prueba fehaciente de ello, la encontramos en la gran cantidad de publicaciones y estudios científicos que se agolpan en la red sobre el uso potencial de ChatGPT. Estos abarcan temas tan dispares como su impacto a la hora de mejorar los servicios de búsqueda de referencias y catalogación de metadatos en servicios de biblioteconomía y documentación, así como aquellos que tratan de poner a prueba si, al igual que ocurre con otros generadores de contenido basados en IA o bots, muestra sesgos ante cuestiones, de índole política. Todo ello ha generado una gran expectación por parte de empresas y sociedades en torno a ChatGPT de OpenAI.
Por lo tanto, y con la finalidad de arrojar un poco más de luz sobre el asunto, a continuación, analizaremos con detalle qué es ChatGPT y los diferentes modelos GPT que existen, conoceremos de dónde extrae la información y algunas de sus aplicaciones prácticas en diferentes sectores para sacar el máximo partido a una herramienta con un potencial todavía por explotar.
Qué es ChatGPT según ChatGPT
Al igual que los periodistas observan, investigan, analizan y se reúnen con los protagonistas o implicados de un hecho noticioso para recopilar y contrastar la información, en la presente publicación hemos recurrido al género de la entrevista con la finalidad de preguntarle a nuestro protagonista, ChatGPT, qué es y para qué sirve.
Para ello, nos hemos registrado en la página web habilitada por la compañía OpenIA, fundada por algunos de los principales inversores de Silicon Valley entre cuyos nombres iniciales se encuentran Elon Musk, Peter Thiel, Greg Brockman, Sam Altman, Ilya Sutskever, Reid Hoffman y Jessica Livingston.
El proceso es muy sencillo y consta de muy pocos pasos. El usuario interesado debe proporcionar una dirección de correo electrónico de verificación y una contraseña. Tras confirmar que es el propietario de la cuenta, posteriormente, se solicita un número de teléfono para la recepción de un código de seguridad que se debe introducir al final del proceso de registro. Una vez cumplidos todos estos pasos, ya se puede acceder a ChatGPT y escribir en el apartado “send a message”, una por una, todas aquellas preguntas y consultas que se quieren plantear.
Concretamente, esta es la respuesta que hemos recibido al formular la pregunta que da título a este apartado: ¿qué es ChatGPT?
“ChatGPT es un modelo de lenguaje natural desarrollado por OpenAI que utiliza la arquitectura GPT (Generative Pre-trained Transformer) para generar respuestas a preguntas y mantener conversaciones con los usuarios de una manera natural y fluida. El modelo ha sido entrenado en grandes cantidades de datos para aprender el uso del lenguaje y poder generar respuestas coherentes y relevantes. ChatGPT es capaz de responder preguntas sobre una amplia variedad de temas y puede proporcionar información útil y entretenida”.
Asimismo, le hemos preguntado a ChatGPT acerca de cuáles son sus orígenes, obteniendo la siguiente respuesta:
“ChatGPT es un modelo de lenguaje de inteligencia artificial desarrollado por OpenAI, una empresa de investigación en inteligencia artificial con sede en San Francisco, California. Fue entrenado en una gran cantidad de datos lingüísticos utilizando un enfoque llamado «aprendizaje profundo», que involucra la utilización de redes neuronales para procesar y aprender patrones en el lenguaje humano.
El modelo GPT (Generative Pre-trained Transformer) fue desarrollado por primera vez por el equipo de investigación de OpenAI en 2018, y se basa en la arquitectura de «transformadores» utilizada en la investigación de redes neuronales para el procesamiento del lenguaje natural. Desde entonces, ha habido varias iteraciones y mejoras del modelo, incluyendo GPT-2 y GPT-3.
ChatGPT es una aplicación específica de este modelo de lenguaje, diseñada para proporcionar respuestas inteligentes y relevantes a las preguntas y comentarios de los usuarios en tiempo real. Utiliza una versión del modelo GPT adaptada específicamente para el chat y el diálogo, lo que le permite interactuar con los usuarios de manera natural y efectiva”.
No obstante, y a pesar de las respuestas proporcionadas, hemos decidido investigar por nuestra propia cuenta más acerca de ChatGPT. Para ello, hemos recurrido a diferentes recursos bibliográficos como artículos de investigación y libros especializados con la finalidad de contrastar la información facilitada. Todo ello, a pesar de la absoluta veracidad de todas las respuestas proporcionadas por este atípico entrevistado, un programa de IA, el cual extrae toda la información de grandes conjuntos de datos, en formato texto, disponibles en la web pública (páginas web, artículos de noticias, libros y otras fuentes en línea).
Un poco de historia sobre ChatGPT
El chatbot de OpenAI es el resultado de la investigación y los avances en el campo del Procesamiento del Lenguaje Natural, abreviado PLN —en inglés, Natural Language Processing, NLP — y la disciplina de la IA conocida bajo el nombre de Machine Learning.
Algunas publicaciones señalan como punto de inicio, la investigación en el campo del procesamiento del lenguaje natural, específicamente, en el área de los modelos de lenguaje basados en la arquitectura Transformer. Concretamente, en 2017, Google hizo público el artículo científico Attention Is All You Need, donde se presentaba este tipo de arquitectura como una alternativa más eficiente a los modelos basados en redes neuronales recurrentes para el procesamiento del lenguaje natural. A partir de aquí, OpenAI comenzó a trabajar en la serie de modelos de lenguaje GPT.
Por otra parte, otros toman como punto de partida el trabajo de investigación Improving Language Understanding by Generative Pre-Training publicado en 2018 por el equipo de investigadores de OpenAI. El objetivo del estudio era abordar el problema del aprendizaje de la representación de texto, es decir, cómo hacer que una máquina comprenda y genere lenguaje natural. Para abordar esta cuestión, los investigadores propusieron un modelo de lenguaje generativo pre-entrenado llamado GPT —en inglés, Generative Pre-trained Transformer—. Este modelo utiliza la arquitectura de redes neuronales llamada Transformer, para predecir la siguiente palabra en un texto dado el contexto anterior. El modelo fue entrenado en un gran corpus de texto no supervisado, lo que significa que no se le proporcionó ninguna información específica sobre el significado o el contexto de las palabras en el texto. De tal forma que aprendió a generar texto coherente, a partir de patrones estadísticos y de secuencias de palabras. Los investigadores analizaron el rendimiento de GPT y lo calificaron de extraordinario en una variedad de tareas de lenguaje natural, como la comprensión lectora, la generación de texto y la traducción automática. Además, observaron que el modelo pre-entrenado se podía ajustar fácilmente a tareas específicas de lenguaje natural, como la clasificación de texto o la respuesta a preguntas.
A medida que han ido transcurriendo los años, el equipo de investigadores de OpenAI ha ido introduciendo mejoras en el modelo GPT, lo que ha conducido al desarrollo de versiones más sofisticadas. El modelo GPT inicial tenía 117 millones de parámetros y se preestreno a partir de un gran conjunto de datos, en formato texto, de Internet.
De igual modo, cabe destacar que cada nuevo modelo de GPT se construye sobre el anterior, mejorando la capacidad del mismo para procesar el lenguaje natural y producir una salida coherente y útil. Una cuestión que analizaremos en el siguiente apartado.
Evolución de los modelos GPT
A continuación, recopilamos cuál ha sido la evolución de los modelos GPT desarrollados por OpenAI, desde el primero hasta el último:
- GPT-1: Fue el primer modelo de la serie GPT lanzado en 2018. Se entrenó con un corpus (conjunto de textos escritos o hablados que se han recopilado y organizado para su análisis lingüístico y su uso en la investigación del lenguaje natural), de aproximadamente 40 GB de texto y tenía alrededor de 117 millones de parámetros. GPT-1 logró un gran éxito en las tareas de lenguaje natural, incluyendo la generación de texto, la traducción automática, la respuesta a preguntas y la sumarización de texto. Concretamente, la sumarización de texto es un aspecto muy importante que se refiere al proceso de resumir un texto completo en una versión más corta y concisa, mientras se conserva su significado principal y la información más importante. Esto puede hacerse de forma manual o mediante el uso de técnicas automatizadas, como algoritmos de aprendizaje automático, abreviado ML — en inglés, Machine Learning— y procesamiento del lenguaje natural. El objetivo de la sumarización de texto es ayudar a los lectores a obtener una comprensión rápida y efectiva del contenido del texto, especialmente, cuando se trata de documentos largos o complejos.
- GPT-2: Esta segunda versión fue lanzada en 2019 y contó con 1,5 mil millones de parámetros, aproximadamente 10 veces más grande que GPT-1. Además, GPT-2 logró resultados más destacables que su predecesor, al generar textos coherentes y convincentes los cuales, en comparación con los redactados por un ser humano, resultaban difíciles de diferenciar.
- GPT-3: Fue lanzado en 2020 y, hasta hace poco tiempo, era considerado el modelo de lenguaje más grande y avanzado de la serie GPT, con 175 mil millones de parámetros. GPT-3 ha supuesto un gran salto en el procesamiento del lenguaje natural, siendo capaz de realizar tareas muy complejas, incluyendo la traducción de idiomas, la generación de código, la respuesta a preguntas, la escritura creativa y la conversación con humanos.
- GPT-4: El 14 de marzo de 2022 OpenAI estrenó GPT-3.5, como una “primera ejecución de prueba” del sistema. Un año después, el 14 de marzo de 2023, y tras subsanar algunos errores y aplicar una serie de mejoras en los fundamentos teóricos, la compañía lanzó al mercado la nueva versión de uno de los modelos de lenguaje autorregresivos más avanzados que existen: GPT-4. Esta nueva variante produce respuestas más seguras y útiles respecto a sus versiones antecesoras, además de ser capaz de resolver problemas difíciles con mayor precisión, ya que posee un conocimiento general más amplio y capacidades de razonamiento avanzadas. Según señala una investigación realizada por OpenAI, “GPT-4 es un gran modelo multimodal (que acepta entradas de imágenes y texto, y emite salidas de texto) que, si bien es menos capaz que los humanos en muchos escenarios del mundo real, exhibe un rendimiento a nivel humano en varios puntos de referencia académicos y profesionales”. Una conclusión extraída por los investigadores tras someter a GPT-4 y GPT-3.5 a una serie de pruebas disponibles como los exámenes AP (Advanced Placement, en inglés) en diferentes materias como historia, biología, matemáticas o cálculo. Tras la realización de dichas pruebas se confirmó que “GPT-4 es más confiable, creativo y capaz de manejar instrucciones mucho más matizadas que GPT-3.5”.
De dónde extrae la información ChatGPT
ChatGPT extrae la información de grandes conjuntos de datos de texto no estructurado, incluyendo artículos de noticias, libros, sitios web, conversaciones en línea y otros tipos de texto. Estos conjuntos de datos son seleccionados y preparados, con la finalidad de ofrecer información relevante y de alta calidad. Durante el entrenamiento, el modelo de lenguaje de ChatGPT aprende a identificar patrones y relaciones en los datos, además de generar respuestas coherentes y relevantes en función del contexto de la conversación. No obstante, en ocasiones, el modelo puede proporcionar respuestas imprecisas o incompletas, al depender en gran medida de la calidad y la relevancia de los datos de entrenamiento.
Por otra parte, el modelo no tiene acceso a información personal del usuario y no almacena ni utiliza la información de las conversaciones con fines de carácter comercial o publicitario.
Aplicaciones o usos de ChatGPT
Tal y como explicábamos en el aparatado anterior, el modelo de lenguaje detrás de ChatGPT ha sido entrenado a partir de elevadas cantidades de texto no etiquetado, permitiéndole generar respuestas coherentes y relevantes ante diferentes preguntas y comentarios de los usuarios. Así, entre sus diversas aplicaciones por áreas funcionales y sectores destacan:
- Marketing —Servicio de atención al cliente—: ChatGPT puede ser utilizado para resolver las preguntas frecuentes de los clientes y problemas comunes, además de proporcionar información adicional sobre los productos y servicios comercializados por una compañía.
- Educación: El chatbot puede ser utilizado en aplicaciones de aprendizaje en línea o de idiomas con la finalidad de proporcionar retroalimentación inmediata a los estudiantes, dando respuesta a preguntas y aportando ejemplos.
- Investigación: Dentro de este ámbito, aporta beneficios a los investigadores a la hora de explorar temas específicos y obtener información útil a partir de grandes conjuntos de datos.
- RR. HH.: ChatGPT puede ser utilizado en la gestión de los recursos humanos para responder preguntas frecuentes de los empleados, proporcionar información sobre las políticas y procedimientos de la empresa, y capacitación en línea.
- Salud: En este caso, la aplicación de OpenAI posibilitaría que los pacientes pudieran formular preguntas sobre sus síntomas y obtener recomendaciones de tratamiento o derivación a especialistas.
ChatGPT en la actualidad
El éxito de ChatGPT es rotundo o por lo menos las cifras así lo demuestran. El chatbot ha conseguido la cifra de “10 millones de usuarios en tan solo 40 días”, según ha dado a conocer Brett Winton, CEO de ARK Investment Management LLC (más conocida como ARKN Invest), a través de una publicación realizada en Twitter (refundada como X).
chatGPT at >10 million daily users in 40 days
Instagram took 355 days to get to 10 million registered users pic.twitter.com/Q7MWKNvyoN
— Brett Winton (@wintonARK) January 24, 2023
Toda una declaración de intenciones por parte del máximo representante de esta gestora de activos global especializada en la inversión temática en innovación disruptiva, que se suma a un artículo difundido a través del sitio web de ARKN Invest, titulado OpenAI Plugins Transform ChatGPT Into An App Platform. Dicha publicación analiza la extensión de producto para ChatGPT, que permite al programa de IA interactuar con datos y servicios externos a través de complementos desarrollados por diferentes empresas como Expedia, FiscalNote, KAYAK, Klarna, Milo, Shopify, Speak y Slack, entre otras. Estos complementos amplían sus capacidades convirtiéndolo en una especie de plataforma de aplicaciones que permite buscar información en tiempo real en una web, reservar habitaciones de hotel y vuelos, alquilar vehículos, entre otras muchas posibilidades.
No obstante, todavía queda mucho camino por recorrer para que ChatGPT, al igual que otros modelos de lenguaje natural, experimente mejoras en su capacidad para entender y producir lenguaje natural, además de lograr una mayor fluidez y eficiencia en la interacción humano-máquina. Por lo que habrá que esperar para conocer nuevos avances.
Por otra parte, Microsoft anunció en marzo de 2023 que ChatGPT será incorporado en los productos más populares de su suite Microsoft 365. Bajo la denominación Copilot, esta tecnología se integrará en sus herramientas de productividad en el lugar de trabajo, tan conocidas y utilizadas por miles de usuarios en todo el mundo como Word, Excel, PowerPoint, Outlook y Teams. Entre las ventajas de Copilot destacan que combina el poder de los grandes modelos de lenguaje — en inglés, Large Language Models, LLM— con datos de negocio y las aplicaciones de Microsoft 365; y, también, el entorno de seguridad y privacidad de los datos que ofrece, en base a los principios de IA y el estándar de IA responsable, de Microsoft. Esto significa que los grandes modelos de lenguaje de Copilot no están entrenados con el contenido específico o las indicaciones individuales facilitadas por el usuario o, dicho de otro modo, que los datos proporcionados no son utilizados para reentrenar el modelo, ni tampoco son sensibles a posibles filtraciones.
Finalmente, a nivel de automatización de procesos, el uso de ChatGPT despliega un gran número de posibilidades. En el caso de los correos electrónicos gestionados a diario por las empresas, se pueden crear composiciones que permiten conocer, a modo de ejemplo, el remitente, clasificar por tipología el e-mail (reclamaciones, agradecimientos, reservas, altas, etc.), y mostrar en una lista un resumen de los puntos principales contenidos en el mismo. Todo ello, sin necesidad de utilizar lenguaje de programación, simplemente dando una serie de directrices en lenguaje natural de aquellos aspectos que suscitan interés, en los correos electrónicos recibidos. Esta tecnología podría aplicarse en, por ejemplo, la automatización del proceso de reservas hoteleras. El proceso se inicia en el momento en que se recibe un correo electrónico. Este es identificado por ChatGPT, que arroja una serie de datos en función de las instrucciones dadas, como la tipología del e-mail para, posteriormente, enviar al cliente de forma automática a la pasarela de pago para formalizar la reserva. De tal forma que los correos electrónicos se pueden clasificar e, incluso, se puede condicionar el workflow en función de su tipología (queja, agradecimiento, alta, etc.).