GPT-4 es el transformador generativo preentrenado (GPT) de cuarta generación. GPT es un modelo de aprendizaje automático, esencialmente una red neuronal. El programa se adiestra utilizando datos para generar cualquier tipo de lenguaje.


El modelo de aprendizaje de lenguaje GPT-3.5 continúa causando un gran revuelo en todo el mundo. Tras su lanzamiento, se descubrió que su uso había alcanzado una cantidad ingente de usuarios, lo que ha inspirado entusiasmo y miedo a partes iguales. Por ejemplo, puede aprobar exámenes intensivos de temáticas legales y jurídicas, generar artículos extensos y detallados e incluso se ha utilizado para programar páginas web. ChatGPT, la interfaz de la red basada en un modelo de chat, ha podido hacer todo esto y más gracias a las instrucciones proporcionadas por todos sus usuarios alrededor del mundo.


Open AI, la empresa que ha creado GPT con todas sus generaciones y herramientas, se ha convertido en la más conocida e importante dentro del mundo de la tecnología. Sus productos han despertado grandes temores en relación al aumento del desempleo y el futuro de la educación, entre otras cosas. El uso de ChatGPT ha sido prohibido en muchas escuelas debido a su capacidad para generar escritos de alta calidad y por esencialmente, ser capaz de resolver todas las tareas escolares de los estudiantes. Por otro lado, también ha sido adoptado por empresas de todos los tamaños, desde nuevas empresas hasta grandes tecnológicas como Microsoft.


Las actualizaciones de ChatGPT han aumentado rápidamente desde su lanzamiento, y es probable que GPT-4 se convierta en el próximo gran avance.


ChatGPT Pro, el servicio de pago de ChatGPT, ofrece ahora la posibilidad de utilizar GPT-4 además de proporcionar tiempos de carga y acceso prioritarios. 


Todo el entusiasmo que se ha generado alrededor de esto, plantea varias preguntas que seguro te estás cuestionando, como por ejemplo: 


  • ¿Qué es exactamente GPT?
  • ¿Cómo han sido tan revolucionarios GPT-3.5 y ChatGPT?
  • ¿Qué es GPT-4 y qué implica su lanzamiento para el mundo?


En estos artículos, repasaremos brevemente la historia temprana del GPT de Open AI, profundizaremos en GPT-4 y en sus diferencias con versiones anteriores, incluyendo todas las novedades interesantes que se pueden esperar de este producto.


¿Qué es exactamente GPT?

IA - Image

Inicios del GPT

En primer lugar, veamos un resumen rápido del proyecto GPT.


Los primeros modelos de procesamiento del lenguaje natural (NLP) creados por Open AI podían realizar tareas como responder preguntas o resumir información sin requerir supervisión. La comprensión del lenguaje natural, incluyendo las tareas mencionadas anteriormente, fue posible desde el principio. Sin embargo, la mayoría de los demás modelos de PNL previos a GPT-1 se entrenaron específicamente para realizar tareas concretas. Por ejemplo, para la clasificación de sentimientos por un lado, para la vinculación textual por otro, etc. GPT-1 ha conseguido generalizar y completar tareas distintas a las únicas para las que fue diseñado.


GPT-1

GPT-1 resultó innovador en el campo del PNL debido a que superó las restricciones clave de los modelos anteriores. En primer lugar, ha sido capaz de extender el rango de tareas para los que se entrenó. También ha conseguido superar la dificultad que implica la recogida de una gran cantidad de datos con el propósito de realizar una tarea.


En 2018, GPT-1 alcanzó un hito en el PNL al demostrar cómo el entrenamiento previo y una red neuronal masiva basada en datos textuales podrían mejorar enormemente las tareas de generación de lenguaje. Sin embargo, su capacidad para completar estas tareas era muy limitada (en comparación con las versiones recientes que utilizamos ahora).


El artículo GPT-1 describe el aprendizaje semi supervisado para todas las tareas del PNL. Se ocupó del modelo de lenguaje no supervisado como herramienta de formación previa y luego, el entrenamiento supervisado ajustó los resultados. El conjunto de datos con el que se entrenó GPT-1 fue BooksCorpus, que proporcionó alrededor de 7000 libros para su aprendizaje.


GPT-1 no se hizo público, sino que fue un proyecto de prueba de concepto. Sin embargo, tuvo éxito y consiguió procesar y comprender el lenguaje de forma natural.


GPT-2

Apenas un año después del lanzamiento de GPT-1, se publicó el documento GPT-2. Este segundo artículo se tituló " Los modelos lingüísticos aprenden multitareas sin supervisión ". Esta vez, el producto se lanzó para su uso en el área del aprendizaje automático. Los profesionales lo aplicaron a las diversas tareas de generación de texto que hemos repasado.


Recordemos que el procesamiento de lenguaje natural es un fenómeno muy reciente y cada iteración ha supuesto una gran mejora con respecto a la anterior. En 2019, GPT-2 era capaz de generar algunas frases y luego colapsar. En ese momento, esto supuso un resultado exitoso y revolucionario.


GPT-2 se distinguió de GPT-1 en dos áreas clave: el acondicionamiento de tareas y el aprendizaje de disparo cero y transferencia de tareas de disparo cero.


En pocas palabras, el condicionamiento de tareas ocurre cuando el modelo está diseñado para producir diferentes resultados a partir de exactamente las mismas entradas y para varias tareas diferentes. Los resultados en estos casos son secuencias únicas de lenguaje natural.


El aprendizaje de disparo cero es un aspecto de la transferencia de tareas de disparo cero. El modelo no recibe ejemplos, sino que comprende la tarea basándose únicamente en las instrucciones proporcionadas. En este punto, GPT-1 reorganizaría las secuencias y las ajustaría. En cambio, se esperaba que GPT-2 comprendiera la naturaleza de la tarea únicamente a través del lenguaje y proporcionara respuestas.


El conjunto de datos para GPT-2 también se amplió enormemente. El conjunto de datos de WebText utilizado incluyó alrededor de 40 GB de datos textuales de más de 8 millones de fuentes. Comparado con Book Corpus, esta fue una expansión masiva.


GPT-3

El artículo para GPT-3 se tituló "Los modelos de lenguaje requieren de poco aprendizaje". La idea era que los modelos de lenguaje no necesitaran ajustes y muy poca instrucción para comprender las tareas de PNL y realizarlas. Open AI construyó el modelo con 175 mil millones de parámetros, una enorme expansión (más de 100 veces) con respecto a los modelos anteriores. El conjunto de datos se amplió aún más contando con cinco corpus diferentes.


Estas mejoras permitieron a GPT-3 escribir artículos completos que no se distinguían fácilmente de los artículos escritos por humanos. Pero también podía realizar tareas aleatorias para las que no estaba específicamente entrenado. Por ejemplo, tenía la capacidad de resolver problemas matemáticos y de programación o realizar tareas lingüísticas. Para los primeros, resultó particularmente prometedor. GPT-3 podría proporcionar descripciones en lenguaje natural de tareas de programación.


GPT-3.5 y ChatGPT

ChatGPT se basa en GPT-3.5, una actualización de GPT-3. El modelo 3.5 se basó en un conjunto de datos ampliado, incrementando aún más su potencial. Esto se aplicó al ChatGPT de código abierto y basado en conversaciones. Esta vez, personas de todo el mundo pudieron experimentar la capacidad de la IA para generar textos de manera similar a un humano.


ChatGPT, el producto de Open AI que todo el mundo está utilizando, ha sido prohibido en las escuelas debido a sus capacidades. Sin embargo, muchos profesionales y empresas han podido integrarlo en sus procedimientos operativos estándar. Ahora es la aplicación web de más rápido crecimiento. Después de sólo dos meses, llegó a más de 100 millones de usuarios. Con algo de dirección y verificación de datos, puede crear textos y análisis que cumplan con los más altos estándares profesionales. Especialistas en marketing, programadores y varios analistas han sido algunos de sus mayores admiradores.


Además de los fines profesionales, se observan grandes aplicaciones académicas y recreativas. El modelo (GPT-3.5) es capaz de ayudar a los profesionales a perfeccionar su oficio y maximizar su eficiencia potencial, pero también puede servir para algo tan sencillo como una conversación interesante. Puede escribir chistes originales, componer una canción, analizar temas complejos y más. Puede además, desempeñar el papel de profesor o tutor. Con algunas instrucciones sencillas, ChatGPT puede explicar cómo resolver problemas matemáticos complejos con instrucciones escritas exhaustivas pero fáciles de entender. Algunas personas incluso han informado que utilizan ChatGPT para obtener consejos sobre relaciones y otras necesidades psicológicas.


¿Cuál es el siguiente paso?

Por muy innovador que esto resulte, todavía no hemos visto nada. Está previsto que GPT-4 finalice su entrenamiento el 22 de agosto de 2023. Se espera que GPT-4 suponga una gran mejora con respecto a 3.5 en todos los frentes:


  • Capacidades de procesamiento
  • Conjuntos de datos
  • Comprender las intenciones de los usuarios
  • Precisión fáctica
  • Razonamiento
  • Ajustar el comportamiento (según las solicitudes de los usuarios)


Podemos considerar GPT-4 como una reforma que mejora todos los aspectos que ChatGPT ofrece actualmente.


¿Cuál es la diferencia entre Chat GPT-3 y GPT-4?

GPT-3 era esencialmente un modelo de entrada y salida de texto. GPT-4 es multimodal: utiliza imágenes, reconoce su autoría y puede utilizar la subida de imágenes para instrucciones complejas.


También encontramos una diferencia más sencilla en relación a la disponibilidad de datos. Cuando se comparan ambos, GPT-4 es enorme mientras que GPT-3 pequeño. Los conjuntos de datos no son comparables (puedes consultar la imagen a continuación para obtener una comparación visual).

Imagen de comparación de GPT
GPT-3 vs GTP-4 comparison image - Everything you need to know about GTP 4 - Image

Precisión

La investigación de Open AI revela grandes mejoras en la precisión objetiva de GPT-4. Hasta ahora, ChatGPT ha demostrado ser muy útil en este sentido, pero todavía comete errores y carece de datos en muchas áreas específicas. El campo en el que los modelos han mejorado constantemente es en la reducción de errores de razonamiento y fácticos. Las pruebas abiertas de IA revelaron que GPT-4 obtiene puntuaciones un 40% más altas que GPT-3.5 en errores de razonamiento.


Dirección

La "capacidad de dirección" es una de las características clave de ChatGPT. Los usuarios que saben hacer preguntas pueden alterar el comportamiento de la IA. Esto es importante para que sea útil en diferentes contextos, como:

  • Producir contenido con un cierto “tono”
  • Escribir un ensayo con un sesgo específico


Puedes indicarle a ChatGPT que escriba enfadado, feliz, conciso, cauteloso, obsesivo, etc. Comprender tales indicaciones y cómo reacciona la IA determinará en gran medida cómo de útil puede ser esta herramienta para cada usuario.


Las mejoras de GPT-4 se centran en gran medida en este aspecto de los modelos GPT. Al mismo tiempo, el nuevo modelo incorporará medidas de protección más sólidas contra solicitudes ilegales o inmorales. El resultado final es una mayor capacidad para adaptarse a las indicaciones del usuario.

Cosas descabelladas que el nuevo Chat GPT-4 puede hacer

Ai - Image

Detección visual mejorada

GPT-4 puede recibir entradas visuales y producir salidas visuales. Pero también puede utilizar estas capacidades para muchas tareas importantes que cambiarán profesiones e industrias enteras.


Un ejemplo es la introducción de un boceto, un esbozo hecho a mano de cómo será un página web y cómo funcionará. GPT-4 puede tomar esta información y generar el código para crear dicho sitio web basándose en el boceto.


GPT-4 también puede recibir información de una forma y presentarla de otra según las instrucciones del usuario. Puede tomar documentos extensos y presentar esa información como una atractiva presentación de Power Point. Esta función, que ahorra tiempo, puede recolectar grandes bloques de texto y convertirlos en presentaciones concisas y atractivas. Se acabaron las horas de formateo y se han introducido entradas y salidas sencillas.


Programación

​Aprender a programar requiere una inversión de tiempo significativa y no todos pueden justificar pasar por ese proceso. Las aplicaciones de estas capacidades son impresionantes. Las personas sin experiencia en programación pueden crear páginas web e incluso aplicaciones.


Con GPT-4, los usuarios ya han creado extensiones de Google Chrome sin ninguna experiencia previa. Un ejemplo curioso es esta extensión que "traduce" páginas web al "lenguaje pirata". Basta con decirle que haga algo, aunque sea de forma tonta, y encuentra la manera. GPT-4 proporciona todo lo necesario para el proceso de creación, incluida la escritura, codificación y corrección de errores. Todo lo que necesitas hacer es dar las instrucciones. GPT-4 también comprende mejor las instrucciones, lo que hace que estos potenciales sean aún más sorprendentes.


Los especialistas en marketing y otras áreas dependen de extensiones para sus rutinas y responsabilidades diarias. Existen muchas aplicaciones profesionales para GPT-4, además de los usos recreativos. Para muchos profesionales, subcontratar GPT-4 para realizar ciertas tareas puede optimizar los flujos de trabajo o incluso llevar a cabo tareas que normalmente no harían o no podrían hacer.


Para los emprendedores creativos se están abriendo nuevos horizontes. Se puede utilizar GPT-4 para crear nuevas extensiones y otras herramientas que respalden un negocio o carrera. Se puede usar para crear nuevas funciones en páginas web, mejorar la productividad y mucho más.


Usos recreativos

¿Por qué tan serio?


Los usos de GPT-4 van más allá del dinero y la productividad. También puedes usarlo para entretenerte, ya sea para reírte o para un entretenimiento más completo.


Una vez has terminado tu trabajo y estás aburrido, ¿por qué no crear un nuevo juego? ¿No tienes ni idea de programación? No hay problema.


Puedes recrear Pong en menos de un minuto. O puedes tomarte un poco más de tiempo y crear (o recrear) algo completamente distinto.

Usos académicos

Este es uno de los aspectos más controvertidos de la creación de Open AI desde que ChatGPT se abrió al público. La dirección de los colegios han prohibido su uso. Los profesores lo han utilizado para escribir artículos automáticamente y los estudiantes para hacer todos sus deberes. Pero en su mayor parte, GPT-4 también puede ser benigno en estos aspectos.


Por supuesto, no puedes hacer exámenes con ChatGPT, ¡pero puede ser un gran compañero de estudio!


Con respecto a los modelos anteriores, una mejora de GPT-4 es que puede aprobar casi todos los exámenes de la barra. Puede aprobar la mayoría de los exámenes, incluidos exámenes médicos, SAT y AP (Programa de Colocación Avanzada). Si necesitas ayuda para estudiar, GPT-4 puede ser un gran tutor.

¿Cómo empezar con GPT 4?

Por ahora, la única forma de acceder a GPT-4 es a través de una membresía de pago con ChatGPT Plus.


ChatGPT Plus es la versión premium de ChatGPT. Comprar una suscripción otorga acceso a GPT-4 en lugar de solo al GPT-3.5 estándar. La membresía también incluye un acceso prioritario y procesamiento más rápido. Se obtienen los beneficios de GPT-4 que hemos repasado, incluida la capacidad de entrada de imágenes, además de una experiencia mejorada con ChatGPT.


A partir de marzo de 2023, existe una lista de espera para obtener GPT-4 como desarrollador de API. Esto te brinda acceso a GPT-4 y a todo lo que necesitas para crear aplicaciones y soluciones de servicios.


Si estás interesado, es buen momento para comenzar con una de las mayores revoluciones tecnológicas de esta generación.


De cara al futuro, GPT-5 se encuentra en un horizonte lejano y representa un posible sucesor. Aprender a interactuar con los primeros modelos de PNL puede brindar ventajas y permitir el aprovechamiento máximo de las actualizaciones futuras. La tecnología ya está cambiando nuestro mundo, por lo que ahora es un buen momento para empezar.

Myles Leva