O GPT-4 é a quarta geração do transformador pré-treinado generativo (GPT). GPT é um modelo de aprendizado de máquina, essencialmente uma rede neural. O programa é treinado usando dados para gerar qualquer tipo de linguagem.


O modelo de linguagem GPT-3.5 tem continuado a causar grande impacto globalmente. Após o lançamento, um número surpreendente de casos de uso foi descoberto, inspirando tanto entusiasmo quanto medo. Ele pode passar em exames jurídicos intensivos, escrever artigos longos e detalhados e até mesmo foi usado para codificar sites. ChatGPT, a interface baseada em bate-papo da rede, é capaz de fazer tudo isso e muito mais com a ajuda de instruções humanas fornecidas por qualquer usuário no mundo.


A Open AI, a empresa por trás do GPT e de todas as suas gerações e ferramentas, tornou-se o maior nome do setor de tecnologia. Seus produtos despertaram o medo do aumento do desemprego e do futuro da educação, entre outras coisas. O ChatGPT foi banido em muitas escolas por sua capacidade de criar redações de alta qualidade e, principalmente, resolver todos os problemas escolares. Também foi adotado por empresas de todos os tamanhos, desde novas startups até gigantes da tecnologia como a Microsoft.


As atualizações aumentaram rapidamente desde o lançamento do ChatGPT. O GPT-4 provavelmente será o próximo grande passo.


O ChatGPT Pro, o serviço pago do ChatGPT, agora oferece acesso ao GPT-4, além de acesso prioritário e tempos de carregamento.


Toda essa empolgação levanta várias questões sobre as quais sabemos que você está se perguntando:


· O que exatamente é GPT?

· Como o GPT-3.5 e o ChatGPT têm sido tão revolucionários?

· O que é GPT-4 e o que seu lançamento significa para o mundo?


Analisaremos brevemente o início da história do GPT da Open AI. Em seguida, nos aprofundaremos no GPT-4 e em como ele difere das versões anteriores, incluindo todas as novidades empolgantes que você pode esperar dele.


O que exatamente é GPT?

O transformador pré-treinado generativo (GPT) é um modelo de inteligência artificial (IA) de processamento de linguagem de ponta desenvolvido pela Open AI.


O GPT é capaz de gerar texto de uma forma mais “humana”. A escrita de IA já existe há algum tempo. Mas o GPT é capaz de pensar, processar e gerar um texto mais humano e baseado em um grande conjunto de idiomas. Isso o torna capaz de novas tarefas:


· Comunicação

· Tradução de idiomas

· Geração de texto semelhante ao humano para fins de conversação

· Tarefas do chatbot


Diferente dos geradores de texto AI, os modelos GPT provaram ser capazes de gerar linguagem “natural”. O texto que o ChatGPT produz é semelhante ao texto escrito por humanos em termos de estilo e conteúdo. Mas também é capaz de análise, incluindo a geração de código.


GPT inicial

Primeiro, vamos fazer um rápido resumo do projeto GPT.


Os primeiros modelos de processamento de linguagem natural (PLN) da Open AI podiam executar tarefas como responder a perguntas ou resumir informações sem treinamento supervisionado. A compreensão da linguagem natural, incluindo as tarefas acima, tornou-se possível desde o início. A maioria dos outros modelos de PNL anteriores ao GPT-1 foram treinados especificamente para uma determinada tarefa. Por exemplo, um serviria para classificação de sentimento, outro para implicação textual e assim por diante. O GPT-1 foi bem-sucedido na generalização de tarefas além de uma única para a qual foi projetado.


GPT-1

O GPT-1 foi inovador no campo da PNL por superar as principais restrições dos modelos anteriores. Primeiro, foi capaz de generalizar para tarefas além daquelas para as quais um PNL foi treinado. Também superou a necessidade de grandes quantidades de dados anotados que são difíceis de obter para executar uma tarefa.


Em 2018, o GPT-1 atingiu um marco na PNL ao demonstrar como o pré-treinamento e uma enorme rede neural baseada em dados de texto poderiam melhorar muito as tarefas de geração de linguagem. No entanto, sua capacidade de concluir essas tarefas era muito limitada (em relação às versões mais recentes utilizadas por todos).


O artigo GPT-1 descreveu o aprendizado semi-supervisionado para todas as tarefas de PNL. Trabalhou em modelagem de linguagem não supervisionada como uma ferramenta de pré-treinamento. Em seguida, o treinamento supervisionado aperfeiçoou os resultados. O conjunto de dados no qual o GPT-1 foi treinado foi o BooksCorpus, que forneceu cerca de 7.000 livros para treinamento.


GPT-1 foi um projeto de prova de conceito; não foi divulgado publicamente. No entanto, provou ser bem-sucedido e o GPT-1 pode processar e entender a linguagem naturalmente.


GPT-2

Apenas um ano após o lançamento do GPT-1, o artigo GPT-2 foi lançado. Este segundo relatório foi intitulado “Modelos de linguagem são aprendizes multitarefa não supervisionados ”. Desta vez, o produto foi lançado para uso no espaço de aprendizado de máquina. Os profissionais o aplicaram em todas as várias tarefas de geração de texto que analisamos.


Lembre-se, a PNL é um fenômeno muito recente e cada iteração é uma grande melhoria em relação à anterior. Em 2019, o GPT-2 era capaz de gerar algumas frases e, em seguida se desfazia. Naquele momento, foi um resultado bem-sucedido e revolucionário.


O GPT-2 se destacou do GPT-1 em duas áreas principais: condicionamento de tarefas e aprendizado de tiro zero e transferência de tarefas de tiro zero.


Simplificando, o condicionamento de tarefas é quando o modelo é feito para produzir diferentes resultados a partir das mesmas informações, para várias tarefas diferentes. Nesses casos, os resultados são sequências exclusivas de linguagem natural.


O aprendizado de tiro zero é um aspecto da transferência de tarefas de tiro zero. Nenhum exemplo é fornecido ao modelo, que entende a tarefa com base apenas nas instruções fornecidas. Nesse ponto, o GPT-1 reorganizaria as sequências e as ajustaria. Em vez disso, esperava-se que o GPT-2 entendesse a natureza da tarefa apenas por meio da linguagem e fornecesse respostas.


O conjunto de dados para GPT-2 também foi amplamente expandido. O conjunto de dados WebText usado incluia cerca de 40 GB de dados de texto de mais de 8 milhões de fontes. Comparado ao Book Corpus, esta foi uma expansão gigantesca.


GPT-3

O artigo para o GPT-3 foi intitulado “Modelos de linguagem são aprendizes de poucos disparos”. A ideia era que os modelos de linguagem não precisariam de ajuste fino e muito pouca instrução para entender as tarefas da PNL e executá-las. A Open AI construiu o modelo com 175 bilhões de parâmetros, uma grande (mais de 100x) expansão em relação aos modelos anteriores. O conjunto de dados foi expandido para cinco corpora diferentes.


Essas melhorias permitiram que o GPT-3 escrevesse artigos completos que não eram facilmente distinguíveis dos artigos escritos por humanos. Mas também podia realizar tarefas aleatórias para as quais não havia sido especificamente treinado. Por exemplo, era capaz de resolver problemas matemáticos e de codificação ou realizar tarefas linguísticas. Em relação os primeiros modelos, mostrou-se particularmente promissor. O GPT-3 podia fornecer descrições em linguagem natural de tarefas de codificação.

GPT-3.5 e ChatGPT

O ChatGPT é baseado no GPT-3.5, uma atualização do GPT-3. O modelo 3.5 foi baseado em um conjunto de dados ampliado, expandindo ainda mais seu potencial. Isso foi aplicado ao ChatGPT de código aberto baseado em conversa. Desta vez, pessoas de todo o mundo puderam experimentar a capacidade da IA de gerar páginas de texto semelhante ao humano.


O ChatGPT, o produto Open AI que todos usam, foi banido das escolas por causa de suas habilidades. Mas muitos profissionais e empresas tem sido capazes de integrá-lo em seus procedimentos operacionais padrão. Atualmente, é o aplicativo da web que mais cresce. Depois de apenas dois meses, alcançou mais de 100 milhões de usuários. Com alguma orientação e verificação de fatos, ele pode criar textos e análises que atendam aos mais altos padrões profissionais. Profissionais de marketing, programadores e vários analistas são alguns de seus maiores fãs.


Além de fins profissionais, aplicações acadêmicas e recreativas são amplamente vistas. O modelo (GPT-3.5) é capaz de ajudar os profissionais a aprimorar suas habilidades e maximizar sua eficiência potencial. Mas também pode ser usado para algo tão simples quanto uma conversa interessante. Ele pode escrever piadas originais, compor uma música, detalhar tópicos complexos e muito mais. Mas também pode desempenhar o papel de professor ou tutor. Com algumas orientações simples, o ChatGPT pode detalhar como resolver problemas matemáticos complexos com instruções escritas completas, mas de fácil compreensão. Algumas pessoas até relataram usar o ChatGPT para conselhos de relacionamento e outras necessidades psicológicas.


Qual é o próximo passo?

Por mais inovador que seja, ainda não vimos nada. O GPT-4 está programado para terminar o treinamento em 22 de agosto de 2023.

O GPT-4 está configurado para ser uma grande melhoria em relação ao 3.5 em todas as frentes:


· Capacidades de processamento

· Conjuntos de dados

· Compreensão das intenções do usuário

· Precisão factual

· Raciocínio

· Ajustando o comportamento (de acordo com as solicitações do usuário)


Você pode ver o GPT-4 como uma revisão que melhora todos os aspectos do que o ChatGPT oferece atualmente.


Qual é a diferença entre o Chat GPT-3 e o GPT-4?

O GPT-3 era essencialmente um modelo de entrada e saída de texto. GPT-4 é multimodal, usando imagens, dando créditos a imagem e recebendo entradas de imagem para instruções complexas.


Há também a questão mais direta dos dados disponíveis. GPT-4 é monumental e GPT-3 minúsculo, quando você compara os dois. Os conjuntos de dados não são comparáveis (bem, consulte a imagem abaixo para uma comparação visual).

imagem de comparação GPT

O GPT-4 também é capaz de trabalhar com mais entrada de texto do que o GPT-3. Isso significa que ele pode ler documentos muito mais longos e processá-los de acordo com suas instruções. Ele também pode publicar muito mais, escrevendo romances inteiros ou apenas contos, se você preferir.


Precisão

Uma pesquisa da Open AI revela grandes melhorias na precisão factual do GPT-4. Até o momento, o ChatGPT provou ser altamente útil a esse respeito. Mas ainda comete erros e carece de dados em muitas áreas de nicho. Mas a área em que os modelos melhoraram constantemente foi na redução de erros de raciocínio e de erros factuais. O teste de IA aberta revelaram que o GPT-4 tem uma pontuação 40% maior do que o GPT-3.5 em erros de raciocínio.


Direção

Capacidade de direção é um dos principais recursos do ChatGPT. Os usuários que saibam como fazer perguntas podem alterar o comportamento da IA. Isso é importante para que a ferramenta seja útil em diferentes contextos:


· Produzir conteúdo com um certo “tom”

· Escrever um ensaio com um viés específico


Você pode dizer diretamente ao ChatGPT para escrever como irritado, feliz, conciso, cauteloso, obsessivo ou qualquer outra coisa. A compreensão desses comandos e de como a IA reage determina em grande parte a utilidade que eles podem ter para você.


As melhorias do GPT-4 são amplamente focadas neste aspecto dos modelos GPT. Ao mesmo tempo, o novo modelo terá proteções internas mais fortes contra solicitações ilegais ou imorais. O resultado final é uma maior capacidade de ajuste aos comandos do usuário.

Coisas insanas que o novo Chat GPT-4 pode fazer

Também há novas adições interessantes não vistas nos modelos GPT anteriores. Essas novas tarefas abrem novos cenários de utilização que podem ser apreciados por usuários de todas as origens.

Detecção visual aprimorada

O GPT-4 pode receber informações visuais e produzir resultados visuais. Mas também pode usar essas habilidades para muitas tarefas importantes que devem mudar profissões e setores inteiros.


Um exemplo é a inclusão de um "wire frame", um esboço feito à mão de como seria um site e como ele funcionaria. O GPT-4 pode pegar essas informações e gerar o código para criar esse site com base no esboço.


O GPT-4 também pode receber informações em um formato e apresentá-lo em outro com base nas instruções do usuário. Ele pode receber documentos de texto enormes e produzir essas informações como uma apresentação PPT interessante. Essa tarefa que economiza tempo pode pegar blocos gigantes de texto e transformá-los em apresentações bonitas e concisas. Horas de formatação acabaram, entradas e saídas simples chegaram.


Programação

Aprender a programar requer um investimento de tempo significativo e nem todos podem justificar esse processo. Os casos de uso dessas habilidades são impressionantes. Pessoas sem experiência em codificação podem criar sites e até fazer aplicativos.


Com o GPT-4, as pessoas já criaram extensões do Google Chrome sem nenhuma experiência anterior. Um exemplo engraçado é essa extensão que “traduz” páginas da web em “fala de pirata”. Basta pedir para fazer alguma coisa, mesmo que de maneira boba, e ele encontra um jeito. O GPT-4 fornece tudo o que você precisa para o processo de criação, incluindo escrita, programação e correção de erros. Tudo que você precisa fazer é dar as instruções. O GPT-4 também é melhor na compreensão de instruções, tornando esses potenciais ainda mais surpreendentes.


Profissionais de marketing e outros dependem de extensões para suas rotinas e responsabilidades diárias. Existem muitas aplicações profissionais para o GPT-4, além dos usos recreativos. Para muitos profissionais, a terceirização de tarefas para o GPT-4 pode simplificar os fluxos de trabalho ou até mesmo lidar com tarefas que normalmente não fariam ou não poderiam fazer.


Para empreendedores criativos, novos potenciais estão se abrindo. Você pode usar o GPT-4 para criar novas extensões e outras ferramentas que apoiem seus negócios ou carreira. Você pode usá-lo para criar novas funções em seu site, melhorar sua produtividade e muito mais.


Lazer

Por que tão sério?


Os usos do GPT-4 vão além do dinheiro e da produtividade. Você também pode usá-lo para entretenimento, seja para risadas rápidas ou entretenimento mais abrangente.


Após terminar seu trabalho e se sentir entediado, por que não criar um novo jogo para você? Não tem habilidade de programação? Não tem problema.


Você pode recriar Pong em menos de um minuto. Ou você pode levar mais algum tempo e criar (ou recriar) algo totalmente diferente.


Acadêmicos

Este é um dos aspectos mais controversos da criação do Open AI desde que o ChatGPT foi disponibilizado ao público. Os conselhos escolares o proibiram. Os professores o usaram para escrever artigos de forma automática. Os alunos têm usado para fazer todos os seus trabalhos de casa. Mas, na maioria das vezes, o GPT-4 também pode ser benigno nesses aspectos.


Claro, você não pode escrever seus exames com ChatGPT. Mas pode ser um ótimo companheiro de estudo!


Em outra melhoria em relação aos modelos anteriores, o GPT-4 pode passar em quase todos os exames BAR. Ele pode passar na maioria dos exames, incluindo exames médicos, SATs e AP. Se precisar de ajuda para estudar, o GPT-4 pode ser um ótimo tutor.


Como começar a usar o GPT 4?

Por enquanto, a única maneira de acessar o GPT-4 é por meio de uma assinatura paga do ChatGPT Plus.


ChatGPT Plus é a versão premium do ChatGPT. A compra de uma assinatura concede acesso ao GPT-4 em vez de apenas ao GPT-3.5 padrão. A assinatura também inclui acesso prioritário e processamento mais rápido. Você obtém os benefícios do GPT-4 que examinamos, incluindo a capacidade de entrada de imagens, além de uma experiência aprimorada com o ChatGPT.


Desde março de 2023, há uma lista de espera para obter o GPT-4 como desenvolvedor de API. Com isso você tem acesso ao GPT-4 e tudo o que você precisa para criar aplicativos e soluções de serviço.


Se você estiver interessado, é um ótimo momento para começar com uma das maiores revoluções tecnológicas da geração.


No futuro, o GPT-5 encontra-se em um horizonte distante e representa um possível sucessor. Aprender a interagir com os primeiros modelos de PNL pode lhe dar uma vantagem e permitir que você aproveite ao máximo as atualizações futuras. A tecnologia já está mudando nosso mundo, então agora é um bom momento para começar.

Myles Leva