GPT-4 ist die vierte Generation des Generative Pre-trained Transformer (GPT). GPT ist ein maschinelles Lernmodell, im Wesentlichen ein neuronales Netzwerk. Das Programm wird mit Daten trainiert, um jede Art von Sprache zu generieren.
Das Sprachmodell GPT-3.5 hat weltweit weiterhin große Wellen geschlagen. Bei seiner Veröffentlichung wurden eine erstaunliche Anzahl von Anwendungsfällen entdeckt, die sowohl Begeisterung als auch Angst hervorriefen. Es kann intensive juristische Prüfungen bestehen, detaillierte Langformartikel schreiben und wurde sogar zum Programmieren von Websites verwendet. ChatGPT, die chatbasierte Schnittstelle des Netzwerks, konnte all dies und mehr mit Hilfe von menschlichen Anweisungen, die von jedem Benutzer weltweit bereitgestellt werden, leisten.
OpenAI, das Unternehmen hinter GPT in all seinen Generationen und Tools, ist zum größten Namen in der Technologiebranche aufgestiegen. Ihre Produkte haben Ängste vor steigender Arbeitslosigkeit und der Zukunft der Bildung geweckt, unter anderem. ChatGPT wurde in vielen Schulen verboten, da es in der Lage ist, erstklassige Aufsätze zu erstellen und im Wesentlichen alle Schulaufgaben zu lösen. Es wurde auch von Unternehmen jeder Größe übernommen, von neuen Startups bis hin zu Technologiegiganten wie Microsoft.
Die Updates haben seit der Veröffentlichung von ChatGPT schnell zugenommen. GPT-4 wird wahrscheinlich der nächste große Schritt sein.
ChatGPT Pro, der kostenpflichtige Dienst für ChatGPT, bietet jetzt Zugang zu GPT-4 zusätzlich zu priorisiertem Zugang und Ladezeiten.
All diese Aufregung wirft mehrere Fragen auf, von denen wir wissen, dass Sie sich darüber wundern:
- Was genau ist GPT?
- Wie waren GPT-3.5 und ChatGPT so revolutionär?
- Was ist GPT-4 und was bedeutet seine Veröffentlichung für die Welt?
Wir werden kurz auf die frühe Geschichte von OpenAIs GPT eingehen. Dann werden wir uns mit GPT-4 befassen und wie es sich von früheren Versionen unterscheidet, einschließlich all der aufregenden neuen Dinge, die Sie davon erwarten können.
Was genau ist GPT?
Generative Pre-trained Transformer (GPT) ist ein hochmodernes Sprachverarbeitungsmodell der Künstlichen Intelligenz (KI), das von OpenAI entwickelt wurde.
GPT ist in der Lage, Texte auf eine „menschlichere“ Weise zu generieren. KI-Schreiben gibt es schon seit einiger Zeit, aber GPT kann denken und verarbeiten und hinterlässt Ihnen Texte, die menschlicher sind und auf einer riesigen Sprachbasis beruhen. Dies macht es fähig zu neuen Aufgaben:
- Kommunikation
- Sprachübersetzung
- Generierung von menschenähnlichen Texten aus konversationellen Gründen
- Chatbot-Aufgaben
Im Gegensatz zu anderen KI-Textgeneratoren haben sich GPT-Modelle als fähig erwiesen, Sprache zu generieren, die „natürlich“ ist. Der von ChatGPT erzeugte Text ähnelt in Stil und Inhalt menschlich geschriebenem Text. Aber es ist auch in der Lage zur Analyse, einschließlich der Generierung von Code.
Frühes GPT
Zuerst wollen wir einen kurzen Überblick über das GPT-Projekt geben.
Die ersten Modelle zur Verarbeitung natürlicher Sprache (NLP) von OpenAI konnten Aufgaben wie das Beantworten von Fragen oder das Zusammenfassen von Informationen ohne überwachtes Training durchführen. Das Verständnis natürlicher Sprache, einschließlich der oben genannten Aufgaben, war von Anfang an möglich. Die meisten anderen NLP-Modelle vor GPT-1 wurden speziell für eine bestimmte Aufgabe trainiert. Zum Beispiel wäre eines für die Sentiment-Klassifikation, ein anderes für Textual Entailment und so weiter. GPT-1 war erfolgreich darin, Aufgaben zu verallgemeinern, abgesehen von einer einzigen, für die es entwickelt wurde.
GPT-1
GPT-1 war bahnbrechend im Bereich der NLP, da es die wesentlichen Einschränkungen früherer Modelle überwand. Erstens war es in der Lage, Aufgaben zu verallgemeinern, die über das hinausgingen, wofür ein NLP trainiert wurde. Es überwand auch die Notwendigkeit für große Mengen an annotierten Daten, die schwer zu beschaffen sind, um eine Aufgabe auszuführen.
Im Jahr 2018 erreichte GPT-1 einen NLP-Meilenstein, indem es zeigte, wie Vortraining und ein massives neuronales Netzwerk auf Basis von Textdaten die Aufgaben der Sprachgenerierung erheblich verbessern konnten. Allerdings war seine Fähigkeit, diese Aufgaben zu erfüllen, sehr begrenzt (im Vergleich zu den neueren Versionen, die jeder verwendet).
Das GPT-1-Papier beschrieb das semi-supervised Learning für alle NLP-Aufgaben. Es arbeitete an unüberwachtem Sprachmodellieren als Vortrainingstool. Anschließend verfeinerte das überwachte Training die Ergebnisse. Der Datensatz, auf dem GPT-1 trainiert wurde, war BooksCorpus, das etwa 7.000 Bücher für das Training bereitstellte.
GPT-1 war ein Proof-of-Concept-Projekt; es wurde nicht öffentlich freigegeben. Es erwies sich jedoch als erfolgreich, und GPT-1 konnte Sprache auf natürliche Weise verarbeiten und verstehen.
GPT-2
Nur ein Jahr nach der Einführung von GPT-1 wurde das GPT-2-Papier veröffentlicht. Dieses zweite Papier trug den Titel „Language Models are Unsupervised Multitask Learners“. Diesmal wurde das Produkt für den Einsatz im Bereich des maschinellen Lernens freigegeben. Fachleute setzten es für alle verschiedenen Textgenerierungsaufgaben ein, die wir besprochen haben.
Denken Sie daran, dass NLP ein sehr neues Phänomen ist und jede Iteration eine enorme Verbesserung gegenüber der vorherigen darstellt. Im Jahr 2019 konnte GPT-2 ein paar Sätze generieren und brach dann zusammen. Zu diesem Zeitpunkt war dies ein erfolgreicher und revolutionärer Durchbruch.
GPT-2 unterschied sich von GPT-1 in zwei wesentlichen Bereichen: Aufgaben-Konditionierung und Zero-Shot-Lernen & Zero-Shot-Aufgabentransfer.
Einfach ausgedrückt ist Aufgaben-Konditionierung, wenn das Modell dazu gebracht wird, aus denselben Eingaben unterschiedliche Ausgaben für mehrere verschiedene Aufgaben zu erzeugen. Die Ausgaben in diesen Fällen sind einzigartige Sequenzen natürlicher Sprache.
Zero-Shot-Lernen ist ein Aspekt des Zero-Shot-Aufgabentransfers. Dem Modell werden keine Beispiele zur Verfügung gestellt, es versteht die Aufgabe allein anhand der bereitgestellten Anweisungen. Zu diesem Zeitpunkt würde GPT-1 Sequenzen umordnen und feinabstimmen. Von GPT-2 wurde stattdessen erwartet, die Natur der Aufgabe allein durch Sprache zu verstehen und Antworten zu liefern.
Der Datensatz für GPT-2 wurde ebenfalls stark erweitert. Der verwendete WebText-Datensatz umfasste etwa 40 GB Textdaten aus über 8 Millionen Quellen. Im Vergleich zu BookCorpus war dies eine massive Erweiterung.
GPT-3
Das Papier zu GPT-3 trug den Titel „Language Models are Few-Shot Learners“. Die Idee war, dass Sprachmodelle keine Feinabstimmung und nur sehr wenig Anleitung benötigen könnten, um sowohl NLP-Aufgaben zu verstehen als auch auszuführen. OpenAI baute das Modell mit 175 Milliarden Parametern, eine enorme (über 100-fache) Erweiterung gegenüber früheren Modellen. Der Datensatz wurde auf fünf verschiedene Korpora erweitert.
Diese Verbesserungen ermöglichten es GPT-3, vollständige Artikel zu schreiben, die nicht leicht von menschlich geschriebenen Artikeln zu unterscheiden waren. Aber es konnte auch zufällige Aufgaben ausführen, für die es nicht speziell trainiert wurde. Zum Beispiel hatte es die Fähigkeit, mathematische und Programmierprobleme zu lösen oder sprachliche Aufgaben zu erfüllen. Für erstere erwies es sich als besonders vielversprechend. GPT-3 konnte natürliche Sprachbeschreibungen von Programmieraufgaben liefern.
GPT-3.5 und ChatGPT
ChatGPT basiert auf GPT-3.5, einem Update von GPT-3. Das 3.5-Modell basierte auf einem erweiterten Datensatz, der sein Potenzial weiter ausbaute. Dies wurde auf das gesprächsbasierte, quelloffene ChatGPT angewendet. Diesmal konnten Menschen aus aller Welt die Fähigkeit der KI erleben, seitenweise menschenähnlichen Text zu generieren.
ChatGPT, das OpenAI-Produkt, das jeder benutzt hat, wurde aufgrund seiner Fähigkeiten aus Schulen verbannt. Aber viele Fachleute und Unternehmen konnten es in ihre Standardarbeitsabläufe integrieren. Es ist jetzt die am schnellsten wachsende Webanwendung. Nach nur zwei Monaten erreichte es über 100 Millionen Nutzer. Mit etwas Anleitung und Faktenprüfung kann es Texte und Analysen erstellen, die den höchsten professionellen Standards entsprechen. Vermarkter, Programmierer und verschiedene Analysten gehören zu seinen größten Fans.
Zusätzlich zu professionellen Zwecken sind akademische und freizeitbezogene Anwendungen weit verbreitet. Das Modell (GPT-3.5) ist in der Lage, Fachleuten zu helfen, ihre Fähigkeiten zu verfeinern und ihre potenzielle Effizienz zu maximieren. Aber es kann auch für etwas so Einfaches wie ein interessantes Gespräch verwendet werden. Es kann originelle Witze schreiben, ein Lied komponieren, komplexe Themen aufschlüsseln und mehr. Es kann aber auch die Rolle eines Lehrers oder Tutors übernehmen. Mit einfacher Anleitung kann ChatGPT erklären, wie man komplexe mathematische Probleme mit gründlichen, aber leicht verständlichen schriftlichen Anweisungen löst. Einige Menschen haben sogar berichtet, ChatGPT für Beziehungsratschläge und andere psychologische Bedürfnisse genutzt zu haben.
Was kommt als Nächstes?
So bahnbrechend das alles auch ist, wir haben noch nichts gesehen. GPT-4 soll das Training am 22. August 2023 abschließen.
GPT-4 soll in allen Bereichen eine massive Verbesserung gegenüber 3.5 darstellen:
- Verarbeitungskapazitäten
- Datensätze
- Verständnis der Benutzerabsichten
- Sachliche Genauigkeit
- Schlussfolgerungen
- Anpassung des Verhaltens (gemäß Benutzeranfragen)
Man kann GPT-4 als eine Überarbeitung betrachten, die jeden Aspekt dessen verbessert, was ChatGPT derzeit bietet.
Was ist der Unterschied zwischen Chat GPT-3 und GPT-4?
GPT-3 war im Wesentlichen ein Text-Eingabe- und -Ausgabemodell. GPT-4 ist multimodal, verwendet Bilder, gibt Bildnachweise und nimmt Bildinputs für komplexe Anweisungen entgegen.
Es gibt auch die einfache Frage der verfügbaren Daten. GPT-4 ist monumental, und GPT-3 winzig, wenn man die beiden vergleicht. Die Datensätze sind nicht vergleichbar (nun, siehe das Bild unten für einen visuellen Vergleich).
GPT-4 kann auch mit mehr Texteingaben arbeiten als GPT-3. Das bedeutet, dass es viel längere Dokumente lesen und sie gemäß Ihren Anweisungen verarbeiten kann. Es kann dann auch viel mehr ausgeben, ganze Romane schreiben oder nur Kurzgeschichten, wenn Sie das bevorzugen.
Genauigkeit
OpenAI-Forschung zeigt erhebliche Verbesserungen in der faktischen Genauigkeit von GPT-4. Bisher hat sich ChatGPT in dieser Hinsicht als äußerst nützlich erwiesen. Dennoch macht es immer noch Fehler und es fehlen Daten in vielen Nischenbereichen. Aber der Bereich, in dem die Modelle ständig verbessert wurden, ist die Reduzierung von Denk- und Faktenfehlern. Tests von OpenAI ergaben, dass GPT-4 bei Denkfehlern 40 % besser abschneidet als GPT-3.5.
Lenkung
„Steuerbarkeit“ ist eines der Hauptmerkmale von ChatGPT. Benutzer, die wissen, wie man Fragen stellt, können das Verhalten der KI verändern. Dies ist wichtig, damit sie in verschiedenen Kontexten nützlich ist:
- Inhalte mit einem bestimmten „Ton“ produzieren
- Einen Aufsatz mit einer spezifischen Voreingenommenheit schreiben
Sie können ChatGPT direkt anweisen, wütend, glücklich, knapp, vorsichtig, besessen oder auf andere Weise zu schreiben. Das Verständnis dieser Eingaben und wie die KI darauf reagiert, bestimmt weitgehend, wie nützlich sie für Sie sein kann.
Die Verbesserungen von GPT-4 konzentrieren sich weitgehend auf diesen Aspekt der GPT-Modelle. Gleichzeitig wird das neue Modell stärkere eingebaute Schutzmaßnahmen gegen illegale oder unmoralische Anfragen haben. Das Endergebnis ist eine größere Fähigkeit, sich an Benutzereingaben anzupassen.
Unglaubliche Dinge, die der neue ChatGPT-4 tun kann
Verbesserte visuelle Erkennung
GPT-4 kann visuelle Eingaben verarbeiten und visuelle Ausgaben erzeugen. Aber es kann diese Fähigkeiten auch für viele wichtige Aufgaben nutzen, die ganze Berufe und Industrien verändern werden.
Ein Beispiel ist das Eingeben eines Wireframes, einer handgezeichneten, groben Skizze, wie eine Website aussehen und funktionieren wird. GPT-4 kann diese Informationen aufnehmen und den Code ausgeben, um diese Website basierend auf der Skizze zu erstellen.
GPT-4 kann auch Eingaben in einer Form aufnehmen und sie basierend auf Benutzeranweisungen in einer anderen Form präsentieren. Es kann riesige Textdokumente aufnehmen und diese Informationen als ansprechende PPT-Präsentation ausgeben. Diese zeitsparende Aufgabe kann große Textblöcke in prägnante, schöne Präsentationen verwandeln. Stundenlanges Formatieren entfällt, einfache Eingaben und Ausgaben sind angesagt.
Kodierung
Das Erlernen des Programmierens erfordert einen erheblichen Zeitaufwand, und nicht jeder kann diesen Prozess rechtfertigen. Die Anwendungsfälle für diese Fähigkeiten sind beeindruckend. Menschen ohne Programmiererfahrung können Websites erstellen und sogar Anwendungen entwickeln.
Mit GPT-4 haben Menschen bereits Google Chrome-Erweiterungen ohne vorherige Erfahrung erstellt. Ein lustiges Beispiel ist diese Erweiterung, die Webseiten in „Piraten-Sprache“ „übersetzt“. Man muss ihr nur sagen, etwas zu tun, selbst auf eine alberne Weise, und sie findet einen Weg. GPT-4 bietet alles, was Sie für den Erstellungsprozess benötigen, einschließlich Schreiben, Programmieren und Beheben von Fehlern. Alles, was Sie tun müssen, ist, die Anweisungen zu geben. GPT-4 versteht Anweisungen auch besser, was diese Möglichkeiten noch überraschender macht.
Vermarkter und andere verlassen sich auf Erweiterungen für ihre täglichen Routinen und Verantwortlichkeiten. Es gibt viele professionelle Anwendungen für GPT-4, zusätzlich zu den Freizeitnutzungen. Für viele Fachleute kann das Auslagern von Aufgaben an GPT-4 Arbeitsabläufe rationalisieren oder sogar Aufgaben übernehmen, die sie normalerweise nicht oder nur schwer erledigen könnten.
Für kreative Unternehmer eröffnen sich neue Möglichkeiten. Sie können GPT-4 verwenden, um neue Erweiterungen und andere Werkzeuge zu erstellen, die Ihr Geschäft oder Ihre Karriere unterstützen. Sie können es nutzen, um neue Funktionen auf Ihrer Website zu entwickeln, Ihre Produktivität zu verbessern und vieles mehr.
Erholung
Warum so ernst?
Die Einsatzmöglichkeiten von GPT-4 gehen über Geld und Produktivität hinaus. Man kann es auch zur Unterhaltung nutzen, sei es für schnelle Lacher oder umfassendere Unterhaltung.
Wenn die Arbeit erledigt ist und Sie sich langweilen, warum nicht ein neues Spiel für sich selbst erstellen? Keine Programmierkenntnisse? Kein Problem.
Sie können Pong in weniger als einer Minute nachbilden. Oder Sie nehmen sich etwas mehr Zeit und erstellen (oder erschaffen) etwas ganz anderes.
Akademiker
Dies ist einer der umstrittensten Aspekte von OpenAIs Schöpfung, seit ChatGPT der Öffentlichkeit zugänglich gemacht wurde. Schulbehörden haben es verboten. Professoren haben es genutzt, um automatisch Arbeiten zu schreiben. Schüler haben es genutzt, um ihre gesamte Hausaufgabe zu erledigen. Aber größtenteils kann GPT-4 in dieser Hinsicht auch harmlos sein.
Natürlich kann man seine Prüfungen nicht mit ChatGPT schreiben. Aber es kann ein großartiger Lernpartner sein!
In einer weiteren Verbesserung gegenüber früheren Modellen kann GPT-4 fast jede einzelne BAR-Prüfung bestehen. Es kann die meisten Prüfungen bestehen, einschließlich medizinischer, SATs und AP-Prüfungen. Wenn Sie Hilfe beim Lernen benötigen, kann GPT-4 ein großartiger Tutor sein.
Wie fängt man mit GPT-4 an?
Derzeit ist der einzige Weg, auf GPT-4 zuzugreifen, über eine kostenpflichtige Mitgliedschaft bei ChatGPT Plus.
ChatGPT Plus ist die Premium-Version von ChatGPT. Der Kauf eines Abonnements gewährt Ihnen Zugang zu GPT-4 anstelle des Standard-GPT-3.5. Die Mitgliedschaft beinhaltet auch priorisierten Zugang und schnellere Verarbeitung. Sie erhalten die Vorteile von GPT-4, die wir besprochen haben, einschließlich der Bild-Eingabemöglichkeit, zusätzlich zu einer verbesserten Erfahrung mit ChatGPT.
Ab März 2023 gibt es eine Warteliste, um als API-Entwickler auf GPT-4 zuzugreifen. Dies gibt Ihnen Zugang zu GPT-4 und allem, was Sie benötigen, um Anwendungen und Servicelösungen zu entwickeln.
Wenn Sie interessiert sind, ist jetzt ein guter Zeitpunkt, um mit einer der größten technologischen Revolutionen unserer Generation zu beginnen.
In Zukunft ist GPT-5 am fernen Horizont und stellt einen möglichen Nachfolger dar. Das Erlernen des Umgangs mit den frühen NLP-Modellen kann Ihnen einen Vorteil verschaffen und es Ihnen ermöglichen, das Beste aus zukünftigen Updates herauszuholen. Die Technologie verändert bereits unsere Welt, daher ist jetzt ein ebenso guter Zeitpunkt wie jeder andere, um zu beginnen.