OpenAI gab Anfang dieser Woche bekannt, dass die meisten Benutzer bis zum Herbst warten müssen, um Zugriff auf die Advanced Voice-Funktion von GPT-4o zu erhalten, aber es sieht so aus, als hätten einige glückliche Leute einen ersten Blick auf die Möglichkeiten des Sprachassistenten der nächsten Generation geworfen.
Reddit-Benutzer Rosie die Schöpferin Er war einer der wenigen Glücklichen. Sie haben eine Aufnahme einer neuen, noch nie gehörten GPT-4o-Stimme geteilt, die eine Horrorgeschichte erzählt, mit geschichtenbezogenen Soundeffekten wie Donner und Schritten. Sambhav Gupta, Autor für künstliche Intelligenz Markieren Sie zunächst den Clip auf Xwas ihm größere Aufmerksamkeit verschaffte.
Es scheint, dass Rosies Ankunft ein Fehler war. OpenAI teilte mir in einer Erklärung mit, dass einigen Benutzern versehentlich Zugriff auf das Modell gewährt wurde, dies wurde jedoch inzwischen korrigiert.
Was können wir in dem durchgesickerten Video hören?
Jedes Video, das wir bisher mit fortgeschrittenem GPT-4o-Audio erhalten haben, stand unter der Kontrolle von OpenAI, und obwohl es großartig aussah, war es auf benutzerdefinierte Anwendungsfälle beschränkt.
Ein neues Video von RozziTheCreator scheint diese Fähigkeit auf natürlichere Weise zu demonstrieren, einschließlich einer Soundeffektfunktion, die wir noch nie zuvor gehört haben.
Ich schickte RozziTheCreator eine Nachricht über das Erlebnis und sie sagten: „Es kam aus heiterem Himmel, es sah gleich aus, der einzige Unterschied war der Klang.“ Die Entdeckung geschah spät in der Nacht, als RozziTheCreator versuchte, dem Chatbot eine Frage zu stellen: „Ich habe die Änderung entdeckt.“
Es hat nur ein paar Minuten gedauert und laut RozziTheCreator war es „ziemlich fehlerhaft“, sodass keine Zeit blieb, viel daraus zu machen, aber sie haben es geschafft, einen Ausschnitt dieser erstaunlichen Geschichte festzuhalten.
„Es begann verrückt zu werden, Dinge zu wiederholen und auf Dinge zu reagieren, die ich nicht gesagt hatte“, so RozziTheCreator, bevor er zur normalen Grundstimme zurückkehrte, die alle anderen tatsächlich verwenden können.
Im Video hört man, wie GPT-4o eifrig und locker die Geschichte erzählt, untermalt von Soundeffekten. „Stellen Sie sich vor, da ist diese kleine Stadt, jeder kennt jeden, und da ist dieses kleine Haus am Ende der Straße“, erklärt er.
Die Geschichte geht weiter über zwei Teenager, die während des Sturms das Haus überprüften, „mit nichts als einer Taschenlampe und ihren Telefonen als Beleuchtung“.
Was ist also bei der Subtraktion schiefgelaufen?
OpenAI führt langsam eine ganze Reihe neuer Funktionen ein. Frühe Plus-Benutzer sollten diesen Monat erweitertes GPT-4o für Audio erhalten, aber aufgrund einiger Sicherheitsprobleme und Bedenken, ob sie über die Hardware-Infrastruktur verfügten oder nicht, verzögerte sich dies.
Ich fragte OpenAI, was dazu geführt habe, dass RozziTheCreator Zugriff erhalten habe, und ein Unternehmenssprecher sagte mir: „Während des Testens der Funktion haben wir versehentlich Einladungen an eine kleine Anzahl von ChatGPT-Benutzern gesendet. Das war ein Fehler und wir haben ihn behoben.“
Sie bestätigten, dass die ersten Plus-Benutzer nächsten Monat Zugang erhalten, für die meisten Menschen wird es jedoch länger dauern. Die Erklärung für den ersten Rollout wird darin bestehen, „Feedback zu sammeln und eine Erweiterung auf der Grundlage unserer Erkenntnisse zu planen“.
Von GPT-4o ist also noch nichts zu hören, aber dies ist das Neueste in einer Reihe von Beispielen, bei denen GPT-4o offenbar seine Zwänge überwinden und seine vollen Fähigkeiten anbieten möchte. Ich habe persönlich Beispiele gesehen, wie er in einer Minute Live-Audiodateien analysiert und sie in der nächsten Minute durch den Code laufen lässt.
Das hat dazu geführt, dass ich mich noch mehr über die volle Leistungsfähigkeit des Geräts freute und mich mehr über die Verzögerung ärgerte – so verständlich das auch sein mag.
Mehr aus Toms Reiseführer
„Kommunikator. Freiberuflicher Gamer. Absoluter Musik-Nerd. Neigt zu Apathieanfällen. Freundlicher Webspezialist.“
More Stories
Dieses 100-W-GaN-Ladegerät ist dünn und faltbar
Kuo: Das RAM-Upgrade auf 12 GB im nächsten Jahr wird auf das iPhone 17 Pro Max beschränkt sein
Verdansk kehrt endlich zu Call of Duty Warzone zurück und die Fans freuen sich darüber