Letztes Jahr um diese Zeit waren die sozialen Medien voll von MyHeritages viralem „Deep Nostalgia“, dessen KI-Magie unsere alten Familienfotos mit verstörendem Realismus animiert. Nun, wenn Sie davon ausgeflippt sind, warten Sie, bis Sie die neue Funktion sehen, die ich gerade aufgerufen habe LiveStory.
Dieses Mal erstellt die Technologie eines Online-Genealogie-Unternehmens keinen kleinen Clip von 10-20 Clips, der auf einem alten Foto Ihres Verwandten basiert. Stattdessen geht LiveStory noch weiter, indem es ein längeres animiertes Video Ihres Vorfahren erstellt, das die Geschichte seines gesamten Lebens erzählt, komplett mit lippensynchronem Ton und einer Diashow mit alten Fotos.
Wie zuvor funktioniert es mit der KI-gestützten „Reenactment“-Technologie, die ein Bild des Gesichts Ihres Verwandten animiert. Aber dieses Mal bekommst du auch eine Stimme, die automatisch aus dem MyHeritage-Stammbaum generiert oder manuell von dir eingegeben wird. Dann erweckt die Text-to-Speech-Technologie die Geschichte zum Leben und der Ton wird mit dem sich bewegenden Sprecher Ihres Verwandten synchronisiert.
Wie es funktioniert?
Wie die letztjährige „Deep Nostalgia“-Technologie werden die Animationen von LiveStory mithilfe einer großen Sammlung von „Fahrervideos“ erstellt. Sobald die Algorithmen des Dienstes das von Ihnen hochgeladene Bild analysiert haben, werden seine hervorstechenden Merkmale oder Gesichtsmerkmale auf das Video des Fahrers abgebildet, um den Eindruck von Bewegung zu erzeugen. Algorithmen füllen auch alle fehlenden Details aus. Der synthetische Sprachgenerator erstellt auch eine Erzählung basierend auf den Informationen im Profil der Person, oder Sie können Ihr eigenes Skript von Grund auf neu erstellen. Sie können auch Ihre eigene Audioaufnahme hochladen.
MyHeritage und D-ID, das israelische Unternehmen, das die Technologie entwickelt und lizenziert, sagen, dass das Endergebnis vollständig anpassbar ist, sodass Sie die Erzählung, Bilder und Audio ändern können, bevor Sie sie an die Familie oder soziale Medien senden. LiveStory scheint auch 31 Sprachen, Dutzende von Dialekten und Hunderte von Sprachzeichen sowie mehrere männliche und weibliche Sprachoptionen zu unterstützen.
Trotz alledem besteht kein Zweifel, dass die Technologie ein bisschen gruselig ist und uns auf eine noch größere Reise in das unheimliche Tal mitnimmt. Für einige könnte das Hinzufügen von Audio zu weit führen, und MyHeritage musste einige Haftungsausschlüsse hinzufügen, um sicherzustellen, dass die Technologie nicht missbraucht wird. Darin heißt es, dass LiveStory „nur dazu bestimmt ist, auf Fotos von verstorbenen Personen, normalerweise den eigenen Vorfahren, verwendet zu werden“ und dass es „niemals auf einem Foto einer lebenden Person ohne deren Erlaubnis verwendet werden sollte“.
Viele in den sozialen Medien stellten jedoch fest, dass die letztjährige Technik der „tiefen Nostalgie“ eine beruhigende oder sogar wärmende Art zu Beziehungen war, die sie noch nie zuvor im wirklichen Leben gesehen hatten. Wie diese Funktion kann LiveStory derzeit kostenlos auf dem Desktop und im mobilen Web (beide über MyHeritage-Website) und in der mobilen MyHeritage-App. Sie können kostenlos mehrere LiveStories erstellen, aber danach müssen Sie für ein Abonnement bezahlen (ab 119 $ / 89 £ pro Jahr).
Analyse: Ein mutiger Schritt ins unheimliche Tal
Genau wie bei „Deep Nostalgia“ im letzten Jahr sind wir ein wenig hin und her gerissen über die neue „LiveStory“-Funktion von MyHeritage. Es besteht kein Zweifel, dass Technologie großartig ist, und die Tatsache, dass sie automatisch eine 90-Sekunden-Videobiografie aus einem Foto, einem Stammbaum und etwas Text erstellen kann, ist sowohl beeindruckend als auch erschreckend.
Wir können uns jedoch des Eindrucks nicht erwehren, dass ein großer Teil des früheren viralen Erfolgs der Technologie (der zu 100 Millionen Animationen führte) auf ihre Genauigkeit zurückzuführen ist. Die sich bewegenden Gesichter, die Deep Nostalgia erzeugte, blinzelten gelegentlich oder neigten den Kopf, aber das war der Fall – und diese Einschränkung trug dazu bei, eine Illusion zu erzeugen und gleichzeitig die Grenzen der Technologie zu maskieren.
Das Hinzufügen von Ton ist ein logischer Schritt und wird sich zweifellos als beliebtes Werkzeug für diejenigen erweisen, denen der unbestreitbare Gruselfaktor nicht kalt wird. Aber bei den Beispielen, die wir bisher gesehen haben, ist die Intonation manchmal automatisiert, und die Tatsache, dass der Sound nicht vom Original gesampelt wird, macht ihn etwas künstlich.
Derzeit scheint LiveStory eher für Museen oder Bildung geeignet zu sein, wo seine Fähigkeit, historische Figuren (anstelle persönlicher Beziehungen) zum Leben zu erwecken, ein nützlicher Weg sein könnte, die Geschichte für Besucher und Kinder interessanter zu machen.
Natürlich besteht auch die Möglichkeit des Missbrauchs, obwohl D-ID (der Hersteller der Technologie) einige Barrieren errichtet hat, um dies zu verhindern. Alle Benutzer müssen die Bedingungen akzeptieren, einschließlich des Versprechens, sie nicht an lebenden Personen anzuwenden, bevor sie eine LiveStory erstellen können. Es ist auch ein Textänderungsalgorithmus an Bord, um auf beleidigende, diffamierende oder falsche Informationen zu prüfen, obwohl nicht klar ist, wie letztere geprüft werden.
wann Wir haben letztes Jahr in einem exklusiven Interview mit D-ID gesprochenWir sind beeindruckt von ihrem Engagement dafür zu sorgen, dass ihre KI-Technologie nicht auf schändliche Weise verwendet wird, wenn auch etwas verärgert über ihre Vorhersage, dass die Mehrheit der visuellen Medien, die wir online sehen, „innerhalb von 5-10 Jahren“ synthetisch sein werden. LiveStory stellt eindeutig einen weiteren Schritt auf der Linie dar. Dieser Track, wenn nicht der Schritt, ist der virale Smash, der letztes Jahr „tiefe Nostalgie“ war.
More Stories
Dieses 100-W-GaN-Ladegerät ist dünn und faltbar
Kuo: Das RAM-Upgrade auf 12 GB im nächsten Jahr wird auf das iPhone 17 Pro Max beschränkt sein
Verdansk kehrt endlich zu Call of Duty Warzone zurück und die Fans freuen sich darüber