OpenAI zaprezentowało nowe możliwości sztucznej inteligencji. Tym razem chodzi o tworzenie filmów na podstawie tekstu. Efekty są niesamowite. Czy reżyserowie i pomysłodawcy dzieł kina mają się czego obawiać?
Sztuczna inteligencja zawitała do naszego świata na dobre i rozwija się w błyskawicznym tempie, a dzięki temu, że miliony ludzi na świecie używają jej na co dzień, może się także uczyć na swoich błędach i sugestiach zarówno jej twórców, jak i użytkowników. W ten sposób firma OpenAI postanowiła przekroczyć kolejne granice tworząc nowy model o nazwie „Sora”, który odpowiada za tworzenie wideo na podstawie napisanych w czacie sugestii.
Wielu twórców filmów nie kryje obaw co do nowej odsłony OpenAI twierdząc, że jeśli w takim tempie będzie rozwiać się ta gałąź sztucznej inteligencji, tworzenie filmów „z duszą” może przestać mieć jakikolwiek sens i przyczynić się do produkcji stricte komercyjnych i niskiej jakości, a wielu reżyserów i aktorów może mieć problem ze znalezieniem pracy.
Inni zaś widzą w modelu „Sora” wielką szansę na zarobek i jeszcze lepszą jakość, którą ogranicza jedynie ludzka wyobraźnia. Produkcje filmowe pochłaniają niewyobrażalne ilości środków pieniężnych, co bezpośrednio przekłada się zarówno na ryzyko związane z popremierowym fiaskiem danego filmu, jak i problemami finansowymi lub znacznie niższymi dochodami. Teraz, wykorzystując sztuczną inteligencję, można w kilkanaście minut wyprodukować sceny, do których wcześniej trzeba było zatrudnić szereg statystów, aktorów, dźwiękowców i filmowców, przetransportować cały osprzęt do nagrywania i przygotować scenografię, by finalnie móc nagrać kilkunastosekundowy przerywnik między scenami głównymi.
Oczywiście nie jest to pierwsza próba tworzenia filmów z pomocą sztucznej inteligencji. Jeszcze rok temu mogliśmy oglądać krótkie produkcje, które pozostawiały wiele do życzenia. Twarze ludzi wygenerowanych przez AI były bardzo zniekształcone, a ruch nie był płynny. Ponadto sztuczna inteligencja mogła tworzyć jedynie kilkusekundowe filmiki bez zaawansowanego tła.
Tym razem jednak mamy do czynienia z czymś naprawdę przełomowym. Na pierwszy rzut oka zupełnie nie widać, że scena jest wygenerowana przez sztuczną inteligencję. Zarówno postacie znajdujące się w kadrze, jak i tło, a nawet zwierzęta, wydają się bardzo naturalne. Ruch jest płynny i przywodzi na myśl świetną produkcję filmową uchwyconą w wyjątkowo trafnie wyszukanym otoczeniu.
Technicznie Sora jest modelem opartym na architekturze trasformerowej (sieci neuronowej). Oznacza to, że AI najpierw tworzy zbiór ujęć, a właściwie klatek, po czym łączy je w jedną spójną całość. Moduł wykorzystuje obrazy generowane przez oprogramowanie DALL-E, również oparte na sztucznej inteligencji i stworzone przez firmę OpenAI oraz generowanie treści przez ChatGPT. Taka hybryda daje ogromne możliwości, a jak wiemy, DALL-E to jedno z najpotężniejszych obecnie narzędzi do generowania obrazów.
Ponadto tworzenie wideo nie jest jedyną umiejętnością modułu Sora. Potrafi również stworzyć wideo na podstawie już istniejącego zdjęcia lub poprawić jakość nagranego w rzeczywistości wideo przez dodanie klatek, czyniąc film bardziej płynnym, a nawet poprawić jego rozdzielczość.
Niestety istnieją również inne problemy poza zdystansowaniem się twórców wideo do nowej technologii. Internauci obawiają się przede wszystkim tego, że internet zostanie zalany filmami typu „Deep Fake”, które przedstawiają urojoną rzeczywistość. Obecnie nic nie stoi na przeszkodzie, by wygenerować wideo z dowolną osobą, która może mówić swoim głosem tekst wpisany przez wybraną osobę. Im lepsza jakość nagrania, a naprawdę trudno odróżnić je od prawdziwych, tym więcej ludzi uwierzy w dany film. Głównym z problemów może stać się wysyp wideo przez wyborami prezydenckimi w Stanach Zjednoczonych. Ci, którzy popierają jedną ze stron mogą zacząć uprawiać czarny PR przeciwko oponentowi, sugerując, że ten nagrał coś, co nie spodoba się jego zwolennikom. Kłopot staje się tym większy, im bardziej popularny dany film staje się w platformach społecznościowych takich jak Facebook, X czy Twitter. Eksperci przewidują, że starcie dwóch największych kandydatów na urząd Prezydenta USA – Joe Bidena oraz Donalda Trumpa może przerodzić się w niemałą wojnę, i to nawet niekoniecznie pomiędzy nimi, ale wśród ich zwolenników. Taka sytuacja może doprowadzić nawet do zamieszek, o ile w porę dane wideo nie zostanie zablokowane.
Portale społecznościowe od dłuższego czasu walczą z nieprawdziwymi filmami, zmuszając użytkowników, by ci oznaczali dany film jako tworzony przez lub z użyciem sztucznej inteligencji. Czy to wystarczy? Czas pokaże, choć z dużym prawdopodobieństwem można uznać, że niestety będzie to walka z wiatrakami.
Tak czy inaczej Sora to potężne narzędzie, które w niedalekiej przyszłości może przynieść wiele dobrego twórcom filmów, ale jej użycie przez osoby nieliczące się z konsekwencjami może nieść ze sobą fatalne skutki.
Adrian Pluta
E-mail: Ten adres pocztowy jest chroniony przed spamowaniem. Aby go zobaczyć, konieczne jest włączenie w przeglądarce obsługi JavaScript.