Działasz w branży wideo? No to sorry. Przygotuj się na spotkanie z Sora.
Przyszłość jest teraz. W coraz większym stopniu napędza ją sztuczna inteligencja. To fakt i chociaż jeszcze nie wszyscy zdążyli oswoić się z chatem GPT-4, już w drugim miesiącu 2024 roku do gry wkroczył kolejny model, który proponuje nową rewolucją. Tym razem w branży wideo. Sora, nowe narzędzie firmy OpenAI, jest witane z entuzjazmem (i całą masą obaw).
Hiperrealizm
Sora może tworzyć filmy trwające do 60 sekund z bardzo szczegółowymi scenami, złożonym ruchem kamery i wieloma postaciami wyrażającymi żywe emocje – tak o nowym modelu piszą jego twórcy w mediach społecznościowych. Opisowi towarzyszy odpowiedni prompt i wideo. Tutaj robi się ciekawie.
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Czujne oko wychwyci drobne nieścisłości lub potknięcia. Nie ma to jednak większego znaczenia – jeżeli przypomnicie sobie film z wygenerowanym przez AI Willem Smithem wcinającym makaron i porównacie go do najświeższych produkcji spod znaku Sora, to stanie się jasne, że w ciągu niecałego roku pracownicy OpenAI przeskoczyli nie o kilka, a kilkanaście oczek do przodu. Rzućcie okiem na ten przykład. Czy to teaser najnowszego filmu sci-fi? Nie, to TYLKO interpretacja krótkiego promptu.
Prompt: “A movie trailer featuring the adventures of the 30 year old space man wearing a red wool knitted motorcycle helmet, blue sky, salt desert, cinematic style, shot on 35mm film, vivid colors.” pic.twitter.com/0JzpwPUGPB
— OpenAI (@OpenAI) February 15, 2024
Napisz, co chcesz obejrzeć
Sora opiera się na wcześniejszych badaniach nad modelami DALL-E i GPT. Zasada działania jest dobrze znana wszystkim, którzy od dłuższego czasu posługują się komunikatorami lub wtyczkami AI. Wszystko opiera się na promptach – krótkich, jednak bardzo dokładnych i treściwych komendach wpisywanych przez użytkowników. Im bardziej precyzyjne zlecenie, tym więcej szczegółów zawierać będzie wideo, które dostaniemy. I to zaledwie po kilkudziesięciu sekundach.
Prompt: “Several giant wooly mammoths approach treading through a snowy meadow, their long wooly fur lightly blows in the wind as they walk, snow covered trees and dramatic snow capped mountains in the distance, mid afternoon light with wispy clouds and a sun high in the distance… pic.twitter.com/Um5CWI18nS
— OpenAI (@OpenAI) February 15, 2024
Pełnia możliwości
Generowanie nowych filmów na podstawie wytycznych użytkowników to nie wszystko. Wedle opisów twórców Sora jest w stanie pobrać istniejący nieruchomy obraz i wygenerować z niego wideo, animując zawartość z dokładnością i dbałością o drobne szczegóły. Model może również pobrać gotowe wideo i rozszerzyć perspektywę lub uzupełnić je o brakujące klatki. Lubicie otwarte zakończenia w filmach? Może już niedługo będziecie mogli przetestować, jak Sora poradzi sobie z ich alternatywnymi wersjami.

Ostatni kadr z filmu „Incepcja” w reżyserii Christophera Nolana, źródło: https://reflectingoncinemablog.wordpress.com/2017/06/22/inception-ending-scene-explanation/
Atest bezpieczeństwa
Kreatywność to oczywiście tylko jedna strona medalu. Drugą jest niestety dezinformacja. Obawy przed wykorzystaniem nowego narzędzia do niecnych celów są uzasadnione. Eksperci z platformy Sumsub w raporcie dotyczącym oszustw związanych z tożsamością wynotowali, że w latach 2022-2023 nastąpił 10-krotny wzrost liczby wykrytych deepfake’ów na całym świecie we wszystkich branżach. Czy zaawansowane możliwości Sora sprawią, że kolejne podrobione produkcje wideo będą tak perfekcyjne, że jedynym sposobem, na ich odszyfrowanie będzie… skorzystanie z weryfikatora AI? Przedstawiciele OpenAI dementują te dystopijne pogłoski. Na swojej stronie internetowej zapewniają, że model udostępniony odbiorcom ma być w pełni bezpieczny – tj. nie będzie można wykorzystać go do podszywania się pod inne osoby lub tworzenia filmów, łamiących standardy internetowej społeczności. Aktualnie zespół OpenAI współpracuje również z red teamerami, czyli ekspertami branżowymi, zajmującymi się testowaniem bezpieczeństwa najnowszego urządzenia poprzez symulowanie ataków hakerskich czy wykorzystywanie go do niecnych celów. Prawdziwy test bezpieczeństwa będzie odbywał się… na nas samych:

Dlatego uważamy, że uczenie się na podstawie rzeczywistych zastosowań jest kluczowym elementem tworzenia
i udostępniania coraz bezpieczniejszych systemów sztucznej inteligencji w miarę upływu czasu. Źródło: https://openai.com/sora
Czy Sora odbierze nam pracę?
To pytanie, które pojawia się zawsze przy okazji dyskusji na temat nowych udogodnień AI. Czwarta wersja czatu GPT już teraz „zredukowała” całe zespoły SEO copywriterów w niektórych agencjach marketingowych. Czy filmowcy powinni myśleć o szybkim przebranżowieniu się? Zacznijmy od tego, że firma Open AI nie udostępniła jeszcze swojego najnowszego narzędzia do ogólnego użytku. Twórcy podkreślają, że najnowszy model ma być wsparciem, a nie zastępstwem dla profesjonalnych twórców. Nie wiadomo, jak długo potrwa faza testowa. To dobry moment, aby zastanowić się nad ewentualnym wykorzystaniem Sora w przyszłości – jako usprawnienia, odciążenia lub po prostu kreatywnego zastrzyku w produkcji wizualnej. Uniwersalna prawda o nowych technologiach AI brzmi: można na narzekać, jednak absolutnie nie należy ich odrzucać – albo wsiadasz do tego pociągu, albo zostajesz sam na peronie.
Robert Wolak | Werbrand & Unicorns