(6 minuta čitanja)

Iako je prvi val deepfake slika i videa, kao i panika koji su slijedili tu tehnologiju na izdisaju, tehnologija nije stala, nego se i dalje razvija.

Kada razmatramo deepfakes, nameću se dva smjera razvoja tehnologije. Prvi je onaj koji koristi umjetnu inteligenciju kako bi deepfakes bili što bliži stvarnosti, dok drugi koristi umjetnu inteligenciju kako bi sa sigurnošću odredio da li je video stvaran ili deepfake.

Primjer deepfakea:

Deepfake example.gif
By Source (WP:NFCC#4), Fair use, Link

Prije nego započnemo, moramo definirati što je točno deepfake.

Deepfake (složenica “dubokog učenja” deep learning i “lažnog” fake) tehnologija je u kojem se osoba u postojećoj slici ili videu zamjenjuje s tuđim likom. Iako lažiranje nečijeg izgleda nije nova ideja, uvođenje strojnog učenja i umjetne inteligencije revolucioniziralo je proces.
Deepfake manipulira postojećim sadržajem kako bi kreirao vizualni i audio sadržaj s velikim potencijalom za zavaravanje gledatelja. Glavna metoda za kreaciju deepfake uključuje strojno učenje kako bi se istrenirale duboke neuralne mreže kako stvaraju autoenkoder* ili generativnu protivničku mrežu**.

Deepfake su privukli veliku pozornost javnosti nakon što su upotrebljeni za kreaciju lažnih vijesti, financijskije prijevare i pornografskog sadržaja. Nakon takvih primjena, industrije i vlade su ograničile njihovu upotrebu.

*autoenkoder je neuralna mreža koja uči kopirati ulazne podatke na svoj izlaz. Mreža uči ignorirati ulaznu statiku i ulazne artefakte. Rezultat je kopija ulaznih podataka koju možemo uređivati.

**generativna protivnička mreža može naučiti od ulaznog seta podataka, mijenjajući svojstva i čimbenike, generirati u potpunosti nove objekte koji imaju istu funkciju kao ulazni set podataka.

Fotografija koju je generirala generativna protivnička mreža:

Woman 1.jpg
By Owlsmcgee - Own work, Public Domain, Link

Generiranje deepfakea

Za kreaciju deepfakea je potrebno:

1. Originalni video koji želite izmijeniti (što je bolja kvaliteta bolji će biti i rezultat)

2. Fotografije, audio i video zapisi osobe koju želite promijeniti (što više i što bolje kvalitete)

3. Fotografije, audio i video zapisi osobe koju želite umetnuti (što više i što bolje kvalitete)

Osim neuralnih mreža i strojnog učenja koje su eksponencijalno kompleksije teme kojima o kojima ćemo pisati detaljnije uskoro, daljnji proces je logičan. Kada ste ovladali poljima umijetne inteligencije, video uređivanja i audio inženjeringa, sve što morate je ubaciti potrebne podatke o osobi koju mijenjate i one u koju je mijenjate.

Deepfake su rezultat godina istraživanja i primjene tehnologija brojnih znanstvenika i stručnjaka, te ih je kao takve jako teško replicirati sam, iako postoje komercijalne verzije alata kojima se to može postići.

Sam proces je u teoriji jednostavan:

1. Analizom originalnog videa, identificiramo koje su nam informacije potrebe za zamjenu, analizirajući lice, pokrete, izraze, uzorke govora, način pomicanja usana itd.

2. Analizom fotografije, audio i video zapisa osobe koje želimo promijeniti, uspoređujući s podacima iz originalnog videa, izvlačimo točke i mape dijelova koje je potrebno promijeniti. To nam daje podatke o većim detaljima, ali i onima koje primjećujemo samo podsvjesno.

3. Analizom fotografije, audio i video zapisa osobe koju želimo umetnuti, izvlačimo iste podatke kao za osobu koju zamjenjujemo.

4. Kada imamo sve potrebne podatke, samo moramo zamijeniti sva obilježja osobe s obilježjima druge osobe. Zvuči jednostavno zar ne?

5. Kada imamo tako stvoreni deepfake, umjetna inteligencija mora još i dodatno obraditi audio i video zapis kako bi bili što sličniji originalu. U ovom “čišćenju” uklanjaju se svi artefakti koji su nastali pri procesu, uklanjajući diskoloracije koje se mogu pojaviti na rubovima lica. Analizira se svaki pojedina sličica videa kako bi prosječnoj osobi bilo nemoguće prepoznati da se radi o nečem što je stvoreno digitalno.

6. Kao zadnji korak, dodaje se audio zapis koji je prošao isti proces kao vizualni zapis, samo s audio spektra. Tu analiziramo intonaciju glasa, govorne mane i specifičnosti, kako bi audio bio što sličniji audio zapisima originalne osobe.

Napraviti deepfake se može i ručno, ali takav bi pothvat trajao desetljećima. To vrijeme možemo skratiti na nekoliko sati pravilom primjenom umjetne inteligencije. Čak i tu imamo razine, gdje će osnovna primjena stvoriti deepfake koji je lako uočiti, dok će napredna primjena tehnologije biti u potpunosti neprepoznatljiva od realnosti.

Što je još moguće s deepfakeom?

Detekcija deepfakea

Kreacija deepfakea je stvorila svoje anti područje, odnosno detekciju deepfakea. Jednostavno u teoriji, ali kompleksno u praksi, razvilo se novo područje umjetne inteligencije popularno nazvano “forenzika lica”.

Što se više deepfake videa pojavljivalo, to je više podataka bilo dostupno znanstvenima i stručnjacima koji su htjeli detektirati video zapise koji su izmjenjeni. Tehnika je krenula od parova videa, u kojem se nalazi originalni nepromijenjeni video, video koji je obrađen i ako je poznato specifična tehnika za kreaciju deepfake koja je korištena. Nastavno, ako to bilo moguće, parovi su dolazili u 3 razine kvalitete. Raw, odnosno nekomprimirani video, visoka rezolucija i niska rezolucija.

Takva podjela je potrebna jer je glavni medij za širenje deepfakea internet, i većina videa na njemu je komprimirana, što je otežalo detekciju jer se pri kompresiji kreiraju artefakti za koje je onda teško biti siguran da li su prisutni zbog kompresije ili zbog toga što je video lažiran. Također, kompresija koja se koristi (u koju na žalost nemamo vremena duboko ulaziti) smanjuje broj pixela, te time mogu sakriti artefakti deepfakea.

Najnovije tehnologije mogu detektirati deepfake s 99.26% točnosti kod nekomprimiranih videa, 95.73% kod videa visoke rezolucije i 91% kod videa niske rezolucije.

Tijekom razvoja deepfake tehnologija, nekoliko pristupa i algoritama se razvilo, te tako razlikujemo “Face2Face”, “DeepFakes”, “FaceSwap” i “NeuralTextures” tehlologije. Mjereći sposobnost detekcije čovjeka, ljudi su prepoznali lažni video u 68.69% na nekomprimiranom videu, 66.67% na videu visoke kvalitete i 58.73% na videu niske kvalitete.

Nove algoritme forenzike lice možemo iskoristiti i da nam otkrije tehniku kojoj je deepfake napravljen s 90-95% sigurnosti, što povratno omogućava da otkriveni video, zajedno s originalnim sadržajem pohranimo u baze za detekciju, olakšavajući i ubrzavajući proces u budućnosti.

Al Pacino i Arnold Schwarzenegger deepfake:

Implikacije i etika deepfakeova

S prvim valom deepfake videa, brzo je otkriveno je da upotrebom komercijalnih alata može doći do krađe nečijeg identiteta za krivotvorenje ili klevetu.

Prvi odgovor došao je od zajednica na internetu, jer su deepfakes upotrebljene za korištenje lica slavnih osoba u pornografiji. Prvi je takav sadržaj (31.1.2018.) maknuo najveći repozitorij .gif animacija Gfycat, a brzo su ga slijedili Reddit koji je ugasio svoj subreddit posvećen temi zbog “pornografije bez pristanka”, odnosno prikazivanja pornografskih sadržaja s osobama koje na to nisu pristale, iako one nisu orginalno bile na snimci.
Ostale internetske kompanije brzo su slijedile primjer te su tako do kraja veljače 2018. Discord, Google i Pornhub također na neki način uklonile deepfake sadržaj.
Jedino Facebook kao platforma ne briše takav sadržaj, nego se oslanja na treće strane kako bi takav sadržaj označila.

Velike svjetske vlade također su reagirale, te kreacija deepfake sadržaja nosi sa sobom odgovornost za onoga tko ih kreira.

Naravno, za deepfake koji služi nekoj svrsi kao projekt u kojem se lice Nicholas Cagea dodaje na mnoge likove i franšize nije kazneno djelo samo po sebi (osim copyright prava). Kada se iskoristi za zabavu, edukaciju ili promociju uz suglasnost svih strana, deepfake može biti zanimljiva tehnologija koja je široko upotrebljiva, dok se koristi u skladu sa zakonima.