Jos seuraat edes jossain määrin markkinointia, teknologiaa tai kansainvälistä politiikkaa aktiivisesti, sana “deepfake” (syväväärennös) saattaa olla tuttu. Todennäköisesti se myös nostattaa negatiivisia mielleyhtymiä.
Sitä on nimittäin pääasiassa käytetty pitkälti kaikkeen pahaan tähän mennessä ja usein maalataan uhkakuvia, kuinka presidentit saadaan videolla julistamaan sota toista maata vastaan ja kuinka tämä ehtii leviämään sosiaalisessa mediassa ennen kuin totuus ehtii perään.
Pyrin itse kuitenkin katsomaan jopa negatiivisiin asioihin liitettyjä työkaluja ja toimintamalleja miettien, miten ne voisivat toimia, jos käyttötarkoitukset ovat hyvät.
Työkalu siinä, missä muutkin
Deepfaket ovat kuitenkin väline siinä, missä kaikki muutkin työkalut. Moottorisahakin on hyvä puiden kaatamiseen, mutta sitä ei kannata toimistolle viedä. Deepfakeista puhutaankin nykyajan kuvanmuokkauksena ja vallankumouksen sanotaan olevan samanlainen kuin Photoshop sai aikanaan aikaan – ehkä jopa suurempi.
Mikä on deepfake?
Kerron omin sanoin, koska tähän löytyy niin monta määritelmää. Deepfake on loppujen lopuksi jollain tavoin usein koneellisesti alkuperäisestä muutettu äänimedia, video tai molempien yhdistelmä.
Deepfake voi olla niinkin yksinkertainen kuin video, jonka toistonopeutta on manipuoloitu esimerkiksi hidastaen sitä. Näin näytetään valheellisesti henkilön olevan vaikka humalassa, kuten Nancy Pelosin kanssa kävi.
Se voi myös olla text-to-speech-teknologialla tehty ääninauhoite, jossa koneoppimisalgoritmille on koulutettu henkilön ääni ja tämä lukee syötetyn tekstin hänen (tässä tapauksessa minun) äänellään.
Kyseisen mallin kouluttamiseen luin 2 tuntia tekstiä ääneen, jonka perusteella ääni on luotu. Se ei vielä mene läpi ihmisestä puheen soljuvuudessa, mutta on lähellä.
Tai se voi olla videon käsittelyä, jossa vaikka vaihdetaan henkilön kasvot, kuten tässä esimerkissä, jossa Captain Americaa näyttelemään on muokattu John Krasinski.
Vielä yksi ja sitten mennään eteenpäin! Smash Mouthin All Star movie mashup deepfake🤩
Useimmiten kyseessä on siis koneoppimista ja yllättävän vähäistä määrää oppimiseen käytettyä mediadataa hyödyntäen tehty sisältö. Se voi kuitenkin olla hyvin yksinkertaistakin manipulaatiota, joka ei vaadi mitään algoritmista oppimista, kuten esimerkiksi videon hidastaminen.
Deepfaket tulevat auttamaan sisällöntuotannossa
Jos nyt ei vielä dystopian kylmä hiki iskenyt pintaan, niin pääsemme oikeisiin hyötyihin, joita markkinoija voi tästä teknologiasta itselleen kaivaa. Nimittäin syväväärennökset tulevat tulevaisuudessa olemaan markkinoinnin sisältöjen tuottamisen pelastus.
Jos ajattelemme pelkästään tuota esimerkkinauhoitetta minun äänelläni, niin käyttämällä 2 tuntia algoritmia opettaen voin syöttää kenen tahansa kirjoittamaa tekstiä ja julkaista materiaalin vaikka keskinkertaisena podcastina. Toki laatu on vielä tässä kohtaa tökeröä, mutta se kehittyy.
Ja vaikka tuo on nyt huonolaatuista, niin se tekee sisällöstä saavutettavampaa, kun sitä tarjotaan sekä teksti- että äänimuodossa samalla tarjoten tunteen, että henkilö puhuu omalla äänellään.
Tärkeimmät hyödyt markkinoijalle
1. Tuotannon skaalaus esimerkiksi ääni- ja videomateriaalin tuotannossa
Haluat tuottaa ääntä tai videota, esimerkiksi yrityksen toimitusjohtajan tai jonkun muun äänellä ja videokuvalla, mutta kaveria ei meinaa millään saada tätä tuottamaan? Ei hätää!
Kerää vain riittävä määrä kuva- ja äänimateriaalia, minkä jälkeen voidaankin valita, mitä hänen halutaan sanovan. Toki muistaen, että tarkoitus ei ole saada ihmistä sanomaan sellaista, mihin hän ei suostu, vaan irrottaa hänen tarpeensa olla paikalla.
2. Joustavuus median muokkaamisessa myöhemmin
Vaihtuiko yrityksen nimi, muuttuivatko tuotenimet tai puhuttiinko videolla asioita, jotka eivät sovi tähän aikaan? Ei hätää!
Muokkaa vanhasta videosta kuvaa, ääntä tai molempia. Tällä tavoin saat esimerkiksi vaihdettua sanoja, joita ihmiset sanovat ja jotka vielä kuulostavat heidän sanomiltaan. Saman voit tehdä esimerkiksi podcasteissa, kun jokin sana tuli törttöiltyä tai vastaavaa.
3. Voitte ottaa ihmisiä videoihin ilman, että he ovat paikan päällä
Nyt jos koskaan on vaikea viedä ihmisiä samaan paikkaan. Mitä jos sijaisnäyttelijät esiintyisivät yritysvideossa ja deepfake-teknologian avulla teidän henkilöstönne voidaan vaihtaa heidän tilalleen? Jossain määrin saman näköinen kroppa vain esiintymään ja pää tai pelkät kasvot vaihtoon.
4. Tunnetut henkilöt voivat lisensoida teille näköisyyttään ja ääntään
Ehkä ei vielä, mutta pian voitte lisensoida haluamanne henkilön äänen ja kasvot mainosvideoonne. Mieti esimerkiksi juurikin näin pandemian aikana, jos voisit riittävää rahaa vastaan ostaa lisenssin vaikkapa kaikille rakkaan julkisorganisaatioäänen Reidar Waseniuksen ääneen ja kasvoihin yhtä videota varten. Tämän jälkeen vain päättäisit, mitä hän sanoo, kuittauttaisit häneltä lopputuotoksen ja voilà! Näin sekä Reidar voi itse skaalata omaa tekemistään ilman kalenterin totaalista hajoamista ja useampi pääsee nauttimaan hänen panostuksistaan.
Olemmeko jo perillä?
Kyllä ja ei. Deepfakien tekeminen on kohtuuhintaista jo tänä päivänä ja hyvinkin mahdollista. Yleensä lähdetään liikkeelle sadoista euroista ja toki tonnikertoimia saadaan vaikka kuinka. Kuitenkin, kuten huomaat esimerkeistä, tänä päivänä sen rooli on enemmänkin tukea editointia ja tehdä suhteellisen pieniä muutoksia materiaaleihin, ei vielä kokonaisten mediakokonaisuuksien tuottaminen. Esimerkiksi podcast-editointi äänelläni olisi ihan ok, mutta tuo koko teksti on vielä hieman tökeröä.
Aikataulullisesti teknologia on arkikäyttöistä jo parissa vuodessa. Kuten esimerkeistä huomaat, ei ole vain yhtä käyttötarkoitusta, mihin tätä voisi hyödyntää, vaan tilanteet vaihtelevat.
Tämän blogin kirjoittamisessa meni poikkeuksellisen kauan aikaa, koska jumiuduin jatkuvasti katsomaan eri deepfake videoita YouTubesta. Jos haluat tehdä samoin, tästä kannattaa aloittaa >