Tehisintellekt teeb teatrit: Kuidas STACC pani robotid Tšehhovi stiilis näidendit tegema?

Tehisintellekt teeb teatrit: Kuidas STACC pani robotid Tšehhovi stiilis näidendit tegema?

Kas teadsid, et robotid ei ole ainult põrandapesijad ja muu musta töö tegijad? Nendega saab veel palju põnevaid asju teha, näiteks teatrit. Robotite põrandapesemise ja muruniitmise kultuse murdmiseks võttis MEDIT-i teadur Liina Keevallik enda südameasjaks teha robotitega midagi iseäranis kultuurset ja ilusat – robotiteatrit.

Robotiteatris püütakse roboteid õpetada looma terviklikke näidendeid. See algab stsenaariumi kirjutamisest, ent ka lavastamine ja näidendi ettemängimine jäävad robotite hooleks. See mõneti ekstravagantne ettevõtmine on pühendatud just nimelt robotitele endile. Robotiteatri projekti eestvedajaks, hingeks ja ajuks on MEDIT-i teadur Liina Keevallik.
Miks just robotiteater? Liina toob välja kaks peamist põhjust:

  1. Roboteid EI LOODUD põrandapesijateks vm “musta töö tegijateks”, ehkki nad on neil aladel palju kasutust leidnud
  2. Sõna “robot” sai 2021. aastal 100-aastaseks ning seda peab ju ometi vääriliselt tähistama.

Nimelt võttis sõna “robot” esimesena kasutusele tšehhi kirjanik Karel Čapek oma 1921. aastal esietendunud näidendis. Edasi on aga tehisintellekti roll sõnateatris jäänud suhteliselt olematuks. Robotiteatri projektiga püüame selle augu täita.
Robotiteatri projekt ühendab väga erinevate elualade teadlasi, tudengeid ja kunstnikke. Projekti eestvedaja Liina Keevallik on töötanud kunstnikuna nii erinevates Eesti teatrites kui ka vabakutselisena ning omandanud doktorikraadi Eesti Kunstiakadeemias ja Pariisi 8. Ülikoolis.

Projekti kaasatud Tallinna Ülikooli tudengid sõnastavad eesmärgi järgmiselt: “Tahame aru saada, millise loogika järgi ja millises mahus me masinale näidendi kirjutamist õpetama peame, et tekiks iseseisev ja loogiline teos. Kuna Eestis on teatrialast koostööd tehisintellektiga veel vähe ja üsna õhinapõhiselt, loodame pakkuda tulevikuks väärt kogemust ja õppematerjali, et entusiastidel rohkem kodumaiseid näiteid oleks, millele toetuda. Üldisem eesmärk on sellel ettevõtmisel aru saada tehisintellekti kasutamise võimalustest loomeprotsessis.”

STACCi andmeteadlaste rolliks on olnud luua tehisintellekt, mis suudaks genereerida lavastamiseks sobiliku näidendi teksti. 

Kuidas panna masinad loovamalt mõtlema ja tegutsema?

Robotiteatri projekti suurim ja ambitsioonikaim eesmärk on panna masinad loovalt mõtlema ja tegutsema. Nagu juba öeldud, on etenduskunstides tehisintellekti kasutamise mõtet keerutatud varemgi, ent vähemalt sõnateatri puhul ei ole väljapaistvaid tulemusi veel saavutatud. Siiski on meil olemas ka aktiivsed konkurendid – nimelt sõna “robot” sünnimaal Tšehhis. Nende projekt kannab nime THEaiTRE (www.theaitre.com) ning selle eesmärgiks oli samuti luua näidend, mille on kirjutanud tehisintellekt. Katkendit nende katsetusest saab näha siit:

Varasematest tehisintellekti kunstilistest katsetustest on meie robotiteatri meeskonna jaoks kõige inspireerivam olnud esimene tehisintellekti loodud film. Selle peamiseks algatajaks oli kunstnik-andmeteadlane Ross Goodwin. Filmikompanii End Cue režissöör Oscar Sharp tegi selle päriselt lühifilmiks, mida on võimalik vaadata siit: “Sunspring”.

Nii seda filmi kui ka tšehhide teatrietenduse katkendit vaadates on selge, et mõlema puhul on  stsenaarium absurdne ning teos püsib koos vaid tänu näitlejate pingutustele emotsioonide vallas. Tekst ja dialoog on küll olemas, ent puudub igasugune loogiline struktuur, mis teose loogiliseks tervikuks muudaks.

Meie eesmärgiks on lennata kõrgemalt – et meie loodud tehisintellekti tekst oleks loogiline. Seejuures muidugi mitte kaotades ära masina loomingulisust, sundides teda liialt inimese loomingut jäljendama, vaid leides tasakaalu abstraktsuse, loogika ja absurdi vahel. Selle juures aitavad oluliselt kaasa Tšehhovi näidendid, mis inimloomust otsekui läbi mikroskoobi vaatlevad.

Tehisintellekt, mis suudab kirjutada näidendit

STACCi andmeteadlaste ülesandeks oli luua tehisintellekt, mis suudab kirjutada olemasolevate Anton Tšehhovi näidendite põhjal uue. “Grammatiliselt korrektse teksti genereerimine ei ole tänapäeva suurtele keelemudelitele enam probleem, ent sellegipoolest sisaldas ülesanne suuri väljakutseid: kuidas veenda vaid kuue näiteteksti abil tehisintellekti genereerima mõistliku sisu, ülesehituse, tegelaskujude ja sündmustikuga näidendit?” kommenteeris STACCi andmeteadlane Dage Särg. “Õnneks oli meil kasutada kümmekond entusiastlikku tudengit, kes olid valmis andmeid märgendama, et loodaval tehisintellektil õppimine ladusamalt läheks,” lisas STACCi andmeinsener Karl-Oskar Masing. Seega said mitmete pikkade arutelude tulemusel paika pandud ja tekstidele peale märgendatud nii näidendi struktuur, sündmused ja teemad kui ka emotsioonid.

“Tšehhovliku teksti genereerimiseks kasutasime OpenAI vabalt kättesaadavat keelemudelit GPT-2, mille peenhäälestasime oma Tšehhovi näidenditega. Selle tulemusel tekkis teksti genereerija, kes sai nimeks John ning kellele saime järgemööda katse-eksituse meetodil hakata erineval moel õpetama näidendi struktuuri ja muid elemente,” kommenteeris Särg.

“Tervikliku näidendi genereerimiseks töötasime katse-eksituse meetodil välja mitmeastmelise protsessi. Esmalt treenisime märgendatud näidendite põhjal rekurrentsetel tehisnärvivõrkudel põhineva mudeli, mis õppis märgendatud üksuste järgnevuste põhjal genereerima uusi tšehhovlikke järgnevusi – kuidas vahelduvad etenduses teemad ja emotsioonid,” lisas Särg. Sel moel tekkis n-ö näidendi struktuur või selgroog, millest osa võib välja näha järgmine:

A_HAPPY_EVENT
DECLARING_LOVE
THE_PAST
THE_FUTURE
NATURE
GETTING_BAD_NEWS
SADNESS
SHOOTING_AT_SOMEONE
HURTING_SOMEONE
IRRITATION
ANGER
DEPARTURE_FOREVER

Struktureerimine ja teksti genereerimine

Järgmiseks etapiks oli struktuurielementidele vastava teksti genereerimine, kasutades tudengite poolt Tšehhovi näidendites vastavate elementidena märgendatud lauseid n-ö seemnetena, mille põhjal paluda keelemudelil vastavasisulist teksti genereerida.
Lisaks struktuurile ja tekstile on ühel näidendil loomulikult vaja ka tegelasi. “Nende nimede genereerimiseks treenisime Tšehhovi tegelaste nimede põhjal tähemärgipõhise mudeli, mis lõi hulga uusi toredaid tegelaskujusid – näiteks Allekin, Meripanna, Kuzenbie, Chacha ja  Macha Soff, Serstioff ja Lobe An,” kommenteeris Särg.

Särje sõnul oli üheks kõige keerulisemaks etapiks genereeritud teksti ja tegelaste ühendamine ning teksti jaotamine loogiliselt tegelaste vahel. Selleks omakorda treenisime taas mudelid – ühe tegelaste vaheldumise õpetamiseks tehisintellekt Johnile, teise tekstilõikude temaatiliseks jaotamiseks tegelaste vahel. Lõpuks oli vaja tegelaste vahel jaotatud tekstile genereerida ka remargid – sõnateater ei ole ju ainuüksi monotoonselt teksti ettelugemine, vaid enamat. Selleks peenhäälestasime GPT-2 keelemudeli Tšehhovi näidenditest pärit remarkidega, mis võimaldas genereerida loodud tekstile ka tšehhovlikud remargid.

“Kogu selle loogika väljatöötamine toimus enam kui aastase perioodi vältel ning andis vähemalt minu jaoks täiesti uue sügavuse nii Tšehhovi teostele kui näitekunstile üleüldiselt. Olen küll üsnagi aktiivne teatriskäija, ent kunagi varem ei ole ma süvenenud teatrikunsti n-ö teise poolde – loome- ja lavastusprotsessi. Väga põnev oli koos selle ala asjatundjatega probleeme lahti mõtestada ning siis omakorda enda erialaoskuste abil tehisintellekti neid lahendama panna,” kommenteeris Särg.

Tehisintellekti meetodeid kasutav programm, mis loob terviklikke näidendeid

STACCi andmeteadlaste töö väljundina valmis tehisintellekti meetodeid kasutav programm, mis loob terviklikke näidendeid. Katkend loodud näidendi tekstist näeb välja taoline:
[ BOREDOM]
ALLEKIN…
{She kisses his hands}
MERIPANNA: I have been sitting here all night thinking of an idea. I have no other business here.
*
{Laughing through her tears}
MERIPANNA: I had this book with me. I read it often.
{Looks through the book}
ALLEKIN :  [ LOVE_TOPIC ]  Tell me, do you love anybody?
{Joyfully, through her tears}
FEDONI: I have only one wish: that everybody should please me.
{Stretches himself}
THABOLIND VAKAN :  [ THE_MEANING_OF_LIFE ]  Scientifically speaking, no theatre is possible.
{Softly, through his tears}
MERIPANNA: It’s a pity. Your stepmother is a great actress, and I’m a concert pianist.
{She embraces his knees}
ALLEKIN: A concert pianist!
{Stops her ears.}
MERIPANNA: Yes, the hobby has paid off.
{Stops her ears.}
FEDONI :  [ MONEY ]  Come, have a drink and supper, we can go to bed early.  Here they are again.
{Exciting himself}
ALLEKIN: The water is really cold.
{Shakes her fist.}
MERIPANNA: I should be cold, too, if it was not for the long sleeves and the long pants.  I want to dance, darling.
[ HAPPINESS ]
{Still following her}
Näidendi lavastamist ja ettemängimist on osalised, sh robotid ise, ka juba proovinud – detsembris toimus VITA blackboxis proov, mille katkendeid on võimalik näha Artificial Chekhovi Facebooki lehelt, näiteks esimese stseeni läbimäng.

Kokkuvõtteks

Ettevõetud ülesande olemus muudab tulemuste hindamise eriliselt keerukaks. Teksti genereerimise ülesannete puhul on väga raske arvuliselt väljendada, kas tulemus on “õige” või “vale”. Näiteks masintõlkes püütakse seda lahendada, hinnates masintõlke väljundi sarnasust inimtõlkija tehtuga. Sarnast lähenemist loovteksti puhul aga kasutada ei saa – ühest küljest soovime me küll genereerida uut n-ö Tšehhovi näidendit, ent teisest küljest ei ole võimalikult suur sarnasus juba olemasoleva näidendiga sugugi eesmärgiks. Soovime saada midagi uut, midagi, mis pakuks inimpublikule elamust. Seega on ka hindamine vaid kvalitatiivne ja põhineb igaühe sisetundel – nagu kultuuri puhul ikka.

Igal juhul on kõigi osapoolte jaoks on olnud tegu väga huvitava protsessiga, mille käigus erinevate elualade inimesed on saanud heita pilku enda jaoks hoopis võõrastesse valdkondadesse ning püüda interdistsiplinaarsetele probleemidele koos lahendusi leida. Liina Keevallik on iseloomustanud koostööd STACCi andmeteadlastega järgmiselt: “Kunsti vallas pole just tihti võimalust teha koostööd professionaalsete IT-inimestega. See on äärmiselt avardav kogemus. Liiatigi on STACCi töötajad Karl-Oskar Masing ja Dage Särg erakordselt innukad ja loomingulised partnerid. Ootan põnevusega meie ühise tehisintellektist kasvandiku esimest ülesastumist laval.”

Sama ootame ka meie. Kui Teil aga tekkis huvi mõne andmeteaduse või masinõppe projekti osas või sooviksite ise meiega koostööd teha, siis võtke julgelt ühendust: https://stacc.ee/et/kontakt/