Kuidas aitas STACC Muinsuskaitseametil tehisintellekti kasutades museaalide säilivust hinnata?

Kuidas aitas STACC Muinsuskaitseametil tehisintellekti kasutades museaalide säilivust hinnata?

Kas teadsid, et tehisintellekti saab kasutada ka muuseumides? Muinsuskaitseamet tuli välja põneva projektiga kratt Sälli, mille eesmärk on muuta museaalide inventuurid mugavamaks ja kiiremaks. Inventuuri peamine probleem on esemete suur hulk, mistõttu ei jõua muuseumitöötajad neid kõiki põhjalikult üle vaadata. STACC koos oma tipptasemel andmeteadlastega tuli Muinsuskaitseametile appi museaalide säilitamise tehisintellekti looma.

Mis projekt on kratt Sälli?

Sälli on museaalide säilivuse hindaja, mis aitab muuseumitöötajate tähelepanu juhtida museaalidele, mille seisundi peaks füüsiliste omaduste või tiheda kasutuse tõttu eelisjärjekorras üle vaatama, et jõuaks vajadusel planeerida seisundi halvenemist ennetavaid tegevusi. Säilivuse hindaja võiks aidata muuseumidel fikseeritud intervalliga inventuurilt üle minna vajaduspõhisele inventuurile.

Sälli projekti tulemused on välja toodunud International Journal of Conservation Science’i 2023. aasta detsembri väljaandes. Täpsemat infot Sälli projekti tehnilise töö ja masinõppe mudelite kohta saab lugeda järgnevalt lingilt: https://ijcs.ro/volume-14-2023/#Issue4

Mis probleemi Muinsuskaitseamet tahtis, et STACC lahendaks?

Muinsuskaitseameti andmetel kulub ühe museaali inventeerimiseks kahe inimese poolt kokku keskmiselt 19 minutit. Samas peavad muuseumid muuseumiseaduse järgi igat museaali kontrollima reeglina vähemalt korra iga viie aasta tagant. Tulevikus valmivatesse muuseumide ühishoidlatesse planeeritud umbes 2,5 miljoni museaali inventeerimine võtaks teoreetiliselt aega 90 aasta jagu töötunde, mis viie aasta peale jaotatuna tähendab, et pelgalt inventuuride tegemiseks oleks vaja palgata üle 70 täistööajaga inimese.

Ideaalis kuulub inventeerimise juurde lisaks museaali olemasolu ja asukoha tuvastamisele ka selle seisundi ja kahjustuste hindamine ning andmete täiendamine ja parandamine. Vähese inimressursi, suure hulga museaalide ja aeglase, optimeerimata protsessi tõttu jäävad need lisategevused tihti tagaplaanile, mistõttu ei jõuta jälgida museaalide pikaajalist säilimist ega planeerida seisundi halvenemist ennetavaid tegevusi.

“STACC püüdis lahendada museaalide aeganõudvat inventeerimise ja säilivuse hinnangu probleemi. Eesärk ei olnud kohe leida toimivat lahendust, vaid meie jaoks oli oluline kõigepealt analüüsida MuISi andmestikku ning seejärel katsetada võimalikke sobivaid mudeleid. STACC sai sellega väga hästi hakkama. Analüüs tuli sisukas ja järeldustest on palju õppida nii muuseumitel kui Muinsuskaitseametil.”

Janika Turu, Muinsuskaitseameti muuseumide ja kunstipärandi osakonna kunstipärandi nõunik ja Sälli juhtrühma liige

Seoses muuseumide ühishoidlate rajamisega on asjakohane uurida võimalusi inventuuriga seotud tegevuste lihtsustamiseks ja optimeerimiseks. Inventuurile kuluva aja vähendamiseks tuleb esmalt tähelepanu pöörata protsessi pudelikaeladele. Museaali seisundi, kahjustuste ja säilimise adekvaatseks hindamiseks on vaja konservaatori või säilitusspetsialisti teadmisi ning aega, et museaal ettevaatlikult lahti pakkida ja üle vaadata, kuid ajapuuduse tõttu ei jõuta seda tihti teha. Lisaks ei ole kõikides muuseumides vajalike teadmistega spetsialiste. Siinkohal oleks abiks, kui seisundit ja säilivust aitaks hinnata tehisintellekt, võttes arvesse näiteks museaali omadusi ja hoiutingimusi. Seetõttu oli STACCi peamiseks ülesandeks hinnata, kas säilivust prognoosiva tehisintellekti loomine on võimalik ja kas see leevendaks inventuuriga seotud muresid.

Kuidas STACC seda probleemi lahendas?

STACC sai säilivuse prognoosimiseks vajalikud andmed muuseumide infosüsteemist MuIS. “Kogu analüüsi ja mudeldamise aluseks olid museaalidele erinevatel ajahetkedel antud seisundihinnangud, mille põhjal oli võimalik tuvastada seisundi halvenemise toimumine. Suuremal osal museaalidest ei olnud piisavalt pikka ajalugu seisundihinnanguid, et seisundit ajas hästi modelleerida. Samas ei olegi alati vaja teada, mis täpselt on museaali seisund mingil ajahetkel, vaid pigem on oluline, kas museaal on stabiilses seisundis või kas selle seisund võib lähiajal halveneda. Kui museaal on halvas seisundis, aga stabiilne, siis ei ole sellega vaja nii kiiresti tegeleda kui heas seisundis, aga seisundi halvenemise riskiga museaaliga,” seletas STACCi andmeteadlane Meri Liis Treimann. 

Arvestades kasutada olevaid andmeid, materjalides toimuvate protsesside kiirust ja et muuseumid teevad pikaajalisi tööplaane aastaid ette, otsustasime luua masinõppemudeli, mis ennustab, kas museaali seisund võib järgmise 10 aasta jooksul halveneda. Selle jaoks lõime aegread lahti üksikuteks seisundihinnanguteks ja lisasime igale seisundihinnangule sildi (ingl label) ehk tulemuse, mis ütleb, kas sellele hinnangule järgneva 10 aasta jooksul seisund halvenes või mitte. Seejuures ei olnud oluline, kas seisund lihtsalt halvenes või näiteks konserveerimise tõttu vahepeal paranes ja seejärel halvenes. Lisaks seisundihinnangutele kasutasime mudeli treenimisel veel museaali kirjeldavaid omadusi nagu materjal ja dateering ning museaaliga seotud sündmusi nagu näitused ja konserveerimised.

Mis tulemused saadi?

“Halvenemise prognoosimiseks eksperimenteerisime peamiselt erinevate puupõhiste masinõppealgoritmidega nagu otsustuspuu (ingl decision tree), otsustusmets (ingl random forest) ja XGBoost,” ütles Meri Liis Treimann.

Kuna kõige olulisem on üles leida võimalikult palju halvenemise riskiga museaale, siis oli mudeli võimekuse hindamiseks olulisim mõõdik saagis (ingl recall), mis näitab, kui suure osa halvenevatest museaalidest mudel üles leidis. Samas ei piisa vaid saagise kasutamisest: alati halvenemist ennustav mudel leiab üles kõik halvenevad museaalid, kuid selline mudel ei ole praktikas eriti kasulik. Seetõttu võtsime kõrvale täpsuse (ingl precision), mis näitab, kui suur hulk nendest museaalidest, millele mudel halvenemist ennustas, ka tegelikult halvenesid – mida kõrgem täpsus, seda vähem valepositiivseid. 

Mõlemad mõõdikud sõltuvad valitud otsustuslävendist, mis näitab, kui kõrge tõenäosuse juures hakkab mudel ütlema, et tegemist võib olla halvenemisega. Mida madalam otsustuslävend, seda kõrgem saagis, kuid madalam täpsus. Kuna iga mudeli poolt halvenevaks märgitud museaal tähendab, et muuseumitöötaja peaks seda kontrollima minema, siis ei saanud saagise tõstmiseks otsustuslävendit täpsuse arvelt liiga palju langetada. Minimaalseks täpsuseks, mille juures mudeleid võrdlesime, sai 50% ehk halvenevate museaalide leidmiseks ollakse valmis kontrollima kuni kaks korda rohkem museaale.

Kõige paremad tulemused saime otsustusmetsa algoritmi kasutades, mis 50% täpsuse juures suutis tuvastada 92% halvenevatest museaalidest ehk näiteks sajast halvenevast museaalist 92 leidmiseks peaks teoreetiliselt kontrollima 184 museaali.

Kuidas seda edasi kasutatakse?

Pilootprojekti käigus tehtud analüüs ja valminud lahendus on eelkõige sisendiks tulevikus produktsioonikõlbuliku lahenduse loomisele. Eelanalüüsi ja eksperimentide põhjal nägime, et olemasolevates andmetes on potentsiaali seisundi halvenemise prognoosimiseks, kuid andmed vajavad veel täiendamist ja nende peal treenitud mudel ei ole veel piisavalt küps ning kasutajate silmis usaldusväärne, et mudeli alusel täielikult vajaduspõhise inventuuri peale minna.

“Mina näen, et kõige suurem kasu on analüüsi järeldustest ja katsetuste tulemusest saadud teadmistel. Tänu prototüübi katsetamisele avastasime MuISi andmetes kitsaskohti ja saime täpselt aru, millist lünka tuleb nii andmete kvaliteedis kui ka inimeste enda teadmistes täita. Kui need lüngad on täidetud, siis saab loodetavasti järgmiste arendustega edasi liikuda,” kommenteeris Turu. 

Muuseumid ei ole andmeid kogunud masinõppe rakendamise eesmärgil, mistõttu tulid andmeanalüüsi käigus välja mõningad kitsaskohad andmete kvaliteedis nii andmete sisu kui ka sisestamise nurgast. Analüüsi tulemusi saab arvesse võtta nii juba arenduses oleva MuIS 2.0 andmemudeli täiendamisel kui ka muuseumitöötajate koolitamisel andmete sisestamise osas. 

Kokkuvõtteks

Tehisintellekti saab efektiivselt ära kasutada ka traditsioonilistes organisatsioonides. Kuigi andmed, mida ei ole kogutud masinõpet või andmeanalüüsi silmas pidades, ei pruugi olla täielikud või täpsed, võib nende piisava hulga korral siiski kasulikke mustreid leida, mille abil organisatsiooni tööprotsesse ja andmete kogumist parendada.

“Koostöö STACCiga oli väga sujuv ja konstruktiivne. STACCi poolt oli tunda tugevat ja järjekindlat projekti vedamist ning seetõttu tekkis ka usaldus kiiresti. Teadsime, et projekt on asjatundlikes ja kindlates kätes. STACC on hästi usaldusväärne partner ning koostöökogemus oli igati meeldiv, loodame, et kohtume veel järgmisteski projektides,” kommenteeris Turu.

Märksõnad: Muinsuskaitseamet, kultuuripärandi säilitamine, muuseum, museaal, otsustusmudel, juhuslik mets