Kas oled pargis või metsas jalutades kuulnud linnulaulu ja mõelnud, mis lind küll nii ilusti laulab? STACC ja Lapponica on üheskoos välja töötanud võimeka linnulaulude tuvastamise rakenduse, mis võimaldab salvestada linnulaulu ning tuvastab, millisele linnule see kuulub.
Lapponica eesmärk on luua kvaliteetne lindude tuvastamise rakendus, mis suudaks linde eristada nende laulu põhjal. Seejuures tuleb märkida, et laululindude laulud on sageli väga sarnased ning isegi kogenud linnuhuvilistel on tihti raske neid eristada. Seetõttu ongi Lapponica visioon “olla nr 1 abimees kõigile linnuhuvilistele ning aidata kaasa lindude uurimisele ja seeläbi lindude kaitsmisele,” sõnas Lapponica üks asutajatest Janari Lage. Kuulake laululindude laule siit:

Miks on linnulaule nii raske ära tunda?

Olemasolevad linnulaulude tuvastamise rakendused pole lindude äratundmisel olnud nii täpsed, kui paljud ornitoloogid sooviksid. Lapponica asutajate Janari Lage ja Tanel Liiva eesmärk on seda parandada ja tuua turule rakendus, mis suudaks linde nende laulu järgi täpselt tuvastada.
“Ettevõtte missioon on kasvatada inimeste loodusteadlikkust, tõsta seeläbi looduses viibimise kvaliteeti ning anda inimestele mugav ja tänapäevane viis saamaks teada, mis lind õues laulab,” kommenteeris Lage. Lisaks ettevõtte loodushuvi äratavale missioonile on tal ka väga omapärane nimi Lapponica, mis tuleneb linnu vöötsaba-vigle ladinakeelsest nimetusest Limosa Lapponica, lisas Lage.

Kuidas aitasid STACCi andmeteadlased linnulaulude tuvastamise rakendust arendada?

Projekti praeguses etapis tegeles STACC ainult Inglismaal elavate linnuliikidega, kelle kohta oli Euroopas vähemalt 100 helisalvestist. Isegi valim 100 lindistust linnu kohta on hästi toimiva süvaõppe mudeli väljatöötamiseks üldiselt liiga vähe. “Meie eesmärk oli siiski kaasata võimalikult palju linnuliike ja 100 andmepunkti on meie hinnangul selleks absoluutne minimaalne piir,” kommenteeris STACCi andmeteadlane Kadri Künnapuu.

Kust saadi mudeli väljatöötamiseks piisaval hulgal linnulaule?

Linnulaulude lindistused saime avalikust andmebaasist. Selles andmebaasis saavad kõik huvilised oma lindistused ise üles laadida ja märkida, millised linnud laulavad. Samuti on võimalik juurde lisada muud asjakohast teavet, näiteks riik või täpsem asukoht, kus salvestis tehti ning selle kuupäev.
Kahjuks on sel viisil kogutud andmete kvaliteet madalam ning seda nii kehvema helikvaliteedi kui ka valesti määratud linnuliikide tõttu. Täiuslikus maailmas oleksid kõik heliklipid müravabad ja sisaldaksid ainult üleslaadija loetletud lindude laulu. Siiski on andmekvaliteedi probleemid sageli oluline tegur, miks masinõpe ei anna oodatud tulemusi, lisas Künnapuu.

Tulles tagasi STACCi loodud mudeli juurde, siis kuidas ikkagi õpetada arvutit linnulaulu tuvastama?

Kõige võimsam meetod sellise ülesande lahendamiseks on tehisintellektil põhinevate tehnoloogiate nagu tehisnärvivõrkude kasutamine. Me ei õpetanud arvutit otse helifailidega vaid viisime helid visuaalsele kujule, teisendades need mel-i sagedusel põhinevateks spektrogrammideks. Mel-i spektrogrammid tähistavad pilte, kus on kujutatud helisagedusi (y-telg) läbi aja (x-telg) (joonis 1).

Joonis 1. Esimesed 15 sekundit Kanada lagle laulust  https://www.xeno-canto.org/319686

Kui õpetame mudelit failidega, mis sisaldavad ainult ühe linnu laulu, on selle täpsus silmapaistev. Sellegipoolest on mudel hea ainult nendes olukordades, kus korraga laulab ainult üks lind. Kui aga korraga laulavad mitu lindu, tekivad probleemid. Kuna mitme linnu korraga laulmine on looduses üsna tavaline, on oluline seda mudeli väljatöötamisel arvesse võtta. See tähendab, et mudeli treenimisel tuleb kasutada ka helifaile, kus laulab mitu lindu läbisegi, kellest igaüks on ka märgistatud. Siinkohal tekivad taas probleemid andmete kvaliteediga, sest sageli märgistatakse vähem linde, kui neid lindistuses tegelikult laulab. Mitme märgisega andmetega mudeli treenimisel on mudeli üldine täpsus madalam, kuid see saab paremini hakkama mitme samaaegselt laulva linnu tuvastamisega.

Närvivõrgu mudel, mis tunneb ära linnulaulud

STACCi andmeteadlased töötasid välja välja kunstlikel närvivõrkudel põhineva mudeli, mis suudab 220 linnuliigi laulu hea täpsusega ära tunda. Mudeli täpsus sõltub muidugi suurel määral laulvast linnust. Mõne linnu puhul arvab mudel peaaegu iga kord õigesti, teisi on raskem ära tunda. “Seda mõjutab enamasti kui palju helisalvestisi ühe linnu jaoks mudeli treenimisel kasutada sai. Rohkem andmeid viib tavaliselt ka parema täpsuseni,” kommenteeris Künnapuu.
Lapponica sai hästi toimiva närvivõrgupõhise mudeli, mis võimaldab tuvastada Inglismaalt pärit 220 linnuliigi laule. “Saime kinnituse, et AI abil on võimalik lindude hääli väga heade tulemustega tutvastada,” sõnas Janari Lage. Nüüd on Lapponica ühe sammu võrra lähemal maailma parima linnutuvastuse rakenduse loomisele! Lapponica tulevikuplaan on mudeli edasiarendusse kaasata linnuliike kogu maailmast.

Kokkuvõtteks 

STACCi andmeteadlaste poolt välja töötatud mudel võimaldab Lapponical luua suurepärase linnulaulude tuvastamise rakenduse. Kui rakendust veel natuke täiendada, on tegemist juba väga konkuretsivõimelise linnutuvastuse äppiga, mida saab kasutada kogu maailmas.
Püsige uue linnulaulu rakenduse lainel! Seni, kuni Lapponica viimaseid viimistlusi teeb, kuulake linnulaule siit:

Kui Teil tekkis huvi mõne andmeteaduse või masinõppe projekti kohta või sooviksite ise meiega koostööd teha, siis võtke julgelt ühendust!