Tekstiandmete statistiline analüüs

Suur osa uudistesaitide andmetest on teksti kujul. Erinevalt numbritest ei saa teksti liita, lahutada ega korrutada. Samal ajal on suurte tekstide statistiline analüüs vajalik suundumuste leidmiseks, kontekstide tuvastamiseks, dokumentide klassifitseerimiseks jne. STACC pakub koostöös oma spin-off-ettevõttega TEXTA lahendusi teksti analüüsimiseks, klassifitseerimiseks ja visualiseerimiseks.

Isikuandmeid sisaldavate dokumentide tuvastamine

Uudistesaidid töötavad igapäevaselt isikuandmetega, kuid need andmed eksisteerivad väga erinevates vormingutes (SQL -andmebaasid, Word, Excel, PDF jne). Muudetud isikuandmete kaitse üldmääruse kontekstis peab organisatsioonidel olema selge ülevaade sellest, millised dokumendid sisaldavad isikuandmeid. STACC on aastate jooksul välja töötanud eestikeelsete tekstide jaoks anonüümseks muutmise lahenduse, mis tuvastab, kas tekst sisaldab konkreetsele isikule viitavaid tunnuseid (nimi, isikukood, aadress jne).