Tekstidest automaatselt teemade tuvastamine

Kliendivestluste analüüs jõuab üsna kiiresti olukorrani, kus on vaja kiiresti tuvastada tekstist enamlevinud teemad, fraasid. Käsitsi seda teha ei taha (kellel oleks aega tuhendeid tekste lugeda ja teemasid välja noppida). Selleks olen eksperimenteerinud erinevate lahendustega, alates klassikalisest LDA-st kuni suurete keelemudeliteni (LLM-d). Sellel teemal olen kirjutanud oma viimase magistritöö

Avaliku näitena on kättesaadav Riigikogu stenogrammide analüüs, kus olen automaatselt tuvastanud enamelvinud teemad.