Pilotversejā daīmams latgalīšu tezaurs – paleigs sevkuram, kas pietej, roksta ci skaita tekstus latgaliski
Rokstu sagataveja: Laura Spundere, portals lakuga.lv
14. decembrī Latvejis Nacionalajā bibliotekā tyka prezentāta pilotverseja latgalīšu volūdys tezauram aba digitalajai vuordineicai. Kai stuosta projekta izstruoduotuoji, pilotverseja ir daīmama sevkuram lītuotuojam, tok niu ir svareigi saprast, cik lels ir pīprasejums i kai iz prīšku apkūpuot informaceju lītuotuojam piec īspiejis draudzeigā veidā, tok reizē napagaisynuot zynuotnyskumu. Prezentacejis pasuokumā varēja izzynuot vaira ari par projekta aizsuokumim, niulejū stadeju i planim iz prīšku.
Dorbs pi tezaura aizsuokts 2022. gods golā Vaļsts pietejumu programys “Digitālās humanitārās zinātnes” projektā. Vuordineicā tyka īkļauti vuordi, kas atlaseiti nu Myusu dīnu latgalīšu tekstu korpusa (MuLa 2022), nūsokūt bīžuok lītuotūs i nu latvīšu literaruos volūdys atškireigūs vuordus. Sovpus piečuok projekta komandai tyka īdūta “smiļšu kaste” aba tezaura platforma, kur pasaruodeja vareiba likt kluot sinonimus, stabilus vuordu savīnuojumus, tymā skaitā frazeologismus.
Kotram latgalīšu tezaura vuordam kluot dalykta atsauce iz primarajim olūtim, par pīmāru, izmontuoti taidi olūti kai latvīšu–leitovīšu–latgalīšu vuordineica “HipiLatLit”, Pītera Stroda vuordineica, Valentina Lukaševiča, Ontona Slišāna, Andryva Jūrdža leksika i cyti olūti.
Pilotversejis attaiseišona lītuotuojam ļaun dreižuok vierzeitīs iz piļneiguoku vuordineicu, atbiļdēt iz daudzim vēļ naatbiļdātim vaicuojumim. Pilotprojektā niu ir 455 škierkli, kas deļ tezaura ir cīši moz, tok projekta eistynuotuoju mierkis ir lels – īkļaut vuordineicā vysus volūdā eksistejūšūs vuordus.
“Muoksleiguo intelekta laboratoreja ar latvīšu volūdu nūsadorboj jau cīši seņ. Ideju, ka platformu varātu pīlāguot ari deļ latgalīšu volūdys, nu kolegu dzierdieju jau pyrma 10 godu, i vysleidz nazkai tai sakryta, ka beja daīmami i datoriki, i reiki, i gribiešona, tok datryuka cylvāku, kuri varātu paleidzēt ar latgalīšu volūdys gramatiku, kab byutu vareiba saprast tū, kū poši varbyut da gola naizprūtam. Itymā projektā cīši labi salyka vysys komponentis – myusu entuziasms par volūdys reikim i cylvāki, kuri eistyn zyna, kaida ir latgalīšu volūda, kai tei ir juolītoj, kai juoroksta i tamleidzeigi. Maņ pošai juopīzeist, ka koč ari maņ beja daīmama, pīmāram, profesoris Leikumys gruomota “Vasals” i profesoris Nikolis Nauys gruomota par latgalīšu gramatiku, nikas napaleidz tik labi, kai aizdūt vaicuojumus eistam cylvākam, kurs puorzyna itū volūdu,” stuosta LU Matematikys i informatikys instituta Muoksleiguo intelekta laboratorejis puorstuove Lauma Pretkalniņa, kura projektā īt tolkā pi vuordu lūceišonys paradigmu izstruodis.
Projekta škierkļu autore i atbiļdeiguo redaktore Antra Kļavinska stuosta, ka vīns nu projekta leluokūs izaicynuojumu ir gryuteibys daļai vuordu atrast pamata variantu aba pamatvuordu. “Par pīmāru, vuords “agrysta”/”agrosts” – gryuši saprast, kura vuorda forma byutu līkama kai škierkļa pamata forma. Tok labi, ka tezaurs ir digitals reiks, mes sevkurā laikā varim lobuot klaidys, taipoš ari uzlobuot sistemys kūpejū darbeibu. Tezauru niu var izmontuot vysi, kuri jau roksta, voi tī, kuri grib suokt raksteit var pameklēt kaidu gramatiskū formu, kū īsoka vuorda paradigma.”
“Muns pādejais pietejums beja par vuordu “buļbe”, munā pusē gon soka cytaižuok – veirīšu dzimtē “buļvs”, itys maņ beja eistyns atkluojums, cik daudzi ir variantu, kai var pasaceit vīnu vuordu. Taipoš ari saisteitī vuordi – vīnā vītā “kaš”, cytā buļbys “rūk”, cytā “losa”. Saprūtams, gryušuokī škierkli ir tī, kur tryukst informacejis, ari, vaicojūt informaceju asūšajuos vuordineicuos, tuos vīnkuorši nav, tod saīt pošam nu tekstu atlaseit informaceju i raudzeit paskaidruot vuorda nūzeimi,” škierkļu raksteišonys pīredzē doluos Antra Kļavinska.
Antra Kļavinska ari pīzeist, ka niu ir gryuts prognozēt, cik daudz škierkļu izadūs pīvīnuot da projekta beigu, tok jei pastreipoj, ka projektu gona drūsai var saukt par “nabeidzamū stuostu”, taipoš ari ar latvīšu tezauru dorbs nikod nasabeidz. “Īspiejams, nuokušajā versejā īkļausim vaira audio, kuri niu ir daīmami tik daļai nu škierkļu.”
Latgalīšu tezaura projektu eistynoj Rēzeknis Tehnologeju akademejis pietnīki sadarbeibā ar LU Muoksleiguo intelekta laboratorejis puorstuovim. Projekta komanda: Anna Briška (tehniskuo sekretare i škierkļu autore), Antra Kļavinska (škierkļu autore i atbiļdeiguo redaktore), Sanita Martena (škierkļu autore i redaktore), Nikole Naua (škierkļu autore i redaktore), Ilga Šuplinska (škierkļu autore i redaktore), vuordu lūceišonys paradigmu izstruode: Lauma Pretkalniņa, Kristīne Pokratniece, Pēteris Paikens, Tēzaurs.lv platformys pīlāguošona: Mikus Grasmanis, Pēteris Paikens.
Projekta eistynuotuoji aicynoj sevkuru lītuotuoju aktivi īsasaisteit, izmontuot jaunū platformu i snēgt sovus īsacejumus caur Tezaurs īspieju “ziņot” voi sasazynuot, rokstūt iz ltg.tezaurs@rta.lv.
Fotogalereja: latgalīšu tezaura, pīminis i atkluošmu gruomotys “Vitolds Valeiņs: personeiba i dorbi” prezentacejis, kai ari Lidejis Leikumys jubilejis pasuokums Latvejis Nacionalajā bibliotekā. Foto Edeite Laime/ portals lakuga.lv
Komentari