Valikko
Pohjoismaista “pienten” kielten kieliteknologiaa
Suomen perinteisistä vähemmistökielistä Pohjoismaissa on tehty kieliteknologityötä saamen kielten, karjalan kielen ja romanikielen parissa. Valtaosa työstä on tehty Norjassa (Divvun- ja Giellatekno-ryhmät). European Language Equalityn (ELE) raportin (2021, https://www.diva-portal.org/smash/get/diva2:1713445/FULLTEXT01.pdf) mukaan tutkijat ovat kehittäneet saamen kielten kieliteknologiaa 1990-luvulta lähtien. Vuonna 2004 Norjassa aloitettiin vakava kehitystyö saamen loppukäyttäjätyökalujen toimittamiseksi. Työkalut ja mallit on kehitetty äärellisiin transduktorien eli äärellistilaisten automaattien (Beesley & Karttunen 2003) avulla, ja myöhempään kehitykseen on kuulunut myös konekäännöstekniikkaa Apertiumista ja VislCG3-kielioppia (Constraint Grammar) käyttäviä työkaluja. Saamen kielistä paras resurssitilanne on pohjoissaamella. Karjalan kielelle on Norjassa (GiellaLT) ja Suomessa Koneen Säätiön rahoituksilla kehitetty leksikaalisia resursseja, kielimalleja ja kielioppeja sekä kokeellinen oikolukuohjelma.

Romanikielen kieliteknologia on Pohjoismaissa yhä pioneerityötä; Norjassa on kehitetty kokeelliset kielimallit kalderaš-murteelle ja Norjan matkustavaisten kielimuodolle sekä suunniteltu yhdessä Ruotsin ISOF:in kanssa arli-murteen korjausohjelmaa. Suomessa kieliteknologiatyö Suomen romanikielen parissa on oikeastaan vasta nyt pääsemässä tosissaan alkuun.