Skip links

Valikko

Pohjoismaista “pienten” kielten kieliteknologiaa

Suomen perinteisistä vähemmistökielistä Pohjoismaissa on tehty kieliteknologityötä saamen kielten, karjalan kielen ja romanikielen parissa. Valtaosa työstä on tehty Norjassa (Divvun- ja Giellatekno-ryhmät). European Language Equalityn (ELE) raportin (2021, https://www.diva-portal.org/smash/get/diva2:1713445/FULLTEXT01.pdf) mukaan tutkijat ovat kehittäneet saamen kielten kieliteknologiaa 1990-luvulta lähtien. Vuonna 2004 Norjassa aloitettiin vakava kehitystyö saamen loppukäyttäjätyökalujen toimittamiseksi. Työkalut ja mallit on kehitetty äärellisiin transduktorien eli äärellistilaisten automaattien (Beesley & Karttunen 2003) avulla, ja myöhempään kehitykseen on kuulunut myös konekäännöstekniikkaa Apertiumista ja VislCG3-kielioppia (Constraint Grammar) käyttäviä työkaluja. Saamen kielistä paras resurssitilanne on pohjoissaamella. Karjalan kielelle on Norjassa (GiellaLT) ja Suomessa Koneen Säätiön rahoituksilla kehitetty leksikaalisia resursseja, kielimalleja ja kielioppeja sekä kokeellinen oikolukuohjelma.

WP1: European Language Equality – Status Quo in 2020/2021, sivu 28.

Romanikielen kieliteknologia on Pohjoismaissa yhä pioneerityötä; Norjassa on kehitetty kokeelliset kielimallit kalderaš-murteelle ja Norjan matkustavaisten kielimuodolle sekä suunniteltu yhdessä Ruotsin ISOF:in kanssa arli-murteen korjausohjelmaa. Suomessa kieliteknologiatyö Suomen romanikielen parissa on oikeastaan vasta nyt pääsemässä tosissaan alkuun.

Käytämme sivustollamme evästeitä kehittääksemme käyttökokemusta ja tarjotaksemme sinulle kiinnostavaa sisältöä. Käyttämällä palvelua hyväksyt evästeiden käytön.