Peruskartasta kielioppiin ja tietojenkäsittelystä suomen kieleen
Antti Leino väitteli
Antti Leino väitteli 2.3. aiheesta "On Toponymic Constructions as an Alternative to Naming Patterns in Describing Finnish Lake Names", eli paikannimikonstruktioiden käyttäminen nimeämismallien sijasta Suomen järvinimistön kuvaamiseen. Väitöskirjassaan Antti käytti laskennallisia menetelmiä nimistöntutkimukseen. Väitöskirja on poikkitieteellinen: assistenttimme Antti aloitti sen tietojenkäsittelytieteen alaan kuuluvana, mutta lopulta se tarkastettiin suomenkielen laitoksella.
Antti valmistui maisteriksi laitokseltamme 1997, ja vaihtoi samoihin aikoihin työpaikkaa yliopiston atk-keskuksesta Kotimaisten
kielten tutkimuskeskuksen (Kotus) atk-yksikköön. Siellä ei ollut aikaa tehdä väitöskirjaa, joten 2002 Antti pyysi tutkimusvapaata ja otti yhteyttä Heikki Mannilaan. Käynnistymässä olleesta HIITistä löytyi töitä jatko-opiskelijalle. Pari vuotta myöhemmin Antti vaihtoi pääaineekseen suomen kielen ja sai tktl:lta assistentuurin.
|
Karonkassa. Käpistelijät lahjoittivat Antille lisää karttoja.
Kuva Pekka Niklander
|
Tieteiden välissä
Väitöskirjatutkimus liikkuu kolmen alan rajamailla: tietojenkäsittelytieteellisen paikkatiedon louhinnan, nimistöntutkimuksen ja kognitiivisen kielentutkimuksen. Kartalla paikannimet esitetään pisteinä. Data-analyysillä etsittiin aineistosta spatiaalisten pistejoukkojen yhteisesiintymäsääntöjä - eli minkälaisia yhdenmukaisuuksia löytyy siitä, millaiset nimet hakeutuvat toistensa lähelle keskimääräistä useammin.
- Yhdistelin tiedon louhinnan ja spatiaalisen tilastotieteen työkaluista sellaisia, jotka purivat aineistoon. Paikkatietotyökalujen tekeminen nimistön vaihtelun tutkimukseen oli alkuperäinen suunnitelma, mutta työn alussa koetulokset olivat sen verran kiinnostavia, että alkuperäisestä koejärjestelystä tuli varsinainen työ, Antti kertoo.
- Aihe on vaatinut aika laajaa metodiopiskelua ja aiheuttanut kroonista identiteettikriisiä. Ei tätä olisi saanut tehtyä suomen kielen eikä tietojenkäsittelytieteen putkitutkinnon pohjalta.
Antin väitös osaltaan laajentaa laitoksen tiedon louhinnan karttaa kielitieteisiin.
-Kotuksella alkaa olla niin paljon digitaalisia aineistoja, että ehkä täältäkin löytyy kiinnostusta niihin, Antti toteaa.
Murrealueita Antti, Marko Salmenkivi ja Saara Hyvönen ovatkin tutkineet tiedon louhinnan menetelmien avulla Suomen murteiden sanakirjan aineiston pohjalta. Suomen murteiden karttoja on digitoitu Kanadassa Sheila Embletonin tutkimusryhmässä, joka yhdistää soveltavaa matematiikkaa ja kielitiedettä. Ryhmä on tehnyt vastaavaa työtä myös romaniasta - murteentutkimuksen sovellukset eivät ole kieliriippuvaisia.
Mitä tohtori aikoo tehdä seuraavaksi?
- Minulla on assistentuuri laitoksella vielä yli kaksi vuotta, joten sen ajan voin oikeastaan tehdä ihan mitä huvittaa, Antti naurahtaa.
- Sen jälkeen suunnitelmissa olisi siirtyä takaisin Kotukseen taustavirkaan. Tarkoitus on seuraavan parin vuoden aikana koittaa jatkaa kieliaineistojen louhintaa niin pitkälle, että yhteistyö ei katkea, vaikka lähdenkin taas Kotukseen. Identiteettikriisi jatkuu sikäli, että kummastakaan laitoksesta en mielelläni päästäisi ihan lopullisesti irti.
- Kotus on myös kieliaineistotalo, jonka yksi keskeinen osaamisalue suhteessa yliopistojen suomen laitoksiin on se, miten sähköisestä aineistosta saa jotain irti, tuore tohtori kertoo.
Sanna Kettunen |