Harjoitustyön palautuslomake. Deadline siis pe 14.5. keskiyöllä.
Harjoitustyö tehdään 4-5 hengen ryhmissä. Ryhmät kootaan 1. harjoituksissa. Jos et pääse tuolloin paikalle, ota yhteyttä Juha Makkoseen. Kukin ryhmä ilmoittaa kokoonpanonsa ja ainakin yhden yhteyshenkilön sähköpostiosoitteen Juhalle.
Kukin ryhmä valmistautuu esittelemään työtään ja tuloksiaan viimeisillä harjoituskerroilla (6.-7.5.).
Harjoitustyön raportin on oltava valmis viimeistään pe 14.5. keskiyöllä. Jokainen myöhästymispäivä vähentää pisteitä 2 pisteellä. Maksimipistemäärä harjoitustyöstä on 15 p.
Ryhmä sopii (löyhästi) jostakin aihepiiristä, josta kootaan dokumenttikokoelma (ks. seuraava kohta).
Kukin ryhmän jäsen kerää 10 aihepiiriin liittyvää dokumenttia esim. webistä. Käytettävän mg-hakukoneen takia dokumenttien kannattaisi olla englanninkielisiä.
Dokumentit talletetaan mg-hakukoneella, jolloin voidaan käyttää mg:n omaa kyselyliittymää. Lisää tietoja mg:stä alla.
Kukin ryhmän jäsen keksii kaksi hakutehtävää.
Kustakin hakutehtävästä muotoillaan kaksi kyselyä:
Boolen lauseke (vastauksena dokumentit, jotka täyttävät lausekkeen kuvaamat ehdot)
joukko termejä eli ns. vektorimallin kysely (vastauksena järjestetty lista hakutuloksia)
Ryhmä arvioi kokoelman dokumenttien relevanssin hakujen suhteen. Kullekin haulle tehdään vähintään 3 riippumatonta arviota.
Kyselyt ajetaan mg-kyselyliittymällä.
Kaikille hakutuloksille lasketaan saanti ja tarkkuus. Kun tuloksena on järjestetty lista, lasketaan ja piirretään saanti-tarkkuus -käyrä (keskiarvokäyrä).
Työstä laaditaan raportti HTML-dokumenttina. Raportin pitäisi sisältää allaolevat asiat. Raportin ei tarvitse olla kovin laaja ja monisanainen, mutta kukin mukaanotettu asiakokonaisuus pitäisi esitellä lyhyesti (kokonaisilla lauseilla). Raportin "palautuksesta" annetaan ohjeet myöhemmin.
Dokumenttikokoelman kuvaus, esim. dokumenttien määrä ja aihepiiri, sanojen määrä yhteensä (saa mg:n tilastoista) sekä dokumenttien keskimääräinen pituus.
Hakutehtävät ja kyselyt.
Kokemukset relevanssiarvioiden antamisesta: olivatko arvioijat samaa mieltä?
Hakutulosten esittely (lukumäärä, saanti, tarkkuus...)
Luonnehdinta eroista tulosten käyttökelpoisuudessa eri kyselytyypeillä.
Kukin ryhmä saa harjoituksissa kopion kirjan Managing Gigabytes (2. painos) liitteestä A: Guide to the mg System.
Hakukoneen voi ladata MG-kirjan websivulta http://www.cs.mu.oz.au/mg/ ("The current version of the software, mg-1.2.1")
Lisää tietoa mg:stä löytyy sivulta MG Pages: http://www.mds.rmit.edu.au/mg/ .