University of Helsinki Department of Computer Science
 

Department of Computer Science

Department information

 

582487 Tiedon tiivistämisen tekniikat (4 op)

Taso

Kurssi on algoritmien ja koneoppimisen linjan valinnainen syventävä opintojakso.

Ennakkovaatimukset

Kurssilla sovelletaan Merkkijonomenetelmien tekniikoita tiedon tiivistämiseen. Tämän vuoksi etenkin indeksirakenteisiin (loppuosapuu / loppuosataulukko) liittyvät perusteet oletetaan tunnetuiksi edeltävältä kurssilta. Todennäköisyyslaskennan perusteista on myös hyötyä informaatioteorian alkeiden ymmärtämiseksi sekä algoritmien tiivistystulosten analysoinneissa.

Järjestäjät

Luennoija Veli Mäkinen,
Assistentti Niko Välimäki

Uutisia

Kurssin arvostelu on valmistunut. Palautetilaisuus 12.12 klo 11.15-12:00 B230. Pisteytyksen periaatteet löytyvät täältä.

Luennot: 28.10.-04.12. TI, TO 12-14 B222

Harjoitukset: 03.11.-05.12. TO 10-12 C221

Koe: TI 09.12. 9-12 A111

Poikkeukset: Ensimmäinen harjoitus on siirretty pidettäväksi 4.11 TI 10-12 C221. Francois Nicolas pitää torstain 30.10 luennon. Jarkko Toivonen pitää laskuharjoitukset 2 ja 3.

Englanninkielinen kurssimoniste on myytävänä Yliopistopainossa, Exactum 1. kerros (hinta 5 euroa). Moniste on päivitetty kevään 2006 kurssille. Kurssin sisältö noudattelee suurelta osalta monistetta, joskin materiaalia täydentää syksyn aikana päivittyvät Powerpoint-kalvot.

Kurssiin liittyvien tiivistysmenetelmien implementointeja löytyy (kurssin edetessä) kurssiwikistä.

Kuvaus

Ensimmäinen osa kurssia kattaa vakiintuneet tiedon tiivistyksen tekniikat kuten Huffman koodauksen aritmeettisen koodauksen, Lempel-Ziv jäsennyksen, PPM:n, Burrows-Wheeler muunnoksen, ja kokonaislukukoodit. Painotus on algoritmeissa: miten tiivistää/purkaa tietoa tehokkaasti. Tiivistystulosten analyysien ymmärtämiseen vaadittava matemaattinen tausta käydään myös läpi. Tämä johdattaa käsitteisiin tiivistyvyys, tiivistymättämyys, entropia, ja Kolmogorov kompleksisuus. Toinen osa kurssia keskittyy uuteen tiedon tiivistyksen osa-alueeseen - tietorakenteiden tiivistämiseen. Tämä uusi osa-alue on syntynyt erityisesti laajamittaisten sekvenssianalyysiongelmien tarpeisiin bioinformatiikassa: opimme kurssilla miten suosittu tietorakenne, loppuosataulukko, voidaan esittää samassa tilassa kuin tiivistetty sekvenssi. Tämä tulos rakentuu kurssin ensimmäisen osan tekniikoiden päälle, sekä muutamaan hyödylliseen erityisesti tietorakenteiden tiivistykseen kehitettyyn tekniikkaan, joita käytetään myös usean muun tietorakenteen tiivistämiseen. Kurssin lopuksi käsitellään myös opittujen tekniikoiden sovelluksia (häviämättömässä) kuvan tiivistyksessä.

Kurssin suoritus

Kurssikoe järjestetään tiistaina 9.12 klo 16-20 salissa A111 ((alustava tieto). Kokeesta saa maksimissaan 60 pistettä. Aktiivinen osallistuminen harjoitukseen tuo maksimissaan 6 ylimääräistä pistettä (25%->1p,37.5%->2p,50%->3p,62.5%->4p,75%->5p,87.5%->6p). Arvostelu perustuu kokonaispisteisiin.

Aikataulu (alustava)

Viikko Päivä MonisteAiheLisätietoa
44TI 28.101.1.1, 2.1.1, 2.1.2Esittelyluento, taustaa, yksinkertaiset koodaukset, entropia, kokonaislukukoodit, käänteisindeksi
44TO 30.101.1.2, 2.1.3, 2.1.4Alkuosakoodit, Kraftin epäyhtälö, häviöttömän koodauksen teoreema, Shannon-Fano koodaus, Huffman koodausLuennot 1-2 (.ppt) Pdf
45TI 4.11Harjoitus 1Tehtävät Mallivastaukset
45TI 4.112.1.5-2.1.7Huffman koodauksen implementointi, Huffman koodauksen analyysi, Adaptiivinen Huffman
45T0 6.112.1.8Aritmeettinen koodausLuennot 3-4 (.ppt) Pdf
46TI 11.111.1.3-1.1.5, 2.2Kolmogorov kompleksisuus, tiivistymättömyys: alaraja järjestämiselle. Lempel-Ziv menetelmä, LZ77 koodaus loppuosapuulla, LZ78Loppuosapuun online konstruktio
46TO 13.11Harjoitus 2Tehtävät Mallivastaukset
46TO 13.112.2,1.1.1,2.3Lempel-Ziv menetelmien analyysi, k-nnen asteen entropia, staattinen PPMLuennot 5-6 (.ppt)Pdf
47TI 18.112.3,2.4,Adaptiivinen PPM, Burrows-Wheeler muunnos
47TO 20.11Harjoitus 3Tehtävät Mallivastaukset
47TO 20.112.4 - 2.4.2Burrows-Wheeler muunnoksen implementointi ja tiivistyvyyden analyysi, tiivistyksen kiihdytysLuennot 7-8 (.ppt) Pdf
48TI 25.113.1, 3.2Johdatus tietorakenteiden tiivistykseen: bittivektorit ja binääripuut, wavelet puu
48TO 27.11Harjoitus 4Tehtävät Mallivastaukset
48TO 27.113.3, 3.4.1Tiivistetty loppuosataulukko, takaperinhaku, itseindeksitLuennot 9-10 (.ppt) Pdf
49TI 2.12- (uusi asia, vain kalvoilla)Tunnistekoodaus, implisiittinen tiivistyksen kiihdytysLuento 11 (.ppt) Pdf
49TO 4.12Harjoitus 5Tehtävät Mallivastaukset
Koeaika väärin ilmoitettu tehtäväpaperissa, ks. oikea aika alla
49TO 4.121,2.1.3, 2.2.3,3.1-3.3,4.1.1, 4.1.2Johdatus kuvan tiivistykseenPasi Fräntin kuvan tiivistyksen luentomoniste
50TI 9.12Koe 9-12 A111Huom:Koe onkin aamulla, eikä illalla kuten aiemmin ilmoitettiin.
3/09PE 16.1.2009Uusintakoe 16-20 A111Alustava tieto, tarkista täältä. Laskaripisteet otetaan huomioon tässäkin kokeessa.


Veli Mäkinen
Last updated 11.12.2008
>