Baayenin kirja "Analyzing Linguistic Data" on nyt saatavilla sekä yliopiston kirjastosta että opettajalta. Opettajalta kirjan ovat lainanneet Edita, Juha ja Maija ja opettajalla on jäljellä vielä yksi vapaa kappale. Kirjan saa myös elektronisena kirjana (ostaa) sekä luonnos-PDF:nä kirjoittajan kotisivun kautta.

Lähiopetuskerta 14.12.

 • Harjoitustöiden eräpäivä. Harjoitustyö palautetaan PDF-dokumenttina opettajan sähköpostiosoitteeseen anssi.yli-jyra@...

Lähiopetuskerta 7.12.

 • Kurssin loppu käytetään tiedon syventämiseen ja harjoitusraporttien parantamiseen.
 • Harjoitustöiden esittelyä. Luulen että n. 10 + kommentit 5min olisi hyvä tahti, mutta lopullinen aikamäärä on kiinni siitä montako muuta esitystä tulee. Myös Maija, Erkki, Juho ja Edyta ovat luvanneet esitellä työnsä tilannetta eli 5*15 = 75min. Tilanne elää vielä.

Lähiopetuskerta 30.11.

 • Kurssin loppu käytetään tiedon syventämiseen ja harjoitusraporttien parantamiseen.
 • Harjoitustöiden esittelyä.

Lähiopetuskerta 23.11.

 • Yritetään ymmärtää Baayenin lukua 4.
 • Kertausta:
  • normaalijakauma, t-jakauma, khii-neliö-jakauma, diskreetit jakaumat, binomijakauma, Poissonin jakauma
  • normaalijakauman keskiarvo (myy) ja -hajonta (sigma)
  • satunnaismuuttuja, jakaumaoletus, otos, otoskeskiarvo, vapausaste, normalisointi
  • nollahypoteesi
  • testisuure, z-score (z-arvo, standardiarvo, Wikipedia-artikkeli "z-score" on käyttökelpoinen), t-score,
  • significance level (Baayenin 4. luku), p-value (Wikipedia-artikkeli "p-value" on käyttökelpoinen), testisuureen ja p-arvon suhde, confidence interval, tilastollinen päättely, tyypin I/II virheet
 • Kertausta:
 • Aloitetaan töiden esittelykertojen jakaminen

Lähiopetuskerta 16.11.

Kartoitetaan harjoitustyötilanne ja harjoitustöiden tekemisessä kaivattava osaaminen.

tekijä aihe aineisto tutkimuskysymys nollahypoteesi testi(t) tiedon tarve opettajan kommentti
Juha D Hound of Baskervilles Miten virkkeiden pituus vaihtelee? Onko teksti homogeeninen? Virkkeiden pituudet jakautuneet normaalisti t-testi jaksottain    
Juho C Euroopan parlamentin fi-en rinnakkaiskorpus Onko englanninkielisessä lauseessa enemmän sanoja verrattuna suomenkieliseen. Sanoja on enemmän      
Lari E kirja Project Gutenbergistä          
Edyta oma Puolalaista nykykirja ja käännös puolan aspekti ja suomen partitiivi aspekti ei käänny      
Leo oma Brownin korpus: presidenttien virkaanastujaispuheita sana- ja lausepituuksien jakaumien erot eroa ei ole      
Erkki oma espanjankielinen IRC-korpus äänteen venyttäminen chatissa C:n ja V:n venyttämisessä ei eroa      
Antoine C Hound of Baskervilles ja sen käännös virkkeiden pituuden säilyminen käännöksessä virkkeiden pituus ei säily korrelaatio, Spearmanin testi   Esikäsittely hyvin kuvattu. Syvennä jakauman muodosta kertomaasi (Baayen luku 3). Syvennä korrelaation käsitettä ja sen merkityksen tulkintaa käyttäen Baayenin kirjan lukua 4. Viimeistele palatuskuntoon.
Maija B laadullinen HKV-aineisto genren suhde muihin laadullisiinmuuttujiin mikään muuttuja ei toimi genren luokittelijana ristiintaulukointi ja khii2-testi   Pohdi eri käsitteitä ja merkittävyyden käytännön merkitystä Baayenin pohjalta ja viimeistele raportti palautuskuntoon.
Sami oma aineisto Gutenbergistä teoksien kirjoittajan tunnistaminen luokittelumuuttujien avulla kirjoittajien välillä ei ole merkittäviä eroja vrt. Maijan työ   Voisit tyytyä kahteen kirjailijaan ja 1-2 luokittelumuuttujaan. Vrt. muut aiheet.
Sini E Baskerville-kirja virkkeen pituuksien muodostama aikasarja kahden peräkkäisen lauseen pituuden erotus on normaalijakautunut, mutta normaalijakaumasta generoidun aineiston lausepituuksien erotus ei ole normaalijakautunut     Minusta näyttää, että hypoteesi kannattaa kirjoittaa selkeämmäksi.

Lähiopetuskerta 9.11. - ei luentoa

 • Aloitetaan harjoitustyöraportin kirjoittaminen (ei enää näy muille ryhmäläisille) itsenäisesti

Lähiopetuskerta 2.11.

 • Luetaan lukua 4. Tilastolliset perusmetodit - kertaus. Opettaja havainnollistaa ja yrittää helpottaa syvempää ymmärtämistä.
 • Pidemmälle ehtineet voivat lukea kirjaa eteenpäin
 • Valitaan tilastollinen menetelmä ja sovelletaan sitä omaan aineistoon

Lähiopetuskertaa 19.10. ei ole, itsenäistä työskentelyä

 • Jatketaan lukujen 2 ja 3 opiskelua sekä oman harjoitustyön työstämistä
 • Muistiinpanoja luvuista 2 ja 3 oltava olemassa portfoliossa ennen 4.11.
 • Kirjoita omaan portfolioosi, millä tavalla havainnollistat oman harjoitustyösi havaintomatriisin muuttujia ja niiden yhteyksiä
 • Kirjoita omaan portfolioosi, millaisia jakaumaoletuksia voisit käyttää millaisia hypoteeseja voisit testata aineistoa tutkimiessasi
 • Nämä valmiiksi 4.11.

Lähiopetuskertaa 12.10. ei ole, itsenäistä työskentelyä

 • Lue luku 2 kirjasta "Analyzing Linguistic Data" ja tee omaan portfolioosi itseäsi tukevia muistiinpanoa luvusta
 • Lue luku 3 kirjasta "Analyzing Linguistic Data" ja tee omaan portfolioosi itseäsi tukevia muistiinpanoa luvusta
 • Täydennä omalta kohdaltasi harjoitustyön aihevalintaasi HyClt255s2012Harjoitustyöt (tälle sivulle tulee nimet ja aihevalinnat -luettelo)
 • Kirjoita omaan portfolioosi, miten esität harjoitustyöhösi liittyvän havaintodatan ja miten keräät havaintodatan aineistostasi (huomaa datan ja aineiston ero)
 • Aloita aineiston muuttaminen havaintomatriiseiksi

Lähiopetuskerta 5.10.

 • Jatketaan työtä taksonomian kanssa
 • Suunnitellaan harjoitustyön havaintomatriisin valmistelua, testejä ja harjoitustyöraportin kirjoittamista
Oppimistehtävät
 • Avatkaa jokin vertaisen sivu taksonomiassa ja perehtykää siihen. Merkitkää tämän sivun linkin perään esim (alustava kommentti Senja Sennimiseltä) tai (kommentti Senjalta)
 • Kommentoikaa jo keskeneräisistäkin sivuista, mistä seikoista piditte ja mistä saatte itse inspiraatiota oman sivunne kehittämiseen. Mainitkaa, että palaatte sitten kun sivu on valmis ja arvioitte sen uudelleen. Jos sivu on valmis eli varsinaisesti kommentoitavissa, niin voitte antaa tasapuolisemman arvioinnin, jossa myös ehdotatte sivulle mahdollisia parannuksia ja kerrotte, mikä käsitteellinen asia oli vaikeasti.
 • Kasto sivua HyClt255MetodiTilastollinenTestaaminen ja liitä "omaa" testimenetelmääsi koskeva kommentti ja linkki tälle sivulle sinne kohtaan mihin testimenetelmäsi soveltuu.
 • Hyödyntäkää toisiltanne oppimianne ideoita, mutta kirjoittakaa heille varsinainen tai lisäkommentti jossa sanotte vaikka "Sinulla oli kiva idea asian X esittämiseksi. Taidankin ottaa mallia siitä. Kiitos esimerkistäsi."

Lähiopetuskerta 28.9.

 • Opettaja kertaa ja avustaa pysymään ajan tasalla; opiskelija varmistaa opettajan avustuksella, että aikaisemmat tehtävät ovat raportoitu KitWikiin.
 • Oppimistehtäviä aloitetaan oppitunnilla ja jatketaan kotona. Ensivaiheessa omalle sivulle saa viitaten ja lainaten kopioida eri lähteistä materiaalia, niin kokonaisuus hahmottuu. Tämän jälkeen kotitehtävänänne on työstää sivu niin hyvään kuntoon, että opiskelutoverikin voisi oppia sivustanne mistä on kysymys ja miten menetelmää käytetään oiken ja milloin.

Oppimistehtävät

 1. Valitse yksi tilastollinen menetelmä tilastollisten metodien taksonomiasta, luo sille linkin päässä oleva KitWiki-sivu.
 2. Kokoa sivulle tietoa metodin käytöstä ja ominaisuuksista käyttäen lähteenä esim. viime vuoden kurssilta sivuja Luento 6, Luento 5, R:n tekemän testin tulkinta ja 7. materiaalierä. Materiaalia on myös Wikipedian statistics -artikkelissa ja Teemu Luojolan käsikirjoituksessa Kielitieteellisen aineiston kvantitatiiviset analyysimenetelmät. Jos haluat tietoa kuvien tai kaavojen liittämisestä tekstiin, vilkaise em. KitWikin sivujen alareunasta löytyvää Raw View-näkymää käyttäen. Tässä vaiheessa voit kopioida materiaalia eri lähteistä kunhan merkitse itsellesi mistä ne lainaat.
 3. Kirjoita sivulle keräämäsi asia omin sanoin niin että osoitat ymmärtäväsi mitä kirjoitat. Poista lainaukset ja korvaa ne omalla ymmärrykselläsi. Hanki lisätietoa oudoista käsitteistä. Muotoile sivu yhdenmuotoiseksi mallisivun mukaan.
 4. Merkitse aiheesi linkin perään (em. sivulla) sivun tila: kesken/kommentoitavissa/viimeistely/valmis
 5. Etsi kaksi kaverisi tekemää kommentoitavaa sivua, jota ei ole aikaisemmin kommentoitu kuin korkeintaa kaksi kertaa
 6. Kirjoita sivun loppuun kommenttisi siitä (mm. ymmärsitkö mikä, miten ja milloin), mitä hyvää sivulla oli ja mitä et ymmärtänyt.
 7. Täydennä tekemääsi sivua saamasi palautteen pohjalta

Lähiopetuskerta (21.9.2012) peruttu päällekkäisyyden vuoksi, tilalla itsenäistä työskentelyä

 • Tavoitteena: aineiston valmistelun harjoittelua R:ää varten ja aineistossa olevien epäyhtenäisyyksien korjailu. Ei vielä tarvitse soveltaa omaa aiheeseen.

Oppimistehtävät

 • Lukekaa vanhasta luentomateriaalista sivut Luento 3 ja Luento 4 viime vuoden kurssilta
 • Käyttäkää 21.9. puuttuva luentoaika näiden lukemiseen.
 • Lähettäkää näillä sivuilla olevat kotitehtävät 4 ja 5 minulle sähköpostitse osoitteeseen anssi.yli-jyra@helsinki.xx.
 • opiskelija yrittää varmistaa itsenäisesti, että kaikki aikaisemmat tehtävät ovat raportoitu KitWikiin

Lähiopetuskerta (14.9.2012)

 • Opettaja esittää ja jakaa kalvosarjan, joka esittele R:n ominaisuuksia ja tilastotieteen peruskäsitteitä
 • Harjoittelemme aineiston syöttämistä R:ään
 • clt255-kalvot-14.9.2012.pdf: Näytetyt kalvot

Oppimistehtävät

 • Tehtävä 1: Keksi kaksi esimerkkiä yhdessä korpuksessa esiintyvästä ilmioöistä, joka saa korpuksen sisällä erilaisia arvoja. Käytä lähteenä sivua Luento 1 viime vuoden kurssilla.
 • Tehtävä 2: Suunnittele oman havaintomatriisin käsittely omalla tavallasi. Käytä lähteenä sivua Luento 2. Raportoi portfoliosivullasi kukin seuraavista kohdista:
  1. Määrittele, minkälaisen OMAn (pienehkön) havaintomatriisin haluat
  2. Määrittele, minkälaisia muuttujia tämän matriisin sarakkeet ovat
  3. Tuota ainakin muutama rivi tällaista havaintomatriisia
  4. Lue havaintomatriisi R:ään
  5. Tarkista havaintomatriisin oikeellisuus
  6. Jos ei onnistunut, opiskele ja korjaa mikä meni pieleen
  7. Kuvaile portfoliossasi, mitä halusit tehdä ja miten tämän teit.
 • Harjoitustehtävä 3: Kirjoita KitWikiin portfolioon hyväksi kokemasi neuvo (1-3 kappaletta) yhdestä seuraavista aiheista:
  1. Kuinka vien havaintomatriisini R:ään
  2. Millaisia havaintomuuttujien arvoja ja esitysmuotoja on olemassa
  3. Kuinka määrittelen havaintomuuttujien tyypin
  4. Miksi havaintomatriisin vienti R:ään on vaikeaa
  5. Kuinka muutan havaintomatriisin tietoja
  6. Miten konvertoin havaintomatriisien ja vektorien välillä
  7. Mitä tietoa saan summary()-komennon tuloksista
  8. oma aihe

Lähiopetuskerta (7.9.2012) (ei ollut perinteinen luento)

 • Tutustuimme vähän toisiimme.
 • Kävimme läpi kurssin oppimistavoitteet, sisällön ja arvosteluasteikon kurssin perinteisellä kotisivulla, joka pohjautuu WebOodissa olevaan tietoon.
 • Totesimme, että hyödyllistä materiaalia ja ohjeita on saatavilla
 • Muodostimme tukiryhmät. Ryhmäytymistä emme erikseen harjoitelleet.
 • Tutustuimme harjoitustöiden aiheisiin yksilöinä, parityöskentelynä ja ryhmissä. Selvitimme kunkin työparin ja työryhmän suosikkiaiheet. Aloimme pohtimaan millaista materiaalia harjoitustöihin tarvisemme.
 • Varmistimme, että kaikilla on hippu.csc.fi-koneen ja KitWiki-järjestelmän käyttöoikeudet. Loimme kullekin sivun, johon voi alkaa koota harjoitustyön alle tietoa aineistosta, tutkimusmenetelmistä ja teoriasta sekä muista suoritukseen liittyvistä asioista.
 • Arvioimme opetuskerran antia. Vuosien varrella kertynyttä verkkomateriaalia kiiteltiin, myös harjoitustöiden aiheisiin tutustuminen tuntui antoisalta, tulevat poissaolot ja opiskelijalöhtöisyys tunnistettiin haasteiksi, reflektiotehtävät tunnistettiin haasteellisiksi.

Oppimistehtävät

 1. Käynnistä R ainakin kerran seuraavan viikon aikana ja tee ensi viikon aikana toistuvasti noin 10 minuutin istuntoja tutustuaksesi R:n oppaisiin ja harjoitellaksesi R:n mahdollisuuksia esimerkkien pohjalta. Tämä tuo pohjaa sille, kun otamme R:n perusteellisempaan käyttöön kurssin edetessä.
 2. Luo oman harjoitustehtävän portfoliosivu KitWikiin (linkit kurssin kotisivun alla KitWikissä)
 3. Kuvaa portfoliossa alustava harjoitustyön aiheesi ja siihen sopivan materiaalin saatavuussuunnitelma
 4. Analysoi aihetta ja sen tehtävänantoa ja yritä tunnistaa tietoja ja taitoja, joita tarvitset selviytyäksesi harjoitustyöstä.
 5. Kirjaa nämä asiat portfoliosivulle. Kirjaa sinne myös seikkoja, joita olet viikon aikana oppinut R:stä.

-- AnssiYliJyra - 2012-09-14

Topic revision: r18 - 2012-12-02 - AnssiYliJyra
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback