Puheen analyysi KPK322, syksy 2007

Kpk322/FS1. Puheen analyysi

Kurssin kotisivu (näkyy www:ssä), (päivityslinkki)

Yleistä

Käytettävät ohjelmaympäristöt (mahdollisia):

  • Python (Perl)
  • Excel
  • R

*Aikataulu*

pvm aihe
30.10. ryhmätyön aiheen valinta, käytännön asiat, kepstrit ja perustaajuudet
6.11. Praat-esimerkkejä
13.11. Signaalinkäsittelyä R:llä, cor (perustaajuuden etsiminen autokorrelaatiolla), log(abs(fft)) (spektrin laskeminen)
20.11. Ryhmätyöskentelyä, ikkunointi
27.11. Ryhmätyöskentelyä, LPC
4.12. Esitykset, kirjallisen raportin palautus

Kurssiraportin rakenne

  • Esitellään ongelma: kepstrianalyysin ja F0-taajuuden analyysi
  • Mahdollisia käyttökohteita näille (esim Chazanin artikkeli)
  • Toteutuksen matematiikka (Fourier-muunnos, Autokorrelaatio, Ikkunointi)
  • Toteutus Pythonilla, tiedostojen kuvaukset
  • Jatkokehitysideoita, pohdintaa aiheesta / työstä

Kurssiraportti

KurssiRaportti

Osallistujat

  • Artturi Sipilä – artturi.sipila ät helsinki.fi
  • Mona Lehtinen – mona.lehtinen ät helsinki.fi
  • Mikko Vuorinen – mvuorine ät cc.helsinki.fi

Kurssin luennon alustava rakenne:

  • Aiheen esittely sanallisesti
  • Matemaattinen ja graafinen analyysi kalvoilla
  • Ohjelman tutkiminen
  • Prujumateriaalin jakaminen
  • Kotitehtävien esittely

Kurssin sisältöä:

(Kirjan alkuosan mukaan)

Tutkintovaatimuksissa mainittua

  • Tavoite
    • Kielen fonologisten kategorioiden ja sääntöjen akustisen parametrisaation vastaavuuden tuntemus
    • sekä ALERT!
    • omakohtainen analyysitaito.

Ehdotuksia

Käsiteltäviä papereita, esim?

  • Dan Chazan, Ron Hoory, Gilad Cohen, and Meir Zibulski, Speech reconstruction from mel frequency cepstral coefficients and pitch, in IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), 2000.


* python-puheanalyysi.tar.bz2: Python-koodit

Topic attachments
I Attachment Action Size Date Who Comment
PDFpdf chazan00speech.pdf manage 137.3 K 2007-10-30 - 06:40 UnknownUser  
Unknown file formatbz2 python-puheanalyysi.tar.bz2 manage 12.3 K 2007-10-30 - 11:21 UnknownUser Python-koodit
Waveform sound filewav sine.wav manage 15.7 K 2007-11-06 - 11:26 UnknownUser Siniaalto 377Hz, 8kHz sample rate
Unknown file formatraw y-be.raw manage 1.3 K 2007-11-13 - 10:44 UnknownUser big-endian y.raw
Unknown file formatraw y-le.raw manage 1.3 K 2007-11-13 - 10:44 UnknownUser little-endian y.raw
Texttxt y-values.txt manage 3.8 K 2007-11-13 - 11:45 UnknownUser y.wav lukuarviona (8000 Hz näytetaajuus)
Waveform sound filewav y.wav manage 1.3 K 2007-11-06 - 11:27 UnknownUser y-ääni, 8kHz sample rate
Topic revision: r9 - 2007-11-27 - ArtturiSipila
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2018 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback