Unix-ryhmät

Unix-ryhmät on kuvattu tiedostossa, joka on seuraavassa verkko-osoitteessa: http://www.ling.helsinki.fi/uhlcs/csc-korpukset/unix-groups-fin-2.html.

Yksittäisten korpusten Unix-ryhmät:

/general-linguistics

Hakemistossa /ADM on useita korpuksia, jotka siirretään tähän hakemistoon sen jälkeen, kun korpuksia koskevat sopimukset ovat selvät.

Niille yhteyshenkilöille, joiden nimi on suluissa, ei tarvitse lähettää tietoa henkilöistä, jotka hakevat korpuksen käyttölupaa.

Kieli Korpus Yhteyshenkilö Unix-ryhmäSorted ascending
English/englanti gutenberg   li-a2
English/englanti susanne   li-a2
English/englanti WSJ   li-a2
Yiddish/jiddish royte-pomerantsen   li-a2
Latin/latina apa (Martti Nyman) li-a2
Estonian/viro viro1 (Kazuto Matsumura) li-b2
Estonian/viro viro2 (Maria Vilkuna) li-b2
Finnish/suomi bible Anssi Yli-Jyrä li-b2
Finnish/suomi fintag   li-b2
Somali/somali selko13.94, selko18.94, selko20.94   li-c2
Russian/venäjä fowler   li-c2
Russian/venäjä spoken   li-c2
Russian/venäjä tampere-corpus   li-c2
Russian/venäjä uppsala-corpus   li-c2
useita kieliä words   li-c2
Finnish/suomi hkv   li-c2
Greek/kreikka hakemistossa ADM Anssi Yli-Jyrä li-c2 ?
Hebrew/heprea hakemistossa ADM Anssi Yli-Jyrä li-c2 ?

---

/general-linguistics-kotus

Hakemistossa /ADM on korpuksia, jotka siirretään tähän hakemistoon sen jälkeen, kun korpuksia koskevat sopimukset ovat selvät.

Kieli Korpus Yhteyshenkilö Unix-ryhmä
Swedish/ruotsi hakemistossa ADM   li-a2
Finnish/suomi a-contract   li-a2
Finnish/suomi b-contract   li-a2
Finnish/suomi ftc   li-a2
Finnish/suomi parole   li-a2

---

/language-departments

Hakemistossa /ADM on venäjän korpuksia, joiden omistussuhteet eivät vielä ole selvät. Jos korpukset voidaan jättää UHLCS:lle, ne siirretään tähän hakemistoon tai hakemistoon /general-linguistics sen jälkeen, kun korpuksia koskevat sopimukset ovat selvät. Korpuksia varten on valmiina hakemisto /slavonic-and-baltic-lgs/slavonic-lgs/russian. Jos ne siirretään tähän hakemistoon, ne kuuluvat slaavilaisten ja balttilaisen kielten laitoksen omistukseen.

*Kieli Korpus Yhteyshenkilö Unix-ryhmä
Swedish/ruotsi fisc Jan K. Lindström ld2-a2
Swedish/ruotsi hki Jan K. Lindström ld2-a2
Swahili/suahili bin Arvi Hurskainen ld3-c3
Swahili/suahili conjoin Arvi Hurskainen ld3-c3
Swahili/suahili dialects Arvi Hurskainen ld3-c3
Swahili/suahili standard Arvi Hurskainen ld3-c3

---

/multilingual-language-archive

Hakemistoon voidaan liittää korpuksia joita voidaan käyttää vain tutkimukseen (=1), tutkimukseen ja opetukseen (=2) ja tutkimukseen, opetukseen ja kaupallisiin kieliteknologisiin sovelluksiin. Korpusten käytön alue on mainittava sopimuksessa, joka solmitaan Helsingin yliopiston yleisen kielitieteen laitoksen ja korpusten omistajien kesken. Kaikki uudet korpukset, jotka saadaan Raamatunkäännösinstituutilta (Helsinki, Moskova ja Tukholma), sisältyvät sopimukseen, joka uusittiin kesällä 2007. Korpukset, jotka saadaan Raamatunkäännösinstituutilta, luokitellaan saman sen perusteella, mihin ryhmään ne kuuluvat. Tällöin saadaan samoihin Unix-ryhmiin kuuuvat hakemistot /New-Testament, /Bible-of-Children ja /Books-of-Children. Esim. Raamatunkäännösinstituutilta on saatu ersän ja livvin Uudet testamentit syksyllä 2007. Sopimuksen mukaan CSC:lle ei toimiteta uusia korpuksia ennen kuin korpukset on virallisesti avattu. Olen jo nyt varannut niille tähän Unix-ryhmiä koskevaan tiedostoon oma paikat (New-Testament-all). Hakemistoissa olevat lisähakemistot, joissa on esim. korpusten koodauksessa käytetyt indeksit (lists-of-tags) kuuluvat samaan Unix-ryhmään kuin ko. korpukset.

Niille henkilöille, joiden nimi on suluissa, ei tarvitse lähettää tietoa henkilöistä, jotka hakevat korpuksen käyttölupaa.

Kieli Korpus Yhteyshenkilö Unix-ryhmä
Chukchi/tshuktshi New-Testament Pirkko Suihkonen lipr-c2
Koryak/korjakki New-Testament Pirkko Suihkonen lipr-c2
Ossete/osseetti Bible-of-Children Pirkko Suihkonen lipr-c2
  Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Tajik/tadzhikki Bible-of-Children Pirkko Suihkonen lipr-c2
  Bible-of-Children Pirkko Suihkonen lipr-c2
Kurdish/kurdi New-Testament Pirkko Suihkonen lipr-c2
Ukrainian/ukraina Books-of-Children Pirkko Suihkonen lipr-c2
Kalmyck/kalmukki New-Testament Pirkko Suihkonen lipr-c2
Avar/avaari New-Testament Pirkko Suihkonen lipr-c2
Lak/laki New-Testament Pirkko Suihkonen lipr-c2
Tabassaran/tabassarani New-Testament Pirkko Suihkonen lipr-c2
Even/eveeni New-Testament Pirkko Suihkonen lipr-c2
Evenki/evenki Books-of-Children Pirkko Suihkonen lipr-c2
Nanay/nanai New-Testament Pirkko Suihkonen lipr-c2
Chuvash/tshuvassi paasonen-texts André Hesselbäck lipr-c3
Khakas/hakassi Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Tuvin/tuva New-Testament Pirkko Suihkonen lipr-c2
Yakut (Sakha)/saha Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Balkar/balkaari New-Testament Pirkko Suihkonen lipr-c2
  Psalms Pirkko Suihkonen lipr-c2
Bashkir/bashkiiri New-Testament Pirkko Suihkonen lipr-c2
Crimean Turkish / kriminturkki New-Testament Pirkko Suihkonen lipr-c2
Crimean Turkish / kriminturkki word-list Pirkko Suihkonen lipr-c2
Kirghiz/kirgiisi Books-of-Children Pirkko Suihkonen lipr-c2
Tatar/tataari Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Uighur/uiguuri New-Testament Pirkko Suihkonen lipr-c2
Uzbek/uzbekki Bible-of-Children Pirkko Suihkonen lipr-c2
Uzbek/uzbekki dictionary Pirkko Suihkonen lipr-c2
Azerbaijani/azeri New-Testament Pirkko Suihkonen lipr-c2
Gagauz/gagauzi New-Testament Pirkko Suihkonen lipr-c2
Turkmen/turkmeeni New-Testament Pirkko Suihkonen lipr-c2
  Old-Testament Pirkko Suihkonen lipr-c2
Dvina Karelian /vienankarjala Books-of-Children Pirkko Suihkonen lipr-c2
  Bew-Testament Pirkko Suihkonen lipr-c2
Ingrian/inkeroinen english-translations Manja Lehto lipr-c3
  morphologically-tagged-corpora Manja Lehto lipr-c3
  texts Manja Lehto lipr-c3
Livonian/liivi Books-of-Children Pirkko Suihkonen lipr-c2
Livonian/liivi suhonen (Seppo Suhonen) lipr-c2
Livvi/livvi Bible-of-Children Pirkko Suihkonen lipr-c2
  Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
  New-Testament-all Pirkko Suihkonen lipr-c2
Lude/lyydi texts (Miikul Pahomov) lipr-c3
Veps/vepsä Bible-of-Children Pirkko Suihkonen lipr-c2
  Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
East Mari / itämari Bible-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
West Mari / länsimari Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
West Mari / länsimari (vuorimari) hill-mari-texts André Hesselbäck lipr-c3
Erzya (Mordvin) /ersä Bible-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
  New-Testament-all Pirkko Suihkonen lipr-c2
Erzya (Mordvin) / ersä dictionary Jack Rueter lipr-c3
  epos Jack Rueter lipr-c3
  journals Jack Rueter lipr-c3
  novels Jack Rueter lipr-c3
  poetry Jack Rueter lipr-c3
  short-stories Jack Rueter lipr-c3
Erzya (Mordvin) / ersä morphologically-tagged-corpora Jack Rueter lipr-c3
Erzya (Mordvin) / ersä historical-word-list Dennis Estill lipr-c3
Moksha (Mordvin) /moksha Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Moksha (Mordvin) / moksha novels Jack Rueter lipr-c3
Moksha (Mordvin) / moksha historical-word-list Dennis Estill lipr-c3
(Komi) Zyrian / (komi)syrjääni Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
(Komi) Zyrian / (komi)syrjääni komi-texts Paula Kokkonen lipr-c3
  komi-texts-snt Paula Kokkonen lipr-c3
  morphologically-tagged-corpora Paula Kokkonen lipr-c3
(Komi) Zyrian / (komi)syrjääni novels Jack Rueter lipr-c3
(Komi) Permyak / komipermjakki Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Udmurt/udmurtti udmurt-snt Pirkko Suihkonen lipr-c3
  udmurt-texts-unmodified Pirkko Suihkonen lipr-c3
Udmurt/udmurtti Books-of-Children Pirkko Suihkonen lipr-c2
  New-Testament Pirkko Suihkonen lipr-c2
Udmurt/udmurtti udmurt-statistical-data Pirkko Suihkonen lipr-c3
Kildin Saami / kildininsaame Books-of-Children Pirkko Suihkonen lipr-c2
North Saami / pohjoissaame report Irja Seurjärvi-Kari lipr-c3
North Saami / pohjoissaame vuolab (Kerttu Vuolab) lipr-c3
*Ume Saami / uumajansaame data Olavi Korhonen lipr-c3
Enets/enetsi New-Testament Pirkko Suihkonen lipr-c2
Kamas/kamassi texts-donner Merja Salo lipr-c3
Nenets/nenetsi sample-sentences Tapani Salminen lipr-c3
Nenets/nenetsi New-Testament Pirkko Suihkonen lipr-c2
Selkup/selkuppi h-dialects Merja Salo lipr-c3
  ivankino-dialect Merja Salo lipr-c3
  ket-dialect Merja Salo lipr-c3
  tundra-dialect Merja Salo lipr-c3
  tym-dialect Merja Salo lipr-c3
  upper-ob-dialect Merja Salo lipr-c3
Khanty/hanti Books-of-Children Pirkko Suihkonen lipr-c2
Khanty/hanti atlym-dialect Merja Salo lipr-c3
  kazym-dialect Merja Salo lipr-c3
  konda-dialect Merja Salo lipr-c3
  nizjam-dialect Merja Salo lipr-c3
  obdorsk-dialect Merja Salo lipr-c3
  synja-dialect Merja Salo lipr-c3
  rugin Merja Salo lipr-c3
Mansi/mansi Books-of-Children Pirkko Suihkonen lipr-c2

*Huom: rajoitus uumajansaamen korpuksen käyttölupiin: käyttöluvan saa myöntää vain suomalais-ugrilaisten kielten tutkijoille.

-- PirkkoSuihkonen - 15 Jan 2008

Topic revision: r10 - 2008-03-04 - PirkkoSuihkonen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback