This web is for holding topics deemed as old or irrelevant for KitWiki. If you think the topic doesn't belong here, please check that it's named properly (is a WikiWord) and descriptively, contains relevant data, and is put back to a relevant web.

ResourceSktpSvFI - Swedish SKTP Text Collection

Back to: KitWiki.SuomenKielipankki:Dev:Linguistics_ResearchMaterial

Introduction

Kielipankin Tekstikokoelmassa on 12 suomenruotsin osakokoelma(a). Tekstikokoelman dokumenteista 102816 (11 %) on suomenruotsinkielisiä. Tämä vastaa 34412586 (14 %) sanaa. (Kaikkiaan tekstikoelmassa on 897331 dokumenttia. Yhteenlaskettu sanamäärä on 245640269.)

Background

Content and Structure

Finska notisbyrån 1999 fnb1999
Sanamäärä: 2675611 Dokumenttimäärä: 15359
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Ei kommenttia
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/FNB/1999/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Finska notisbyrån 2000 fnb2000
Sanamäärä: 5910201 Dokumenttimäärä: 32467
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Ei kommenttia
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/FNB/2000/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

FISC Litteratur fisc_lit
Sanamäärä: 636052 Dokumenttimäärä: 12
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Johan Bargum: "Den svarta portföljen", Elin Herrgård: "Trolljus", Ulla-Lena Lundberg: "Stora världen", Paul von Martens: "Marons moské", Merete Mazzarella: "Hem från festen", Bengt Packalén: "Isränder", Torsten Petterson: "Varfskallen", Anna-Lisa Sahlström: "Doft av järn och syren", Lars Sund: "Colorade Avenue", Kjell Westö: "Fallet Bruus", Barbara Winckelmann: "Krona av järn", Benedict Zilliacus: "Båten i vassen"
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/fisc/Litteratur/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

FISC Myndighet fisc_myn

Sanamäärä: 352924 Dokumenttimäärä: 36
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: FISC-korpusens myndighetstexter.
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/fisc/Myndighet
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

FISC Sakprosa fisc_sak

Sanamäärä: 437891 Dokumenttimäärä: 19
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: FISC-korpusens sakprosa: "Utkik från en småstad", "I fält med Er P1 1941-1944", "Personnamnsboken", "Att välja väg Finlands roll i Europa", "Folkhälsan 70 år 1991", "Hållbar utveckling och Finland Statsrådets redogörelse till riksdagen om åtgärder för en hållbar utveckling", "Länsstyrelsen i Nylands län 1990", "Malax å fiskeriutredning; yngelproduktions- och beståndsstudier", "Skyddet av den marina miljön i Bottenhavet"
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/fisc/Sakprosa
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

FISC Tidning fisc_tid

Sanamäärä: 949924 Dokumenttimäärä: 31
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Hufvudstadsbladet 13-16 augusti och 2-21 september 1991, Vasabladet 10-12, 14-15 och 17-18 december 1991. Hela nummer (men endast redaktionell text)
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/fisc/Tidning
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Hufvudstadsbladet 1998 hbl1998

Sanamäärä: 9304383 Dokumenttimäärä: 20790
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Ei kommenttia
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/hufvudstadsbladet/1998/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Hufvudstadsbladet 1999 hbl1999

Sanamäärä: 9715267 Dokumenttimäärä: 22801
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Ei kommenttia
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/hufvudstadsbladet/1999/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Jakobstads Tidning 1999 jt1999

Sanamäärä: 883785 Dokumenttimäärä: 2743
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Innehåller ett antal näst intill identiska texter (variationer av samma nyhetstelegram e.d.)
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/jakobstadstidning/1999/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Jakobstads Tidning 2000 jt2000

Sanamäärä: 2447514 Dokumenttimäärä: 7745
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Innehåller ett antal näst intill identiska texter (variationer av samma nyhetstelegram e.d.)
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/jakobstadstidning/2000/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Söderströms 1997-1999 A soderA

Sanamäärä: 183462 Dokumenttimäärä: 170
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: a
Kommentti: Elsa Boström: "Stella och Florence", Gösta Karf: "En junisöndag kvart över tolv", Ann-Mari Lindberg: "Chansen", Henrika Ringbom: "Martina Dagers längtan". OBS! Ett "dokument" är en samling med 10-20 påvarandraföljande stycken, inte en textuell enhet.
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/soderstroms/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Söderströms 1997-1999 B soderB

Sanamäärä: 915572 Dokumenttimäärä: 643
Kieli: Suomenruotsi Lemmie: 2.0 Käyttöoikeus: b
Kommentti: Jörn Donner: "Varför finns jag till", Mikael Enckell: "Öppningen i taket", Magnus Londen: "Charter", Magnus Londen: "Till Världens ände", Leo Löthman: "Big Mama", Paul von Martens: "Döden kom till rätta", Merete Mazzarella: "Där man aldrig är ensam", Curt Olsson: "För lag och rätt i rikets tjänst", Susanne Ringell: "Åtta kroppar", Tom Sandell: "Civilia. Ett brev till läsaren", Mikaela Sundström: "Dessa himlar kring oss städs", Märta Tikkanen: "Sofia vuxen - med sitt MBD", Barbara Winckelmann: "Ske min vilja". OBS! Ett "dokument" är en samling med 10-20 påvarandraföljande stycken, inte en textuell enhet.
Sijainti: /mnt/corpus/kielipankki/teksti/sv/FI/soderstroms/
Koostajat:
Rakennekoodaus: xml Kieliopillinen koodaus: swecg

Directory /l/kielipankki/teksti/sv/FI/

/l/kielipankki/teksti/sv/FI/fisc:
drwxr-x---  7 ling sktp-b  4096 10. syys  2004 .
drwxr-xr-x 28 ling csc   4096 16. syys  15:50 ..
-rw-r-----  1 ling sktp-b 116255 26. helmi  2003 fisc.tei
drwxr-x---  2 ling sktp-b  4096 26. helmi  2003 Litteratur
drwxr-x---  2 ling sktp-b  4096 26. helmi  2003 Myndighet
drwxr-x---  2 ling sktp-b  4096 26. helmi  2003 Sakprosa
drwxr-x---  2 ling sktp-b  4096 26. helmi  2003 Tidning
drwxr-x---  6 ling sktp-b  4096 10. syys  2004 xml
-rw-r--r--  1 ling csc    488 13. elo   2004 00README

/l/kielipankki/teksti/sv/FI/FNB:
drwxr-x---  4 ling sktp-b 4096 1. helmi  2002 .
drwxr-x--x  6 ling csc  4096 17. loka  13:35 ..
-rw-r-----  1 ling sktp-b 145 24. heinä  2001 indentall.log
drwxr-x---  7 ling sktp-b 4096 8. heinä  2002 1999
drwxr-x--- 11 ling sktp-b 4096 9. heinä  2002 2000

/l/kielipankki/teksti/sv/FI/hufvudstadsbladet:
drwxr-x---  4 ling sktp-b 4096 22. helmi  2002 .
drwxr-x--x  6 ling csc  4096 17. loka  13:35 ..
-rw-r-----  1 ling sktp-b 145 24. heinä  2001 indentall.log
drwxr-x--- 14 ling sktp-b 4096 22. helmi  2002 1998
drwxr-x--- 14 ling sktp-b 4096 4. heinä  2002 1999

/l/kielipankki/teksti/sv/FI/jakobstadstidning:
drwxr-x--- 4 ling sktp-b 4096 24. heinä  2001 .
drwxr-x--x 6 ling csc  4096 17. loka  13:35 ..
-rw-r----- 1 ling sktp-b 145 23. heinä  2001 indentall.log
drwxr-x--- 4 ling sktp-b 4096 26. helmi  2002 1999
drwxr-x--- 7 ling sktp-b 4096 26. helmi  2002 2000

/l/kielipankki/teksti/sv/FI/soderstroms:
drwxr-xr-x 5 ling sktp-b 4096 30. tammi  2003 .
drwxr-x--x 6 ling csc  4096 17. loka  13:35 ..
drwxr-xr-x 2 ling sktp-b 4096 29. tammi  2003 1997
drwxr-xr-x 2 ling sktp-b 4096 12. maalis 2003 1998
drwxr-xr-x 2 ling sktp-b 4096 12. maalis 2003 1999

Sample

Further Information

License

Fulltext of the License

Summary of the License

Copying
Publishing
LTDeveloping

Referring

Bugs

Huom! Dokumentit on tyyppillisesti saatu julkaisijalta suurissa erissä sähköisessä muodossa, eikä niiden vastaavuutta painettuihin versioihin ole tarkistettu käsin. Esimerkiksi sanomalehden tietyn vuoden dokumentit eivät välttämättä sisällä kaikkia, eikä täysin samoja dokumentteja kuin painetun lehden vuosikerta.
Topic revision: r8 - 2008-11-07 - HennaRiikkaLaitinen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback