Searched: ^h

Results from KitWiki web retrieved at 17:55 (GMT)

hanalyse Input An inflected form of a word in the analyser lexicon Output The output consists of three types of information: base form , paradigm tags , analysis ...
hgenerate Input The input is an analysis provided by the HGenerateMethod or HGuessMethod, but only two types of information are relevant: base form and paradigm ...
hguess Input An inflected form of a word that is not in the analyzer lexicon and is therefore passed to the weighted analyser Output The output displays three ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: CannotLocateLemmiePm Problem Description Yritin tänään käyttää omaa hakuskriptia nimeltään `yhdensananhaku ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: Why My Application for Language Bank Access Was Disapproved Description of the Problem I have sent a user ...
Back to: SuomenKielipankki:Helpdesk The Diagnosis of Connection Errors There are many situations that cause troubles to users that try to connect CSC and the ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: How Do I Arrange Accounts for the Students of My Course Description of the Problem I am going to use the ...
Back to: SuomenKielipankki:Helpdesk Helpdesk item: Emacs Rejects Large Files Description of the Problem In the Linux machine corpus.csc.fi, the Emacs is set ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: How to Connect corpus.csc.fi, the Corpus Server of the Language Bank Description of the Problem This ...
Back to: SuomenKielipankki:Helpdesk Helpdesk item: I need more disk space to comple my task Description of the Problem I have not enough space available in ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: How to Generate Word Lists Description of the Problem I want to generate word lists from XML files in ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: I get an error when trying to see more context in Lemmie Status A FIXED BUG Description of the Problem ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: Problems with 8 Bit Letters Description of the Problem Why less drops the 8 bit letters such as ä, ö? I ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: SSH Secure File Transder: Changing Folders Description of the Problem After I opened a new file transder ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: How I Know the word count of the corpora in use in the WWW Lemmie 2 tool? Description of the Problem The ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: Lemmie Truncates Statistical Measurements Description of the Problem Olen työskennellyt melko paljon Lemmie ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: Using Emacs with PuTTY Description of the Problem I have a computer with Windows XP and I want to use non ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: Using nXML mode with GNU Emacs Description of the Problem The nXML mode is a mode for Emacs for editing ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: What Are Counted as Words? Description of the Problem Word Count in the Text Bank of the Finnish Language ...
Form for entering help request and answers Name Type Size Values Tooltip message Attributes HelpdeskProblemName text 60 Name of ...
Back to: SuomenKielipankki:Helpdesk Helpdesk Item: How.... Description of the Problem The Answer(s) AnssiYliJyra 21 Aug 2006
HFST: Application Program Interface The HFST API library is intended for creating and manipulating weighted or unweighted synchronic transducers implementing regular ...
HFST: Transducer Core Extension API This document deals with the datatypes related to core transducer manipulation. This layer is meant to support 1. the layers ...
HFST: API Documentation The full doxygen documentation of HFST Interface and the underlying transducer libraries. ErikAxelson 2009 05 25
HFST: Transducer Key API This document deals with the datatypes related to input and output labels in transducers. This is most important layer since e.g. HfstAPITransducerLayerOLD ...
This is a part of the HfstAPIGeneralizedRestrictionLayerOLD. It is kept on a separate page in order to keep the core simple. HFST: Functions Supporting Substring ...
HFST: API for Generalized Restriction (GR) and Predicate Logic in FST Calculus THIS TOPIC IS NOT UP TO DATE Introduction Purpose of the layer This extension to ...
Version API Layer Covered Aspects labels operators graphs ...
HFST: API Proposal The big picture of symbols, pairs and their sets: The following table summarizes crucial ideas: 1. flexibility in transition label packing ...
HFST: API CVS Repository The repository is in corpus.csc.fi in directory /c/appl/ling/koskenni/cvsrepo/hfst/ . The repository contains the following files: ...
HFST: Symbol Layer API This document deals with the datatypes related to symbol manipulation and support of symbols at the API level. Datatypes for Symbols and Symbol ...
HFST: Transducer Extension Layer API This document deals with the extension functions to the Transducer API. The functions may or may not become part of the core API ...
HFST: Transducer Layer API This document deals with the datatypes related to transducer calculus and support. This layer is depends on HfstAPIFundamentalKeyLayerOLD ...
hfst affix guessify Purpose Create weighted affix guesser from automaton. Usage The help message: Usage: hfst affix guessify OPTIONS... INFILE Create weighted ...
HFST: List of All Project Documentation Pages If you need to enter a new page, you are requested to use the box below. Using the box sets up some useful technical ...
HFST: Missing ammintrin.h header file for windows Fetched from here: / Copyright (C) 2007 2008 Advanced Micro Devices Inc. All rights reserved. The information ...
HFST Application tutorial Introduction This tutorial has two aims: to demonstrate different approaches to constructing and utilizing a morphology (corpus based, dictionary ...
HFST: (name of this topic page) 12:45 For everyone using hfst xfst, the latest commit to git repository: `Swap implementations of `apply up` and `apply down` in hfst ...
For installing instructions, see INSTALL . Briefly, the usual ./configure make (as root) make install should result in a local installation ...
HFST: Benchmarking HFST on Morphologies and Other Linguistic Applications HFST version 3.3.3 Morphologies language description fetched from Finnish ...
HFST: Better Cola Machine We exemplify the use of HFST command line tools with an example taken from Beesley Karttunen (Finite State Morphology, pages 466 469 ...
HFST: Better Cola Machine Script For more information, see HfstBetterColaMachine. echo ` ? ` hfst regexp2fst f $FORMAT Solution for i in ` D N^2, Q N^5 ...
HFST: Runtime Binary Format Unweighted Examples All examples below use this symbol set. As described in RuntimeBinaryFormat, epsilon is by default in position 0, and ...
HFST: Runtime Binary Format Weighted Examples All examples below use this symbol set. As described in RuntimeBinaryFormat, epsilon is by default in position 0, and ...
HFST: Brazilian Portuguese We exemplify the use of HFST command line tools with an example taken from Beesley Karttunen (Finite State Morphology, pages 470 473 ...
HFST: Brazilian Portuguese Script For more information, see HfstBrazilianPortuguese. echo ` a e i o u ` \ ` á é í ó ú ` \ ` â ê ...
HFST: Bugs Reported bugs and their resolutions. HFST bugs should be reported to hfst bugs #64;helsinki.fi with following information included: Program name and ...
HFST: How to install HFST to CSC`s servers This guide describes the installation of HFST on CSC servers, at present taito shell.csc.fi. You might want to read this ...
HFST: Audit of the API Contracts and Their Relationship with Closure Properties The purpose of this page is to 1. collect the well known closure properties of ...
HFST: Examples of HFST Command Line Tools The examples listed here are taken from Karttunen. They show how basic HFST command line tools can be combined to create ...
HFST: Command Line Tool Functionalities General The Helsinki Finite State Transducer software is intended for the implementation of morphological analysers and other ...
HFST: Command Line Tools HFST tools is a collection of HFST based command line utilities that can create, operate and print transducers using the HFST interface. ...
HFST: Command Line Tools Tutorial Cat to Dog We give a simple example of creating a transducer that maps `cat` to `dog` with weight 1.5 and printing the string ...
The inputs may either come from a file or STDIN . In both cases the inputs consist of binary transducers. Only one of the inputs may come from STDIN . Input files ...
Parameters common for all commandline programs taking two transducer input streams and writing one transducer stream as output. o , output OUTFILE Write results ...
Parameters common for all commandline programs. h , help Print help message V , version Print version info v , verbose Print verbosely ...
Parameters common for all commandline programs taking one input stream and writing transducers or text as output. i , input FILENAME Read input from FILENAME ...
Parameters common for all commandline programs taking one input stream and writing text as output. i , input FILENAME Read input transducer from FILENAME ...
hfst compare Purpose Compare two transducers for equivalence. Two transducers are equivalent, if they map the same input strings to the same output strings with the ...
HFST: Compatibility with other systems Legend: $ Y: Yes, this feature is fully implemented in this tool $ N: no, this feature is not implemented at all in this ...
HFST: How to compile HFST for Windows Tools needed See here for instructions how to install both Windows SDK 7.1 and Visual C 2010 Express: If you have Visual C ...
hfst compose Purpose Compose two transducers. Usage The help message: Usage: hfst compose OPTIONS... INFILE1 INFILE2 Compose two transducers Common options ...
hfst compose intersect Purpose Compose lexicon with intersection of rules. Usage The help message: Usage: hfst compose intersect OPTIONS... INFILE1 INFILE2 ...
hfst concatenate Purpose Concatenate two transducers. Usage The help message: Usage: hfst concatenate OPTIONS... INFILE1 INFILE2 Concatenate two transducers ...
hfst conjunct Purpose Conjunct (intersect, AND) two transducers. Usage The help message: Usage: hfst conjunct OPTIONS... INFILE1 INFILE2 Conjunct (intersect ...
HFST: Creating spell checkers Creating spell checker from HFST based dictionaries is relatively simple. These spell checkers can easily be integrated to systems like ...
HFST: Cross compiling for 32 bit with hfst computer A 32 bit operating system is installed to hfst computer at directory /mnt/i386/ . This system can be used to create ...
HFST: CVS Repository The HFST functionalities are divided in three repositories. The repositories are on csc.fi servers in directory /c/appl/ling/koskenni/cvsrepo ...
HFST: Date Parser We examplify the use of HFST command line tools with an example taken from Beesley Karttunen that creates a transducer that recognizes English ...
HFST: Date Parser Script See HfstDateParser for more information. NOTE: This script should be updated because some parts of it are implemented differently from the ...
Debian packages are currently released as part of Apertium, so this page is not so relevant any more HFST: Debian Releasing on HFST computer Back end libraries ...
HFST: Hfst Debian Releasing (Old) The dummy library and tools You are in the directory libraries for debian testing that contains the files foo.h, namespace foo ...
HFST: Demo Outline The analyzer and generator demos on the internet are intended to demonstate our capabilities to morphologically analyze and generate various languages ...
hfst determinize Purpose Determinize a transducer, i.e. create an equivalent, epsilon free transducer that has no state with two or more transitions that have the ...
HFST: Developer Pages General HfstProgrammingPractices HFST Coding style and best common practices HfstPreReleaseTesting HFST: Testing Pre Release Versions ...
HFST: API Development Outline For a full doxygen documentation of the currently implemented API layers, see API Documentation. HFST #8211; The Helsinki Finite State ...
HFST: Dictionaries This is a list of dictionaries and other language models or rulesets compiled and usable with HFST tools. Morphological analysers For morphologically ...
Does not yet work. MiikkaSilfverberg 2009 03 12
hfst disjunct Purpose Disjunct (union, OR) two transducers. Usage The help message: Usage: hfst disjunct OPTIONS... INFILE1 INFILE2 Disjunct (union, OR) two ...
HFST: Documentation Guide The purpose of this page is to collect information about things that we need to know in order to produce good documentation with Doxygen ...
HFST: Downloads For information on newest releases, see notes on our Github pages. To see what we offer, see the overview page. Morphologies, hyphenators and spellers ...
hfst duplicate Purpose Use first transducer of an archive repeatedly. Usage The help message: Usage: hfst duplicate OPTIONS... INFILE Use first transducer of ...
hfst edit metadata Purpose Set values of properties in transducer headers. Usage The help message: Usage: hfst edit metadata OPTIONS... INFILE Name a transducer ...
HFST: Einstein`s Puzzle This page shows how to use HFST command line tools to solve a riddle in a similar way as Karttunen have done with the XFST tools. We advise ...
HFST: Einstein`s Puzzle as an HFST Commandline Tool Script See HfstEinsteinsPuzzle for more information. # matches all symbols echo `0 0 @ IDENTITY SYMBOL @ @ IDENTITY ...
HFST: English Numerals We examplify the use of HFST command line tools with an example taken from Karttunen that creates a transducer that recognizes English numerals ...
HFST: English Numerals Script See HfstEnglishNumerals for more information. # From `one` to `nine`: echo `one two three four five six seven eight nine` hfst strings2fst ...
HfstErzya Compiling Erzya automata with HFST 3 tools. Hfst lexc All lexicons compile with hfst lexc or foma, so using hfst lexc o file in place of lexc`s compile ...
HFST: Esperanto We exemplify the use of HFST command line tools with a set of examples taken from Beesley Karttunen (Finite State Morphology, pages 476 482). See ...
HFST: Esperanto Script For more information, see HfstEsperanto. Esperanto Nouns echo `bird hund kat elefant` hfst strings2fst j f $FORMAT Nouns echo ` i n ...
Examples of Morphologies Compiled with HFST HfstNorthernSami HFST: An example: Compiling Northern Sami with HfstLexc and HfstTwolC HfstErzya HFST: An example ...
HFST: File Extension Guidelines There is need for some uniform naming policy for different files used in different stages of transducer development. This page contains ...
HFST: FIN CLARIN Seminar June 9th 2014: HFST Interfaces and environments Windows Linux Mac Command line tools NSIS installers (32/64 bit) Debian ...
HFST: an example of compiling omorfi You may also read the full and up to date story at home page and Omorfi wiki Omorfi is an implementation of Finnish morphology ...
HFST: Finnish Numerals from 1 to 99 In Karttunen, the following task is given: Construct a transducer that maps the numbers 1 99 to numerals in some language other ...
HFST: Finnish Numerals Script See HfstFinnishNumerals for more information. # First, we create a transducer that maps numbers 2 ... 9 to the corresponding numerals ...
HFST: Finnish OT Prosody NOTE: The character #180; shows as #180; inside the verbatim sections, probably due to a bug in KitWiki formalism. We examplify the ...
HFST: Finnish OT Prosody Script See HfstFinnishOTProsodyScript for more information. NOTE: The character #180; shows as #180; inside the verbatim sections ...
HFST: Finnish Prosody NOTE: The character #180; shows as #180; inside the verbatim sections, probably due to a bug in KitWiki formalism. We examplify the use ...
HFST: Finnish Prosody Script See HfstFinnishProsody for more information. NOTE: The character #180; shows as #180; inside the verbatim sections, probably due ...
Does not yet work. ErikAxelson 2010 11 29
HFST: hfst foma Purpose Parse Xerox XFST scripts with foma and convert stacks to HFST format. This is just a wrapper around foma, the corresponding native HFST tool ...
hfst foma wrapper.sh Purpose Parse Xerox XFST scripts with foma and convert stacks to HFST format. This is a script used by hfst foma and not intended to be used ...
HFST: Hfst for Windows Functionalities offered for Windows Currently we offer experimental installers for Windows on our page. The file install hfst V.V.V 32 64 ...
hfst format Purpose Determine HFST transducer format and print it to output. Usage The help message: Usage: hfst format OPTIONS... INFILE determine HFST transducer ...
HFST: Freedom The Freedom of HFST means that it can be used for research and teaching in addition to a number of other useful purposes especially also for commercial ...
HFST: Move from Sourceforge to Github After migration The main page is https://github.com/hfst/. The web page is https://hfst.github.io/. The main page ...
hfst fst2fst Purpose Convert transducers between binary formats. Usage The help message: Usage: hfst fst2fst OPTIONS... INFILE Convert transducers between binary ...
hfst fst2strings Purpose Display the string pairs recognized by a transducer, i.e. paths that lead from the initial state to a final state. Usage The help message ...
hfst fst2txt Purpose Print transducer in AT T tabular format. Usage The help message: Usage: hfst fst2txt OPTIONS... INFILE Print transducer in AT T, dot, prolog ...
HFST: Generalized Rule Compiler see also: Set ALLOWTOPICCHANGE OMorFiGroup, KitWikiAdminGroup KristerLinden 27 May 2008
hfst grep Purpose Search for PATTERN in each FILE or standard input. Usage The help message: Usage: hfst grep OPTIONS... PATTERN FILE... Search for PATTERN in ...
hfst guess The guesser is part of HFST (University of Helsinki Finite State Transducer interface) finite state toolkit distribution; a tool that guesses morphological ...
hfst guessify The guesser compiler is part of HFST (University of Helsinki Finite State Transducer interface) finite state toolkit distribution; a tool that creates ...
hfst head Purpose Get N first transducers from an archive. Usage The help message: Usage: hfst head OPTIONS... INFILE Get first transducers from an archive Common ...
Helsinki Finite State Transducer Technology (HFST) The goal is to create a high performing, maintainable and modifiable set of tools for morphological analysis ...
hfst info Purpose Print known data of the HFST library installed on the computer. Usage The help message: Usage: hfst info OPTIONS... INFILE show or test HFST ...
HFST: A script for installing morphologies on Hippu #!/bin/sh # This script downloads and installs HFST morphologies and acompanying scripts # Requires HFST installation ...
HFST: Installing web demos, quick and dirty method If you need to install the web demos on a machine where you have limited access, but enough to install binaries ...
HFST: Tutorial for Interactive HFST Tools Interactive HFST tools include hfst xfst, hfst proc and hfst lookup. Examples All tools can be invoked from command line ...
hfst invert Purpose Invert a transducer. Usage The help message: Usage: hfst invert OPTIONS... INFILE Invert a transducer Common options: h, help ...
HFST Java Runtime To run and test binary transducers with java you need to have hfstruntime.jar file in your classpath. Hfstruntime.jar is not yet publicly available ...
HFST: Joint Copyright Assignment Open Source Project Joint Copyright Assignment by Contributor to Helsingin yliopiston yleisen kielitieteen laitos, hereafter the ...
HFST: Getting a corpus to Korp This page tells how to install Korp to your own machine and convert a corpus to a format understood by Korp tools. You probably need ...
hfst lexc Purpose Compile lexc files into an HFST transducer. Usage hfst lexc OPTIONS INFILEs... The help message: Usage: hfst lexc OPTIONS... INFILE1... ...
HFST: Tutorial hfst lexc and hfst twolc Introduction The programs hfst lexc and hfst twolc presented in this tutorial are used for constructing a lexical transducer ...
HFST: hfst lexc CVS Repository structure Hfst lexc is contained in hfst lexc/ directory of HfstCvsRepositoryOLD. The directory structure in there contains the familiar ...
hfst lexc wrapper Purpose Compile lexc files into transducer or imitate Xerox lexc. This is a wrapper around foma lexc, and does not support weights. For a native ...
HFST: License The Helsinki Finite State Transducer library is intended for the implementation of language technology tools which are based on weighted and unweigted ...
HFST: Lingala We examplify the use of HFST command line tools with an example taken from Beesley Karttunen that generates a lexical analyzer for Lingala, a Bantu ...
HFST: Lingala Script For more information, see HfstLingala. echo ` {bet} {béb} {bomb} {bóndel} {bóngol} {bót} {búk} {fung} {kabol} {kang} {kom ...
hfst lookup Purpose Perform fast transducer lookup, i.e. look up a set of input strings in the transducer and print the corresponding output strings. Usage The ...
??? Set ALLOWTOPICCHANGE OMorFiGroup, KitWikiAdminGroup SjurMoshagen 2009 10 27
HFST: Migrate Kitwiki Documentation to Github Wiki pages This page lists all pages given in HfstAllPages and tells what should be done to them when migrating the documentation ...
hfst minimize Purpose Minimize a transducer, i.e. create an equivalent, epsilon free, deterministic transducer that has as few states as possible. Usage The help ...
HFST: Miscellaneous observations Test equivalence for transducers like a: :b , :b a: and a:b . None of these are equivalentwhen testing with weighted ...
HFST: Monish Analysis We exemplify the use of HFST command line tools with an example taken from Beesley Karttunen (Finite State Morphology, pages 473 474). See ...
HFST: Monish Analysis Script For more information, see HfstMonishAnalysis. echo ` i e é ä ` hfst regexp2fst f $FORMAT FrontV echo ` u o ó a ` ...
HFST: Monish Guesser Analyzer We exemplify the use of HFST command line tools with an example taken from Beesley Karttunen (Finite State Morphology, pages 475 ...
HFST: Monish Guesser Analyzer Script For more information, see HfstMonishGuesserAnalyzer. echo ` i e é ä ` hfst regexp2fst f $FORMAT FrontV echo ` u ...
hfst multiply Purpose Use first transducer of an archive repeatedly. Usage The help message: Usage: hfst multiply OPTIONS... INFILE Use first transducer of an ...
hfst name Purpose Name a transducer or print its name. Usage The help message: Usage: hfst name OPTIONS... INFILE Name a transducer Name options: n, name ...
HFST: (name of this topic page) We offer a new Python interface generated with SWIG through which HFST library can be used more easily. Compiling HFST with Windows ...
HFST: Ideas for a new Python API Feature requests DONE, SPEED IS ABOUT THE SAME: Support lookup for tropical Openfst transducers. Currently: import ...
HFST: Utilities for Compiling a Northern Sami Lexical Transducer Current versions of giellatekno projects support HFST compiling out of the box. Just say make GTLANG ...
HFST: Numbers to English Numerals We examplify the use of HFST command line tools with an example taken from Beesley Karttunen that creates a transducer that ...
HFST: Numbers to English Numerals Script See HfstNumbersToNumerals for more information. # From one to nine. echo `1:one 2:two 3:three 4:four 5:five 6:six 7:seven ...
OMor: Omorfi leksikon ja hfst runtime rajapinnan tekijöiden kokouksia. 24.10.2008 Ensi perjantaihin mennessä: Inari Laati aikataulun oman työnsä edistymiselle ...
HFST: (name of this topic page) osx MathLink linking error after OS X 10.9 (Mavericks) upgrade This is the working config line: ./configure enable lexc enable ...
How OpenFst and dl libraries were added under HFST (1) Make directories openfst and dlfcn under hfst3 root. (2) Copy OpenFst win32 version files under ...
HFST: OpenAutomata: Home Open and Language Independent Automata Based Resource Production Methods for Common Language Research Infrastructure This page is related ...
This document details the format HFST uses for fast lookups. The tool for fast lookups in HFST2 tool suite has been replaced by generic HfstLookUp.
hfst optimized lookup This is an old tool, use the generic tool hfst lookup instead. Purpose Load a transducer in the HFST optimized lookup format, take input one ...
HFST: Optimized Lookup Format HfstOptimizedLookupFormat is a binary transducer format optimized for lookup speed (eg. hundreds of thousands of words per second) ...
hfst optimized lookup java Note hfst optimized lookup java is not current. The transducers shipped with hfst 2.0 work, but since then there have been bugfixes and ...
hfst optimized lookup python hfst optimized lookup python provides a native Python package for lookup (both as a utility and as an interface) and a C implementation ...
hfst ospell Purpose Spell check using HFST finite state automata. This is a modest test tool. For full fledged spelling checkers, look into voikko and enchant. Usage ...
hfst ospell spell check using hfst finite state automata See HfstOspell for an updated version of this page. SYNOPSIS hfst ospell OPTIONS ERRORSOURCE LEXICON ...
HFST Ospell #8217;s README This has been semi automatically converted from hfst ospell software`s README file. Hfst ospell library and toy commandline tester This ...
HFST: Other interpreted as a simple symbol This page is devoted to one particular and simple interpretation for other (alias ? ) and the corresponding implementation ...
HFST: Identity Other and Nonidentity Other interpreted as simple symbols This page is an extension of page HfstOtherAsSimpleSymbol contributed by Kimmo Koskenniemi ...
HFST: Definition of other and its relation to any This gives one consistent view of the other and any symbols when used in transitions. In FSAs, the other ...
HFST: Interpretations and Requirements for the other Symbols This page is for discussing the useful interpretations of an other symbol when used in transitions ...
HFST: Examples of how other symbols should be handled in transducer operations. This page poses questions and gives examples about the way other symbols should be ...
HFST: Use of other and Similar Metasymbols in Symbol (Pair) Calculus This page is withdrawn from further processing. I started again with HfstOtherAsSimpleSymbols ...
HFST: `Other` symbols in use Open Input and Output Alphabets in Two Level Grammars Is a Good Thing Actually, it might be a good idea to allow two level rules to have ...
HFST: Overview and Quick Start Overview The Helsinki Finite State Transducer toolkit is intended for processing natural language morphologies. The toolkit is demonstrated ...
hfst pair test Purpose Test a twol rule file using correspondences of strings. Usage The help message Usage: hfst pair test OPTIONS... INFILE pair test for a ...
HFST:Palindromes Under construction... We examplify the use of HFST command line tools with an example taken from Beesley Karttunen that creates a transducer that ...
HFST: Palindromes Script See HfstPalindromes for more information. # We assume that /usr/dict/words, a 23K English # word list, is available on the machine. # We first ...
HFST Performance Testing: Observations Composition for i in a b c d e; do \ for j in `` a b c d e; do \ for k in `` a b c d e; do \ for l in `` a b c d e; do \ for ...
HFST: Plus or Minus NOTE: The solution does not work at the moment, because rules are not yet implemented in hfst regexp2fst We examplify the use of HFST command line ...
HFST: Plus or Minus Script For more information see HfstPlusOrMinus. echo ` 1 2 3 4 5 6 7 8 9 ` hfst regexp2fst f $FORMAT N echo ` `0` N ` hfst regexp2fst ...
hfst pmatch Purpose Perform matching/transformation on text streams with a RTN system. Usage The help message: Usage: hfst pmatch OPTIONS... TRANSDUCER perform ...
hfst pmatch2fst Purpose Compile regular expressions into transducer(s) for use with hfst pmatch. Usage The help message: Usage: hfst pmatch2fst OPTIONS... INFILE ...
HFST: Testing Pre Release Versions instructions for early adopters This file describes usage information for early adopters using SVN or pre release tarballs. Installation ...
hfst proc Purpose A tool for performing morphological analysis and generation with finite state transducers in HFST optimized lookup format. This program is intended ...
HFST Coding style and best common practices This file contains information on coding conventions, and guidelines for implementation. When contributing code to project ...
hfst project Purpose Project a transducer towards input or output level. Usage The help message: Usage: hfst project OPTIONS... INFILE Project (extract a level ...
HFST: Patents to be avoided see also: Set ALLOWTOPICCHANGE OMorFiGroup, KitWikiAdminGroup KristerLinden 27 May 2008
hfst prune alphabet Purpose Remove symbols from the alphabet of a transducer that do not occur in any transitions. Usage The help message: Usage: hfst prune alphabet ...
HFST: Publications HFST Publications On the current repository, you can find recent publications. It may also be possible to find the relevant publications in the ...
hfst push weights Purpose Push weights of a transducer towards initial state or final states. Usage The help message: Usage: hfst push weights OPTIONS... INFILE ...
HFST: Python bindings This page has instructions for installing and compiling HFST Python interface. The interface works with python version 3 (tested and developed ...
HFST: README This is semi automatically converted version of the README of HFST distribution. Helsinki Finite State Technology (library and application suite) This ...
hfst regexp2fst Purpose Compile simple (weighted) regular expressions into transducer(s). Usage The help message: Usage: hfst regexp2fst OPTIONS... INFILE Compile ...
HFST: Tool for Regression Testing see also: Set ALLOWTOPICCHANGE OMorFiGroup, KitWikiAdminGroup KristerLinden 27 May 2008
HFST: Making a new release of HFST At Github Releases, offer source package: hfst x.y.z.tar.gz minimal lgpl licensed source package: libhfst x.y.z.tar.gz ...
hfst remove epsilons Purpose Remove epsilons from a transducer, i.e. create an equivalent transducer that has no epsilon transitions. Usage The help message: Usage ...
hfst repeat Purpose Repeat a transducer from N to M times. Usage The help message: Usage: hfst repeat OPTIONS... INFILE Repeat transducer Common options: ...
hfst reverse Purpose Reverse a transducer. Iff the original transducer accepts string s0 s1 s2 ... sN , the reversed transducer will accept string sN s(N 1) ...
hfst reweight Purpose Reweight transducer weights simply. Usage The help message: Usage: hfst reweight OPTIONS... INFILE Reweight transducer weights simply Common ...
HFST: Runtime Transducer Binary Format The HFST Runtime API is separate from the HFST Tool Development APIs. The Runtime API is intended for using ready made transducers ...
HFST: HFST Server The server The HFST server is located in . The IP address is . We offer no backup for users` files or other data. If you work on HFST code ...
hfst sfstpl2fst (alias hfst calculate) Purpose Compile a file written with SFST programming language into a transducer. Usage The help message: Usage: hfst sfstpl2fst ...
hfst shuffle Purpose Shuffle two transducers. Usage The help message: Usage: hfst shuffle OPTIONS... INFILE1 INFILE2 Shuffle two transducers Common options ...
HFST: Ideas for Software project If you are interested in participating please come to IRC channel #hfst on Freenode network (link: irc://Freenode/#hfst , if your ...
Building weighted finite state spell checkers with HFST tools Presented in FSMNLP 2012, Donostia. See also, the slides. Compiling a language model from corpora This ...
hfst split Purpose Extract transducers from a fileset (archive) with systematic file names. Usage The help message: Usage: hfst split OPTIONS... INFILE Extract ...
HFST: String and text format issues The epsilon symbol functionality default tools note print strings the empty string fst2strings , lookup ...
hfst strings2fst Purpose Compile string pairs or pair strings into transducer(s). Usage The help message: Usage: hfst strings2fst OPTIONS... INFILE Compile string ...
HFST: Examples of hfst strings2fst and hfst fst2strings Frequencies of two different plurals of `cactus`: cactus Pl:cacti 2980000 cactus Pl:cactuses 480000 ...
hfst substitute Purpose Relabel transducer arcs or replace them with a copy of a transducer. Usage The help message: Usage: hfst substitute OPTIONS... INFILE ...
hfst subtract Purpose Subtract (minus) two transducers. Usage The help message: Usage: hfst subtract OPTIONS... INFILE1 INFILE2 Subtract (minus) two transducers ...
hfst summarize Purpose Calculate the properties of a transducer. Usage The help message: Usage: hfst summarize OPTIONS... INFILE Calculate the properties of ...
HFST: Swelex #150; Morphological Analyser for Swedish ErikAxelson 2011 03 04
SWIG bindings for HFST SWIG is a compatibility layer between C/C code and higher level languages. For HFST, the library has been wrapped with SWIG to produce Python ...
This page is for discussing proposals for handling special symbols and alphabet affecting operations in HFST. I have only few general ideas to record: The user facing ...
hfst symbols Purpose A tool for removing, adding and separating symbol tables. Usage hfst symbols OPTIONS INPUT FST FILE Parameters Parameters specific ...
hfst tag The tagger programs are part of HFST (University of Helsinki Finite State Transducer interface) finite state toolkit distribution; a tool that creates weighted ...
hfst tail Purpose get N last transducers from an archive. Usage The help message: Usage: hfst tail OPTIONS... INFILE Get last transducers from an archive Common ...
HFST: Terminology Morphological Descriptions Below we list some of the key concepts used in morphological descriptions. Some of them are used differently in SFST ...
HFST: Tokenizers for All The purpose of this page is to investigate the tokenizer technology needed in typical FST applications. We hope to do this as joint work ...
HFST: Testing the functionality of HFST tools Options common for all tools: h help V version v verbose q quiet s silent ...
HFST: (name of this topic page) (contents of this page)
hfst train tagger The tagger programs are part of HFST (University of Helsinki Finite State Transducer interface) finite state toolkit distribution; a tool that creates ...
HFST: HFST Transducer Formats General This page discusses differences between different backend transducer formats and things that must be taken into consideration ...
HFST: HfstTransducer Header Format The header structure An HFST version 3.0 transducer in binary format consist of an HFST header and the transducer of the backend ...
HFST: Transducer Properties Notes on how properties of an OpenFst transducer could be calculated in SFST. ( # means `number`. ) An `x` in the column W indicates ...
HFST: Test Cases for Runtime Transducer To properly the test transducer functionality we need some systematic way to conduct tests for different transducers and ...
hfst traverse Doesn`t work currently Help message Usage: hfst traverse OPTIONS... INFILE Walk through the transducer arc by arc Common options: h, help ...
hfst twolc #8722; A Two Level Grammar Compiler Purpose Compile a two level grammar in Xerox Twolc formalism into a weighted or unweighted HFST transducer. Usage ...
HFST: hfst twolc CVS Repository hfst twolc can be aquired from the CVS repository on the server corpus. The directory is htwolc. It contains the files rw r r ...
HFST: Notes on the compilation of two level rules Alternative way to compile rules with several context parts There are two well known methods to compile right arrow ...
hfst txt2fst Purpose Convert AT T tabular format into a binary transducer. Usage Usage: hfst txt2fst OPTIONS... INFILE Convert AT T or prolog format into a binary ...
HFST: Unknown Symbol Tool Support hfst strings2fst identities possible, but not expanded and must be separated by spaces (this is true for all special ...
hfst unweighted2weighted Purpose Transform an unweighted transducer to a weighted one. All weights are initialised to zero (in the tropical semiring). Usage hfst ...
Using HFST as spell checker This page shows how to setup a HFST based spell checking system. First component is (download link), install it like so (do note that dollar ...
This page has been merged with HfstOverviewAndQuickStart.
HFST: Using weights Weights From end user perspective, weight tells how probable a word or its analysis is. The weight can be thought as a penalty, i.e. words/analyses ...
HFST: How to use VPATH property of Autoconfiscation tools to build debug and optimised version from the same source This applies to all autoconfiscated project that ...
%{`Template head copied from view.pattern.tmpl, with meta robots tag removed`
HFST: Webpage Version Control How to edit the HFST webpages at http://www.ling.helsinki.fi/kieliteknologia/tutkimus/hfst/: Go to directory /web/ling/kieliteknologia ...
hfst weighted2unweighted Purpose Transform a weighted transducer to an unweighted one. Usage hfst weighted2unweighted OPTIONS... INFILE Parameters Details ...
HFST: SFST style OpenFst see also: Set ALLOWTOPICCHANGE OMorFiGroup, KitWikiAdminGroup KristerLinden 27 May 2008
hfst xfst Purpose Parse weighted Xerox XFST scripts or execute XFST commands in interactive mode. Input files are always treated as UTF 8. Usage The help message ...
HFST: Implementing a compiler for XFST scripts Conformance levels: 1. Basic algebra with closed alphabets 1. Basic algebra with open alphabets and known alphabets ...
TODO: document. ErikAxelson 2010 11 29
HFST: The Yale Shooting Problem We examplify the use of HFST command line tools with an example taken from Beesley Karttunen. $FORMAT is the implementation type ...
HFST: Yale Shooting Problem Script For more information, see HfstYaleShooting. FORMAT TRANSDUCER FORMAT # We start our version of the Yale Shooting xfst script with ...
Core Contents in the HLT Master`s programme Tavoitteena on kerätä tietoa kurssien ydinaineksesta tälle sivulle. Ydinaines kuvataan niiden käsitteiden joukkona, jotka ...
This page is for drafts of the new curriculum. HY TKK Tilanne nyt: Tavoitteena on muuttaa HY:n tutkinnon pakollisten opintojen osuus 20 opintopisteeksi, jolloin ...
Degree Requirements Tutkintoon sisältyvät opinnot, luonnos Opintokokonaisuus/Moduuli HY kieliteknologia HY käännösteknologia HY puheteknologia HY tietojenk ...
Master`s Programme in Speech, Language and Translation Technologies These pages are for developing the present Kieli , puhe ja käännösteknologian maisteriohjelma ...
Kieliaineiden opiskelija, erikoistumisala kieliteknologia yhteensä 120 op sekä skriptiohjelmointi että ohjelmoinnin perusteet mukana, tarvitaanko molempia ...
Kieliaineiden opiskelija, erikoistumisalana puheteknologia teknisinä taitoina unix perusteet, rakenteisten dokumenttien perusteet ja säännölliset lausekkeet, ...
Kieliaineiden opiskelija, erikoistumisalana käännösteknologia yleisen kielitieteen opinnot ja fonetiikka tehty ei sisällä : morfologinen ja syntaktinen j ...
Tietojenkäsittelytieteen opiskelija, erikoistumisalana tietojenkäsittelytiede Opintojakso x op Valmentavat opinnot yht 16 19 op Fonetiikan ...
Tietojenkäsittelytiede (esim. JoY) erikoistumisala kieliteknologia perusopinnot kieliteknologiasta tehty KIT verkostossa yht. 148 op (opiskelija haluaa tehd ...
How to set up a microphone in Windows XP 1. Attach your microphone to the computer 1. Open the Speech Control Panel. You can adjust the settings in the ...
CLT131: Tekstityökalut (Syksy 2010) Main.TommiPirinen Kurssin luennoitsija Kurssiassistentti Tätä sivua voi käyttää yhteistyöhön ja muistiinpanojen ...
CLT131: Tekstityökalut (Syksy 2011) Main.TommiPirinen Kurssin luennoitsija Tätä sivua voi käyttää yhteistyöhön ja muistiinpanojen tekemiseen, sekä kysymysten ...
1. Sinä otat lusikan sinä Pron Sg2 Nom ottaa V Pres Sg2 ACT lusikka N Sg Akk 2. Me olemme iloisia me Pron Pl1 Nom olla V Pres Pl2 ACt iloinen Adj Pl Part 3. ...
Ongelma 1: SD ohjelman symbolit eivät ole ASCII muodossa. Tämä hankaloittaa elämääni kohtalaisen paljon, koska en voi suoraan liittää tarvittavaa lingvististä informaatiota ...
Morfologisesta astevaihtelusta Lähde: Iso suomen kielioppi, sivu 73 Astevaihtelu lkm Suora astevaihtelu vaihtelu käänteinen astevaihtelu lkm ...
PROSEMINAARITYÖ Proseminaarityön esitys on 25.4.2007. Esityksen aihe on `Tutkielma Kotimaisten kielten tutkimuslaitoksen Nykysuomen sanalista korpuksessa mahdollisesti ...
Päiväkirja Päiväkirjaa ei ole päivitetty sen verran pitkään aikaan, että poistin sen kokonaan. Tulevat tapahtumat: 24.1.2007 esitelmä PetriUusitalo 13 Sep ...
ALPHABET a zöä # NOUN NOM INE SG PL GEN ALL ELA ADE ABL : $NOUN SET1$ talo savu $NOUN SG$ $NOUN SET1$ # NOM \ $NOUN SET1$ ...
ALPHABET a zöä V: eiouyöä # NOM INE SG PL GEN ILL : $NOUN SET1$ talo savu $NOUN SG$ $NOUN SET1$ # NOM \ $NOUN SET1$ # n GEN ...
ALPHABET A Za z NOUN NOM INE SG PL GEN : $VCONS$ b m v d n l r g j $VOWEL$ a e i o u y ä ö $NOUN SET1$ {kuppi}:{kup ...
Esim 4 Tämä ei toimi kunnolla koska, hyväksyy illatiivissa vääriä muotoja: taloon, taloun, savuun, savuon. ALPHABET a zöä V: eiouyöä # : $NOUN SET1$ talo ...
Esim 5 Tämä ei toimi kunnolla, koska tämä hyväksyy illatiivissa vääriä muotoja. talolla, talollä, isällä, isälla. ALPHABET a zöä A: aä @# NOUN NN NOM INE ...
Esim 6 ALPHABET a zöä A: aä V: aeiouyäö \ \ @# : $NON FRONT VOWEL$ b c d e f g h i j \ k l m n p q r s ...
Esim 7 ALPHABET a zöä A: aä V: aeiouyäö \ : k \ \ @# : $NON FRONT VOWEL$ b c d e f g h i j \ k l m n p q ...
Esim 8 ALPHABET a zöä A: aä V: aeiouyäö \ kk : k \ \ @# NOUN NN NOM INE SG PL GEN ILL ALL ELA ADE ABL ESS : $NON FRONT VOWEL$ b c ...
Esim 9 ALPHABET a zöä A: aä V: aeiouyäö I: ie \ \ @# NOUN NN NOM INE SG PL GEN ILL ALL ELA ADE ABL ESS : \ kk : k $NON ...
Ohjelman suoritus sekvenssi Sanalistan lukeminen: Oletetaan toistaiseksi, että sanalista on muotoa, jossa on riveittäin sanoja. Sanat ovat sanakirja muodossa, eli ...
Morfologisien jästentimien evalointi Joitakin haja ajatuksia morfologisen jäsentimen evaluoinnin toteuttamiseksi. Data formaatti Tarvitaan jonkinlainen yleinen formalismi ...
Noiminien taivutustyypit nominatiivi genetiivi partitiivi illatiivi m.genetiivi m.partitiivi m.illatiivi valo valo n ...
Nominien taivutus Nomineille luodaan kuusi erilaista vartaloa riippuen astevaihtelusta ja taivutustyypistä riippuen. Nimitämme muotoja tässä seuraavasti: perusmuoto ...
Nominien taivutus Sijat Sijoissa taipuvat nominit ja infiniittiset verbimuodot. Nominatiivi Genetiivi Partitiivi Akkusatiivi Essiivi ...
Ohjelman toimintaperiaatteet Toiminta perustuu tähän. Seuraavassa on selitetty ohjelman yleiset toimintaperiaatteet. Aluksi toteutetaan ainoastaan nominien taivutus ...
valo S01 A00 palvelu S02 A00 valtio S03 A00 laatikko S04 A05 risti S05 A00 paperi S06 A00 banaani S06 A00 ovi S07 A00 nalle ...
Suomen kielen nominien morfologinen jäsennin Johdanto Tehtävän kuvaus Syötteet Tulosteet Rajaukset Nominien taivutus ...
Syntaksin harjoituskurssin muistiinpanoja Tämä dokumentti liittyy samaan aikaan käymääni syntaksin harkoituskurssiin. Tämä ei siis varsinaisesti liity proseminaariin ...
Taivutustyypit I astevaihtelematon muoto II astevaihtelun alainen muoto Taivutustyyppi T01 Oletetaan, että kaikki T01:een kuuluvat nominit ovat o loppuisia. Esimerkki ...
Kotimaisten kielten tutkimuskeskuksen sanalistan komputerisointi Johdatus Tarkoituksena olisi muokata annettu sanalista sellaiseen muotoon, että siitä voidaan muodostaa ...
Ctl292/Clt240 Sari Hyvärinen: Viittomien animoinnista Palaan tälle kurssille tekemään oman proseminaarityöni valmiiksi. Olen aloittanut sen tekemisen jo jonkin ...
Nykysuomen sanalistan, Joukahainen sanaston ja Käänteissanakirjan yhdistäminen Viimeistelyä vailla oleva versio kandidaatintyöstäni: http://cs.helsinki.fi/u/listenma ...
Aikaisempien tutkielmien ja tieteellisten artikkeleiden rakenneanalyysiä Tutkielmien erilaisia jakoja päälukuihin Tekijä vuosi tutkielma otsikko ...
Tutkielmien tekoon liittyvää LaTeX tietoa Työkaluja: TexLive (Mac, Linux), MikTeX, TeXnicCenter, Kile ja KileOnWindows (Windows) Inkscape, OpenOffice: Drawing ...
Kieliteknologisen tutkimuksen ja tieteenalan erityispiirteitä AnssiYliJyra 2012 11 21
Viittauskäytännöistä kieliteknologiassa ja kielitieteessä AnssiYliJyra 2012 11 21
Evaluointia R:llä sana on vapaa Taulukoiden käsittelyä Esimerkkidatan lukeminen R:ään kurssin web sivutiedostosta kehys muuttujaan onnistuu myös näin: read ...
X2 jakauma Menetelmän nimi X2 jakauma (ts. chi squared). Kyseessä on k:n riippumattoman normaalijakautuneen satunnaismuuttujan neliöiden summan jakauma: ...
Hyvä lähde: http://internetix.fi/opinnot/opintojaksot/0viestinta/informaatiotutkimus/po4/l26.htm AnssiYliJyra 2012 09 30
F mitta Englanninkieliset nimitykset: F1 score, F score, F measure Suomenkieliset nimitykset: F1 mitta, F mitta Käyttötarkoitus F mittaa käytetään yhdistämään tarkkuus ...
Tilastollisen menetelmän käytön hairahduksia tarkistuslista Datan käsittelyvirheitä Datan harhaanjohtava visualisointi Metodien käyttöön liittyvät huolimattomuusvirheet ...
Khiin neliö testi ( Chi;2 testi) Sisällysluettelo Käyttötarkoitus Chi;2 testillä on kaksi käyttötarkoitusta: Chi;2 testillä voi testata, noudattaako muuttuja ...
Neuvoja sellaisen artikkelin kirjoittamiseksi, joka raportoi tilastollisilla metodeilla saatuja tuloksia Aikaisemman tutkimuskirjallisuuden tasapainoinen hahmottaminen ...
Korrelaatiokerroin (eng. correlation coefficient) Halutaan tietää onko kahden muuttujien välissä vuorovaikutusta. Pearsonin korrelaatiokerroin on symeetrinen mitta ...
JuhoSaarikoski 2012 09 28 Lineaarinen regressiomalli Käyttötarkoitus: Yhden tai useamman muuttujan esittäminen ja niiden välisen korrelaation tutkiminen. Muuttujien ...
Luokittelumallin laadun mittaaminen Luokittelumallin laadun miittaamisen syyt: Luokittelumallien vertailu Tarve vertailla kahden tai useamman luokittelumallin ...
Mann Whitney U metodi Käyttötarkoitus ja perusteet Mann Whitney U testi on ei parametrinen testi, jossa testataan saako toinen otoksista suurempia arvoja kuin toinen ...
Normaalijakauma Lähteitä: http://www.statsoft.com/textbook/elementary statistics concepts/#Why%20the%20%22Normal%20distribution%22%20is%20important http://www ...
Tilastollinen ohjelma R Ohjelmiston valinta ja hankinta Kurssilla voitaisiin varmaan käyttää mitä tahansa tavanomaista tilastollista ohjelmaa. Käytännön syistä ohjelmana ...
SPSS http://home.ubalt.edu/ntsbarsh/stat data/SPSSSAS.htm AnssiYliJyra 2012 10 10
Käytännössä vastaantulleita ongelmia ja niiden ratkaisuja Ongelma 1: R:n paketit eivät lataudu Ongelman kuvaus `Yritän käydä läpi esimerkit Baayenin kirjasta, mutta ...
Tarkkuus Englanninkielinen nimitys: precision Tarkkuudella tarkoitetaan, kuinka monta prosenttia luokkaan luokitellusta datasta oikeasti kuuluu kyseiseen luokaan. ...
Saanti Englanninkielinen nimitys: recall Saanti ilmaisee kuinka monta prosenttia johonkin luokkaan kuuluvista käsitteistä on luokiteltu oikein. Saantia merkitään usein ...
Satunnaismuuttujat Muuttujien laadusta Tilastollisen analyysin kannalta muuttujat ovat lukuarvoja tai muita arvoja, joiden olemuksesta tilastollisia analyysejä laskevalla ...
Spearman`s rank correlation coefficient Käyttötarkoitus Spearmanin järjestyskorrelaatiokerroin on tapa mitata kahden muuttujan välistä riippuvuutta. Yleensä Spearmanin ...
Studentin T testi Käyttötarkoitus Studentin t testillä voi ottaa selvää eroavatko kahden ryhmän keskiarvot toisistaan merkittävästi. Sillä voidaan myös selvitt ...
Tilastollisten menetelmien taksonomiaa Opettaja pyytää ensisijaisesti valitsemaan aiheen joka koskee tilastollista testaamista tai mallintamista. Jos huomaat jonkin ...
Tilastotieteen teoriaa Tämän sivun tarkoituksen on koota yhteen keskeisiä käsitteitä ja sitä mistä ne syntyvät. Populaation ja otoksen (eng. sample) ero Johnson ...
Tilastollinen merkitsevyys ja p arvo Käyttötarkoitus Tilastollista merkitsevyyttä laskemalla pyritään selvittämään, miten todennäköisesti löydetty otoksen ja oletetun ...
Tyypillisiä tilastollisia kysymyksenasetteluja ja niihin soveltuvia menetelmiä Onko muuttujan jakautuma normaali? Oletetaan, että meillä on muuttuja F$X , joka on ...
Z testi Käyttötarkoitus Z tests ... generally involve evaluating whether the sample mean value, as an estimate of the population mean, differs from a particular ...
Tutkimuksen aiheena on pilkun käyttö jossain tekstissä. Käytännössä siis käytän grep ohjelmaa jonkun tekstikorpuksen kanssa ja lasken, kuinka monta kertaa pilkku esiintyy ...
Projektityö placeholder page PetriLeinonen 01 Nov 2007
clt255: Kieliteknologian tilastomenetelmät syksy 2007 Kotitentti (julkaistu 29.11.2007 klo 12:00) HyClt255s2007homeExam Kurssityöt Kurssin loppupuolella (Periodi ...
CLT 255 Kotitentti s2007 Vastaa suomeksi tai englanniksi. Please answer in English or Finnish. Submit your results in PDF format to course teacher and assistant ...
CLT255 Tilastomenetelmät syksy 2008 Mallirakenne kurssityötä varten Kurssin lopputyön sopiva mitta on n. 10 20 sivua riippuen aiheesta ja oman työn määrästä. Teoria ...
Clt255 Tilastomenetelmät Wikimuistiinpanot Tänne voi vapaasti kommentoida tehtäviä, esittää R:ää ja kurssia koskevia kysymyksiä ja ehdottaa omia ratkaisuja. SeppoNyrkko ...
Tilastollinen väri ja nimikonstruktioanalyysi John Galsworthyn teoksesta The Forsyte Saga (Damian Lewis hahmona Soames Forsyte) Tehnyt Eero Esimerkki X.X ...
CLT255: Kieliteknologia tilastomemetelmät (syksy 2010) Luonnostelua sisällöksi: Tilastollisista menetelmistä yleensä (tarkastelu, riippuvuussuhteiden tunnistaminen ...
CLT255: Harjoitustyö Kurssin suorittamiseen kuuluu luentomateriaalin yhteydessä annettujen tehtävien lisäksi yksi harjoitustyö, josta tehdään muutaman sivun mittainen ...
CLT255: Ensimmäinen luentokerta Kieli ja satunnaisuus Onko kieli olennaisesti satunnaista? Onko kielen käytössä jotakin, joka olisi satunnaista? sanan pituus ...
CLT255, 2. luentokerta Kommentteja edellisen luentokerran tehtävään (1): Satunnaisuus on yleisesti ottaen monisyinen ja vähän vaikeastikin lähestyttävä käsite, kun ...
CLT255, 3. luentokerta: Tilastollisista menetelmistä Luennolla käsiteltiin tavallisimpia yksinkertaisia tilastollisia menetelmiä yleisellä tasolla. Materiaalia on ...
CLT255, 4. luentokerta: Yksinkertaisia analyysejä Esimerkki: whale c(74, 122, 235, 111, 292, 111, 211, 133, 156, 79) Muuttujaan whale asetetaan arvoksi vektori ...
CLT255: Viides luentokerta Yksinkertaista testausta Luetaan ensin kaksi lukusarjaa muuttujiin A ja B: A B Piirretään näistä laatikkodiagrammi (boxplot) tai laatikko ...
CLT355: Kuudes luentokerta Sananmuotojen frekvenssejä ym. ja table funktio Luetaan edellisellä kerralla käytetty Juhani Ahon `Helsinkiin` novellista tehty havaintomatriisin ...
CLT255: Seitsemäs luentokerta Luennolla oli vain yksi kuulija paikalla. Puhuttiin enimmäkseen muuta eli kerrattiin aiempien kurssien menetelmiä, joilla aineistoja ...
CLT255: Kahdeksas luentokerta Tästä eteenpäin olevat tehtävät neljä tehtävää muodostavat yhdessä sen materiaalin, jonka pohjalta kukin laatii pienen noin harjoitusty ...
CLT255: Yhdeksäs luentokerta Harjoitustyö Kurssin suorittamiseksi ja arvostelun pohjaksi kukin osallistuja tekee pienen harjoitustyön, joka ei saa muodostua miksik ...
CLT255: Kieliteknologia tilastomemetelmät (syksy 2011) Luentokerrat ja muuta materiaalia Luento 1 ja tehtävä nro 1 Taulukkolaskin havaintomatriisin laatimisessa ...
CLT255: Harjoitustyön keskustelualue Kirjoita kysymyksesi tai vastauksesi alla olevaan laatikkooon ja napsauta sen vieressä oikealla puolella olevaa `Add comment` ...
CLT255: Kuvien saaminen R:stä omaan dokumenttiin R:llä on helppo saada kuvia tietokoneen ruudulle. Omalla työasemalla ajetulla R ohjelmalla se on erityisen ongelmatonta ...
CLT255: Ensimmäinen luentokerta Kieli ja satunnaisuus Onko kieli olennaisesti satunnaista? Onko kielen käytössä jotakin, joka olisi satunnaista? sanan pituus ...
CLT255: Neljäs luentokerta Havaintomatriisi ja puuttuvat tiedot Olemme nähneet, miten tietoja voidaan esittää havaintomatriiseina eli havaintoyksiköitä vastaavina ...
CLT255: Kuudes materiaalierä Havaintomatriiseista Aiemmissa esimerkeissä on opittu lukemaan taulukkolaskimella tms. luotu tiedosto R:ään käsiteltäväksi joko read ...
CLT255: Seitsemäs materiaalierä Tilastollisen käsittelyn perusasetelmia (jatkoa) Aiemmassa materiaalierässä käsiteltiin enimmäkseen yksittäisiä otoksia, jotka olivat ...
CLT255: Seitsemäs materiaalierä Tilastollisen käsittelyn perusasetelmia (jatkoa) Aiemmassa materiaalierässä käsiteltiin enimmäkseen yksittäisiä otoksia, jotka olivat ...
CLT255: R:n tekemän tilastollisen testin tulkinta R laskee helposti tilastollisia testejä, mutta on kovin niukkasanainen luvuista, joita testin tuloksena ilmoitetaan ...
CLT255: Tulosten esittäminen ja niiden arviointi tilastomenetelmillä lukuvuosi 2012 2013 Ideoita kurssin kehittämiseksi ensi vuonna (kerätty 12/2012) Opetus ...
Edellisvuotisia harjoitustyön aiheita voi käydä katsomassa täältä. Harjoitystyö F () Harjoitystyö G () Harjoitystyö H () Harjoitystyö I () AnssiYliJyra 2012 ...
Antoine: C eli kaksikielinen korpus Juho: kaksikielinen korpus Maija: Harjoitustyö B (ristiintaulukointia ja testausta) Lari: Harjoitustyö E (kirjan ...
Lähdemateriaalina käytettyjä luentoja ja harjoituksia koskevat kriittiset huomiot ja korjausehdotukset Kontribuoijat: Antoine (huomiot 1 3), ... 1. Nollahypoteesi ...
Ensimmäinen luentakerta Kokeen luonne 1 Deterministinen koe: Jos kokeen lopputulos voidaan ennustaa tarkasti alkutilanteen ja ilmiön ominaisuuksien perusteella ...
Mallisivu tilastollisten menetelmien kuvaamiseksi Menetelmän nimi Käyttötarkoitus Esimerkkejä käyttötarkoituksesta Käytön edellytykset ja oletukset ...
Baayenin kirja `Analyzing Linguistic Data` on nyt saatavilla sekä yliopiston kirjastosta että opettajalta. Opettajalta kirjan ovat lainanneet Edita, Juha ja Maija ...
Oppaita ja itseopiskelumateriaalia Tilastollisiin menetelmiin liittyviä lähdemateriaaleja Luojolan käsikirjoitus Kielitieteellisen aineiston kvantitatiiviset ...
R AnssiYliJyra 2012 09 07
Hege Clt255 Ajanpuutteen vuoksi en sittenkään voi suorittaa kurssia tänä vuonna. HegeRoivainen 2012 09 07 Set ALLOWTOPICVIEW AnssiYliJyra, HegeRoivainen
keskeneräinen! Havaintomatriisin laatiminen taulukkolaskimella R osaa laskea yhtä ja toista havaintomatriisin muotoisista kokonaisuuksista, joissa vaakarivit edustavat ...
Luulen että tämä jäsennin on yksinkertaistettu versio tutkimusprojektin (Spanish FrameNet) käyttämistä työkaluista. SFN koostaa XML:lä merkattua leksikkoa espanjan ...
PaulaPaakko 27 Nov 2006 Hindi Morphological Tagger nimeää annetun tekstin saneet ja ilmoittaa ainakin niiden luokan, suvun, persoonan, luvun ja aikamuodon. Sille voi ...
LauraAarnivuo 30 Dec 2006 Irish NLP Tools sivuilla on valittavana erilaisia toimintoja; oidaan etsiä iirin kielisille sanoille englannin kieliset vastineet, tehdä ...
PILAF antaa sananmuodosta perusmuodon, sanaluokan ja joitakin sanaluokkakohtaisia tietoja kuten suku, luku, persoona, aikamuoto jne. Ei erota johtimia (kokeilin tavallisella ...
Machinese Phrase Tagger Machinese Phrase Tagger ottaa syötteekseen sekä tavallista tekstiä että XML merkattua tekstiä. Se tulostaa perusmuodon, sanaluokka ja pintasyntaktiset ...
Analyysi on nopeaa, pitkäkin lause analysoidaan alle sekunnissa. Oman koneen keskusmuistia ja levytilaa palvelu ei rajoita, koska se on nettipohjainen. Tarkkuudesta ...
Morph it! on ilmainen ja vapaa (Creative Commonsin Attribution Share Alike lisenssin alainen) italian kielen morfologinen leksikko. Koska se ei itsessään ole varsinainen ...
KaisaVuornos 22 Mar 2007 10. Perseus Word Study Tool ottaa syötteekseen yksittäisiä latinan sanoja eli saneita. Jäsennin tulostaa sanakirjahaun perusteella annetulle ...
Järjestelmä ottaa syötteeksi ainakin tavallista tekstiä. Tulosteena saadaan yksinkertainen jäsennys, jossa jokaiseen sanaan on vain liitetty sanaluokkaa ja muotoa ...
Jäsennin, josta teen selvityksen, löytyy sivulta http://www.redbrick.dcu.ie/~tinsley/ . Se analysoi espanjan sanoja. Se näyttää olevan suhteellisen nopea, mutta en ...
Jäsentimen demo on käytettävissä netissä. Haku on melko nopea, 33 sanan lause meni (laskemalla) alle kahdessa sekunnissa sivunlatauksineen. Tarkempaa tietoa jäsentimen ...
FreeLing on joukko kielityökaluja, siihen kuuluu mm. morfologinen jäsennin. Kokeilin jäsentimen espanjankielistä versiota. (7.1.) Jäsennin ottaa syötteeksi muotoilematonta ...
FreeLing 2.1 An Open Source Suite of Language Analyzers Demo: http://garraf.epsevg.upc.es/freeling/demo.php Dokumentaatio: http://garraf.epsevg.upc.es/freeling/doc ...
MinkaZotow 2010 02 14 #8220;System for automatic morphological analysis of Spanish #8221; , Agme http://www.cic.ipn.mx/~sidorov/agme/ Jäsennin on vapaasti ladattavissa ...
CLT261: Kielen morfologisen käsittelyn työkalut 1 Materiaalia käyttölupa hippu koneelle Havaintoja: lomake täytettävä huolellisesti, pyydä pääsyä unixin ...
Käyttäjien huomioita Hippu konee ohjelmistosta Vähän hyödyllisempiä havaintoja Twol analysaattorit. fintwol toimii vielä hippu1.csc.fi koneella, muttei ...
Lyhyt johdatus NooJ:iin Sisällys Oppimistavoitteet Ohjelman käyttöönotto (asennus, dokumentaatio, aineiston syöttö, perustulosteet) Konkordanssin käytt ...
KitWiki sivujen editointi Jos luot uuden sivun, KitWiki siirtyy käyttämään WYSIWYG editoria. Itse en sivua luodessa käytä vielä muotoilukoodeja. Ainakin opettajalla ...
Malliopiskelijan kurssipäiväkirja Ensimmäisen kerran oppimistehtävät Lue 1. kerran materiaalipaketti Tee tehtävä 1 materiaalista ja lisää tähän vastauksesi ...
Sinin kurssipäiväkirja 12. tehtävä $ Siteeraus Wikipediasivulta : Jotkin ohjelmistot, kuten MySQL, ovat saatavilla vapaasti GNU GPL:n alaisena ja lisäksi maksullisena ...
Tiivis UNIX komentojen kertaus kielen käsittelemisen tarpeisiin tail, head tr, iconv, sed awk, gawk, a2p, perl diff, diff3, sdiff grep, fgrep, egrep ...
! Suomen verbit kotuksen taivutustaulukon mukaan ! varhainen arvain proto ! Verbiluokat symboleina ! (jatkuu) ! Ajat, tavat ! verbin persoonamuotojen symbolit ! Kliitit ...
Tommi Pirinen: suomen kielen verbien ns. avoleksikko Työn rajaukset ... ! Suomen verbit kotuksen taivutustaulukon mukaan ! varhainen xfst proto ! Verbiluokat symboleina ...
! verbit.twol ! Yksinkertaisia verbientaivutuksen sääntöjä twollina ! aakkoset ! sointuvokaalit ! astevaihtelu k ! astevaihtelu p ! astevaihtelu t ! kvantitatiiviset ...
Arvostelu nimi 1 2 3 työ #931; as laaj n.n. p p p p #931; #8594; 0 3op SeppoNyrkko 2009 12 19
CTL310: Contextual Formalisms and Related Logics for Finite State Based Natural Language Processing (Autumn 2008) Tunniste 40476, Muu kieliteknologinen osio ...
CTL310s2008: Kurssin kuvaus (myös WebOodissa) Kohderyhmä: The course is targeted for students who are interested in the intersection of formal language theory ...
HyClt310s2008: Exercises Task 1 Describe the following properties using Monandic Second Order Logic that is interpreted over finite strings: Even Parity ...
HyClt310s2008: Study Material Set ALLOWTOPICCHANGE HyClt310s2008Group General BibNetWiki Logic automaton connection C. Elgot: Decision problems ...
Gradu Morfosyntaktisten analysaattorien testaus ja vertailu Sisällys Johdanto Mitä ovat morfosyntaktiset analysaattorit? Miksi testataan (evaluoidaan) ja vertaillaan ...
Gradu Henna Riikka Laitinen Dialogijärjestelmät roolipeleissä (?) 1. Johdanto 2. Mitä parantunut dialogi tuo peleihin? Ehkä hieman historiaa, kuinka asiat ...
Ohjeita gradun kirjoittamiseksi LaTeXilla Kysymyksiä ja vastauksia Tähän saa lisätä kysymyksiä ja ne, jotka arvelevat tietävänsä mahdollisia ratkaisuja voivat kirjata ...
Avoimen lähdekoodin kaksitasokielioppikääntäjä (pro gradu suunnitelma) Esisuunnitelma Gradun otsikoksi ehdottaisin tuota yllä olevaa pääotsikkoa. Tuo `avoimen l ...
Ohjeita gradun kirjoittamiseksi OpenOfficen Writerilla (contents of the topic) KimmoKoskenniemi 2009 02 11
Pro gradu tutkielma käännöskoneiden evaluoinnista PaulaPentinmaki 2009 01 13 Tutkielmassa käsitellään käännöskoneiden evaluointia. Tutkielmassa selostetaan tarkemmin ...
Ohjeita gradun kirjoittamiseksi Microsoft Office Wordilla (contents of the topic) KimmoKoskenniemi 2009 02 11
Pro gradu tutkielma konekääntimien evaluoinnista Tutkielmassa käsitellään konekääntimien evaluointia. Tutkielmassa tarkastellaan eri evaluointimetodeja, joita my ...
Ensimmäisen viikon materiaalien analysointi Tarkoituksena oli arvioida saanti ja katavuuslukujen luotettavuutta Tommin jäsentimen testauksessa. Koska alkuperäiset ...
Clt351: Kieliteknologiasovellusten evaluointi, kevät 2008 OMorFiEval Tapaus 2 Tapaus 3 Käsitteiden kokoaminen
Kieliteknologian eri osa alueiden evaluointitapoja Yleisiä käsitteitä: Saanti, tarkkuus, kattavuus ja relevanssi. Morfologinen generointi ja analyysi: Konekäänn ...
Tapaus 2. Tehtävää ja selvitettävää Selvittää konekäännöksen nykytila eli mitä ylipäätään voidaan vaatia Konekäännös OY:ltä ja onko realistista käyttää sitä ...
Tapaus 3. Puhesynteesin hyödyntäminen junakuulutuksissa Tehtävää ja selvitettävää MOS ja HINT: millaisista evaluointimetriikoista on kysymys? MOS (Mean Opinion Score ...
Tuolla HyClt250s2006
Koska jäsennintä käytetään web käyttöliittymän kautta, on jäsentimen nopeuden arvioiminen vaikeaa. Vaikka jäsennin toimisikin nopeasti, voi pullonkaulaksi muodostua ...
ikk116 Dokumenttien käsittely Moodle http://moodle.helsinki.fi/ WebOodi http://www.helsinki.fi/weboodi/ Tällä sivulla on dokumenttien käsittelyyn ...
Monikielinen kieliteknologia Terms http://en.wikipedia.org/wiki/Content management system http://en.wikipedia.org/wiki/Software localization Wikipedia s ...
ikk332 Ontologiat / Ontologies Ontologies is an advanced level course on ontologies and their use in language technology. The course is taught by professor Lauri ...
Kpk310ont Ontologiat Syventävä kurssi ontologioista ja niiden käytöstä kieliteknologiassa. Määritelmiä Historiaa Ontologioita OntologiakieliäRDF Resource ...
Puheen analyysi KPK322, syksy 2007 Kpk322/FS1. Puheen analyysi kotisivu (näkyy www:ssä), (päivityslinkki) Yleistä Käytettävät ohjelmaympäristöt (mahdollisia): ...
KPK 322, Puheen analyysi, syksy 2008 `Kielellisten ja ei kielellisten piirteiden toteutuminen foneettisina (artikulatorisina, akustisina ja auditiivisina) muuttujina ...
Puheen analyysin kurssityön ohjeet 1) Malliaiheita 2) Työraportin rakenne Kurssi KPK322 (80 työtuntia, 3 op, syksy 2008) suoritetaan perehtymällä puheen ...
R ohjelman sound kirjaston pikaohjeet Sound kirjaston asentaminen Windows R: Install package(s)... Mac OS X R: Package Management ...
SiljaHuttunen 07 Dec 2006 Tähän tulee Monikielisen kieliteknologian kurssisivut.
Number of topics: 403

Topic revision: r79 - 2016-05-13 - MartinMatthiesen
 
This site is powered by the TWiki collaboration platform Powered by PerlCopyright © 2008-2019 by the contributing authors. All material on this collaboration platform is the property of the contributing authors.
Ideas, requests, problems regarding TWiki? Send feedback