TAGGER

 


En tagger er et program som annoterer (tagger) en tekst, hvilket indebærer at hvert ord i teksten analyseres i ordklasse, sammen med forskellige andre af ordets egenskaber, f.eks. bøjningsform. Resultatet kaldes ordets tag eller tekstens tag. I Tungutorg er annotering af den islandske kildetekst et fælles første skridt for oversættelse fra islandsk til dansk og oversættelse fra islandsk til engelsk. En islandsk teksts tag er derfor et biprodukt i disse oversættelser og Tungutorgs brugere kan fremkalde tagget separat uden en efterfølgende oversættelse.

Annoteringen (taggingen) følger for det meste den samme metode som andvendes i Íslensk orðtíðnibók (Islandsk frekvensordbog) fra
1991, således at f.eks. ordenstal er klassificeret med adjektiver, præpositioner er klassificeret med adverbier og interjektioner er registreret som en underklasse af adverbier. Hos Tungutorg er den vigtige forskel hos verber at medium diatese behandles som separat verbum således at dens grundform, infinitiv, ender på st. Og endvidere er numeraler klassificeret i nogle underklasser. I Tungutorg anvendes denne metode ved annotering af den islandske tekst for at opnå den optimale anvendelighed i maskinoversættelsen.

Indholdet af denne webside samt den følgende oversigt kan ogs fås som et Word-dokument eller PDF.

 

En oversigt over det islandske tagsæt følger.


Islandsk tagsæt

 

n           SUBSTANTIV

  k         hankøn

  v         hunkøn

  h         intetkøn

    e       singularis

    f       pluralis

      n     nominativ

      o     akkusativ

      þ     dativ

      e     genitiv

        g   med efterstillet artikel

          m personnavn

          ö stednavn

          s andet proprium

 

l           ADJEKTIV

  k         hankøn

  v         hunkøn

  h         intetkøn

    e       singularis

    f       pluralis

      n     nominativ

      o     akkusativ

      þ     dativ

      e     genitiv

        s   stærk bøjning

        v   svag bøjning

        o   ubøjet

          f postiv

          m komparativ

          e superlativ

 

f           PRONOMEN

  a         demonstrativt pronomen

  b         indef. demonstr. pronomen

  e         possessivt pronomen

  o         indefinit pronomen

  p         personligt pronomen

  s         interrogativt pronomen

  t         relativt pronomen

    k       hankøn

    v       hunkøn

    h       intetkøn

    1       1. person

    2       2. person

      e     singularis

      f     pluralis

        n   nominativ

        o   akkusativ

        þ   dativ

        e   genitiv

 

g           ARTIKEL

  k         hankøn

  v         hunkøn

  h         intetkøn

    e       singularis

    f       pluralis

      n     nominativ

      o     akkusativ

      þ     dativ

      e     genitiv

t           NUMERALE

  f         grundtal

  a         årstal

  p         procenttal

  o         ubestemt numerale

    k       hankøn

    v       hunkøn

    h       intetkøn

      e     singularis

      f     pluralis

        n   nominativ

        o   akkusativ

        þ   dativ

        e   genitiv

 

s           VERBUM (ikk præt. part.)

  n         infinitiv

  b         imperativ

  f         indikativ

  v         konjunktiv

  s         supinum

  l         præsens participium

    g       aktiv diatese

    m       medium diatese

      1     1. person

      2     2. person

      3     3. person

        e   singularis

        f   pluralis

          n præsens

          þ præteritum

 

s           VERBUM (præt. part.)

  þ         præteritum participium

    g       aktiv diatese

    m       medium diatese

      k     hankøn

      v     hunkøn

      h     intetkøn

        e   singularis

        f   pluralis

          n nominativ

          o akkusativ

          þ dativ

          e genitiv

 

a           ADVERBIUM

  a         styrer ikke kasus

  o         styrer akkusativ

  þ         styrer dativ

  e         styrer possessiv

  u         interjektion

    m       komparativ

    e       superlativ

 

c           KONJUNKTION

  n         infinitivmærke

  t         relativ konjunktion

 

_______________________________________

 

          # ukendt ord