POS tagging and lemmatization

Below, using a three column format, the wordforms and the associated parts-of-speech tag are given, along with the lemmas. Each annotation unit is preceded by a code: au stands for annotation unit, s for speaker. Speakers have been anonimized and are indicated by means of a speaker identification code (e.g. N00023)

For an explanation of the tags that are used, see Van Eynde (2003). [Here available in .pdf and .ps format. Dutch only.]

Sample fn000010

<au s=N00023>
Always*v SPEC(vreemd) _
Have*v SPEC(vreemd) _
And*v SPEC(vreemd) _
Always*v SPEC(vreemd) _
Will*v SPEC(vreemd) _
de LID(bep,stan,rest) de
nieuwe ADJ(prenom,basis,met-e,stan) nieuw
Ace*v SPEC(vreemd) _
Of*v SPEC(vreemd) _
Base*v SPEC(vreemd) _
en VG(neven) en
hij VNW(pers,pron,nomin,vol,3,ev,masc) hij
klinkt WW(pv,tgw,met-t) klinken
nog BW() nog
leuk ADJ(vrij,basis,zonder) leuk
het VNW(pers,pron,stan,red,3,ev,onz) het
is WW(pv,tgw,ev) zijn
wel BW() wel
een LID(onbep,stan,agr) een
beetje N(soort,ev,dim,onz,stan) beetje
een LID(onbep,stan,agr) een
ABBA-achtig ADJ(prenom,basis,zonder) ABBA-achtig
-typig SPEC(afgebr) _
uh TSW() uh
liedje N(soort,ev,dim,onz,stan) lied
weet WW(pv,tgw,ev) weten
je VNW(pr,pron,stan,red,2v,ev) je
wel BW() wel
ja TSW() ja
ABBA-achtig ADJ(vrij,basis,zonder) ABBA-achtig
-typig SPEC(afgebr) _
. LET() .
<au s=N00023>
ja TSW() ja
nou BW() nou
zo BW() zo
is WW(pv,tgw,ev) zijn
misschien BW() misschien
verkeerde ADJ(prenom,basis,met-e,stan) verkeerd
woordkeuze N(soort,ev,basis,zijd,stan) woordkeuze
maar VG(neven) maar
uhm TSW() uhm
zo BW() zo
ga WW(pv,tgw,ev) gaan
'k VNW(pers,pron,nomin,red,1,ev) ik
het VNW(pers,pron,stan,red,3,ev,onz) het
wel BW() wel
noemen WW(inf,vrij,zonder) noemen
achtig SPEC(meta) _
en VG(neven) en
typig SPEC(meta) _
. LET() .

Return tog