POS-tagging en lemmatisering

Hieronder wordt in een driekoloms formaat achtereenvolgens de woordvorm weergegeven en de daarmee geassocieerde POS-tag en het lemma. Iedere annotatie-eenheid wordt voorafgegaan door een code, waarbij au staat voor 'annotation unit' en s voor spreker. Sprekers zijn geanonimiseerd en worden aangeduid door middel van een sprekeridentificatiecode (b.v. N00023).

Voor een verklaring van de gebruikte tags, zie Van Eynde (2003). [Hier beschikbaar in .ps- en .pdf-formaat.]

Fragment fn000024

<au s=N00005>
ja TSW() ja
't VNW(pers,pron,stan,red,3,ev,onz) het
was WW(pv,verl,ev) zijn
in VZ(init) in
de LID(bep,stan,rest) de
eenentwintigste TW(rang,prenom,stan) eenentwintig
minuut N(soort,ev,basis,zijd,stan) minuut
. LET() . .
<au s=N00005>
toen BW() toen
uh TSW() uh
brak WW(pv,verl,ev) breken
op VZ(init) op
de LID(bep,stan,rest) de
rechterkant N(soort,ev,basis,zijd,stan) rechterkant
Bas SPEC(deeleigen) _
Schaaij SPEC(deeleigen) _
door VZ(fin) door
hij VNW(pers,pron,nomin,vol,3,ev,masc) hij
omspeelde WW(pv,verl,ev) omspelen
z'n VNW(bez,det,stan,red,3,ev,prenom,zonder,agr) zijn
man N(soort,ev,basis,zijd,stan) man
mooi ADJ(vrij,basis,zonder) mooi
legde WW(pv,verl,ev) leggen
de LID(bep,stan,rest) de
bal N(soort,ev,basis,zijd,stan) bal
terug BW() terug
. LET() .
<au s=N00005>
in VZ(init) in
de LID(bep,stan,rest) de
zestien TW(hoofd,prenom,stan) zestien
meter N(soort,ev,basis,zijd,stan) meter
kwam WW(pv,verl,ev) komen
uh TSW() uh
Rikken N(eigen,ev,basis,zijd,stan) Rikken
binnengelopen WW(vd,vrij,zonder) binnenlopen
die VNW(aanw,pron,stan,vol,3,getal) die
werd WW(pv,verl,ev) worden
aangetikt WW(vd,vrij,zonder) aantikken
tenminste BW() tenminste
zo BW() zo
oordeelde WW(pv,verl,ev) oordelen
scheidsrechter N(soort,ev,basis,zijd,stan) scheidsrechter
uh TSW() uh
Tempelaar N(eigen,ev,basis,zijd,stan) Tempelaar
. LET() .
<au s=N00005>
hij VNW(pers,pron,nomin,vol,3,ev,masc) hij
gaf WW(pv,verl,ev) geven
daarvoor BW() daarvoor
een LID(onbep,stan,agr) een
strafschop N(soort,ev,basis,zijd,stan) strafschop
een LID(onbep,stan,agr) een
gele ADJ(prenom,basis,met-e,stan) geel
paart*u N(soort,ev,basis,zijd,stan) kaart
gele ADJ(prenom,basis,met-e,stan) geel
kaart N(soort,ev,basis,zijd,stan) kaart
voor VZ(init) voor
Felibor SPEC(deeleigen) _
Peters SPEC(deeleigen) _
en VG(neven) en
die VNW(aanw,pron,stan,vol,3,getal) die
werd WW(pv,verl,ev) worden
uh TSW() uh
de LID(bep,stan,rest) de
strafschop N(soort,ev,basis,zijd,stan) strafschop
werd WW(pv,verl,ev) worden
verzilverd WW(vd,vrij,zonder) verzilveren
door VZ(init) door
uh TSW() uh
Luc SPEC(deeleigen) _
Van SPEC(deeleigen) _
Raaij SPEC(deeleigen) _
. LET() .
<au s=N00005>
en VG(neven) en
nog BW() nog
geen VNW(onbep,det,stan,prenom,zonder,agr) geen
twee TW(hoofd,prenom,stan) twee
minuten N(soort,mv,basis) minuut
later ADJ(vrij,comp,zonder) laat
was WW(pv,verl,ev) zijn
de LID(bep,stan,rest) de
bal N(soort,ev,basis,zijd,stan) bal
uh TSW() uh
in VZ(init) in
&eacute;&eacute;n TW(hoofd,prenom,stan) &eacute;&eacute;n
keer N(soort,ev,basis,zijd,stan) keer
werd WW(pv,verl,ev) worden
ie VNW(pers,pron,nomin,red,3,ev,masc) ie
diep ADJ(vrij,basis,zonder) diep
gegeven WW(vd,vrij,zonder) geven
en VG(neven) en
werd WW(pv,verl,ev) worden
er VNW(aanw,adv-pron,stan,red,3,getal) er
wederom BW() wederom
gescoord WW(vd,vrij,zonder) scoren
. LET() .
<au s=N00005>
nu BW() nu
was WW(pv,verl,ev) zijn
het VNW(pers,pron,stan,red,3,ev,onz) het
Mario SPEC(deeleigen) _
Lammers SPEC(deeleigen) _
met VZ(init) met
een LID(onbep,stan,agr) een
uh TSW() uh
knap ADJ(prenom,basis,zonder) knap
afstandsschot N(soort,ev,basis,onz,stan) afstandsschot
. LET() .
<au s=N00005>
het VNW(pers,pron,stan,red,3,ev,onz) het
is WW(pv,tgw,ev) zijn
dus BW() dus
nul TW(hoofd,vrij) nul
twee TW(hoofd,vrij) twee
voor VZ(init) voor
Hatert N(eigen,ev,basis,onz,stan) Hatert
LET() .

Terug naar