POS-tagging en lemmatisering

Hieronder wordt in een driekoloms formaat achtereenvolgens de woordvorm weergegeven en de daarmee geassocieerde POS tag en het lemma. Iedere annotatie-eenheid wordt voorafgegaan door een code, waarbij au staat voor 'annotation unit' en s voor spreker. Sprekers zijn geanonimiseerd en worden aangeduid door middel van een sprekeridentificatiecode (b.v. N00023).

Voor een verklaring van de gebruikte tags, zie Van Eynde (2003). [Hier beschikbaar in .ps- en .pdf-formaat.]

Fragment fn000040

<au s=N00024>
in VZ(init) in
het LID(bep,stan,evon) het
VU-ziekenhuis N(soort,ev,basis,onz,stan) VU-ziekenhuis
in VZ(init) in
Amsterdam N(eigen,ev,basis,onz,stan) Amsterdam
is WW(pv,tgw,ev) zijn
Danny SPEC(deeleigen) _
Blind SPEC(deeleigen) _
vanmiddag BW() vanmiddag
aan VZ(init) aan
zijn VNW(bez,det,stan,vol,3,ev,prenom,zonder,agr) zijn
rechter ADJ(prenom,basis,zonder) rechter
knie N(soort,ev,basis,zijd,stan) knie
onderzocht WW(vd,vrij,zonder) onderzoeken
. LET() .
<au s=N00024>
er VNW(aanw,adv-pron,stan,red,3,getal) er
is WW(pv,tgw,ev) zijn
gebleken WW(vd,vrij,zonder) blijken
dat VG(onder) dat
er VNW(aanw,adv-pron,stan,red,3,getal) er
geen VNW(onbep,det,stan,prenom,zonder,agr) geen
verder ADJ(prenom,basis,zonder) verder
verlies N(soort,ev,basis,onz,stan) verlies
van VZ(init) van
het LID(bep,stan,evon) het
kraakbeen N(soort,ev,basis,onz,stan) kraakbeen
is WW(pv,tgw,ev) zijn
opgetreden WW(vd,vrij,zonder) optreden
.
<au s=N00024>
wel BW() wel
is WW(pv,tgw,ev) zijn
er VNW(aanw,adv-pron,stan,red,3,getal) er
wat VNW(onbep,pron,stan,vol,3o,ev) wat
irritatie N(soort,ev,basis,zijd,stan) irritatie
aan VZ(init) aan
de LID(bep,stan,rest) de
binnenmeniscus N(soort,ev,basis,zijd,stan) binnenmeniscus
geconstateerd WW(vd,vrij,zonder) constateren
. LET() .
<au s=N00024>
er VNW(aanw,adv-pron,stan,red,3,getal) er
zal WW(pv,tgw,ev) zullen
per VZ(init) per
wedstrijd N(soort,ev,basis,zijd,stan) wedstrijd
dan BW() dan
ook BW() ook
worden WW(inf,vrij,zonder) worden
gekeken WW(vd,vrij,zonder) kijken
of VG(onder) of
Danny SPEC(deeleigen) _
Blind SPEC(deeleigen) _
vanaf VZ(init) vanaf
nu BW() nu
inzetbaar ADJ(vrij,basis,zonder) inzetbaar
is WW(pv,tgw,ev) zijn
maar VG(neven) maar
er VNW(aanw,adv-pron,stan,red,3,getal) er
werd WW(pv,verl,ev) worden
eerst BW() eerst
gevreesd WW(vd,vrij,zonder) vrezen
voor VZ(init) voor
helemaal BW() helemaal
nooit BW() nooit
meer VNW(onbep,grad,stan,vrij,zonder,comp) veel
kunnen WW(inf,nom,zonder,ev-n) kunnen
spelen WW(inf,vrij,zonder) spelen
. LET() .
<au s=N00024>
nou BW() nou
dat VNW(aanw,pron,stan,vol,3o,ev) dat
valt WW(pv,tgw,met-t) vallen
dus BW() dus
gelukkig ADJ(vrij,basis,zonder) gelukkig
mee VZ(fin) mee
. LET() .
<au s=N00024>
ben WW(pv,tgw,ev) zijn
'k VNW(pers,pron,nomin,red,1,ev) ik
erg ADJ(vrij,basis,zonder) erg
blij ADJ(vrij,basis,zonder) blij
mee VZ(fin) mee
persoonlijk ADJ(vrij,basis,zonder) persoonlijk
als VZ(init) als
fan N(soort,ev,basis,zijd,stan) fan
zullen WW(pv,tgw,mv) zullen
we VNW(pers,pron,nomin,red,1,mv) we
maar BW() maar
zeggen WW(inf,vrij,zonder) zeggen
. LET() .

Terug naar