POS-tagging en lemmatisering
Hieronder wordt in een driekoloms formaat achtereenvolgens de woordvorm weergegeven en de daarmee geassocieerde POS tag en het lemma. Iedere annotatie-eenheid wordt voorafgegaan door een code, waarbij au staat voor 'annotation unit' en s voor spreker. Sprekers zijn geanonimiseerd en worden aangeduid door middel van een sprekeridentificatiecode (b.v. N00023).
Voor een verklaring van de gebruikte tags, zie Van Eynde (2003). [Hier beschikbaar in .ps- en .pdf-formaat.]
<au s=N00024> in VZ(init) in het LID(bep,stan,evon) het VU-ziekenhuis N(soort,ev,basis,onz,stan) VU-ziekenhuis in VZ(init) in Amsterdam N(eigen,ev,basis,onz,stan) Amsterdam is WW(pv,tgw,ev) zijn Danny SPEC(deeleigen) _ Blind SPEC(deeleigen) _ vanmiddag BW() vanmiddag aan VZ(init) aan zijn VNW(bez,det,stan,vol,3,ev,prenom,zonder,agr) zijn rechter ADJ(prenom,basis,zonder) rechter knie N(soort,ev,basis,zijd,stan) knie onderzocht WW(vd,vrij,zonder) onderzoeken . LET() . <au s=N00024> er VNW(aanw,adv-pron,stan,red,3,getal) er is WW(pv,tgw,ev) zijn gebleken WW(vd,vrij,zonder) blijken dat VG(onder) dat er VNW(aanw,adv-pron,stan,red,3,getal) er geen VNW(onbep,det,stan,prenom,zonder,agr) geen verder ADJ(prenom,basis,zonder) verder verlies N(soort,ev,basis,onz,stan) verlies van VZ(init) van het LID(bep,stan,evon) het kraakbeen N(soort,ev,basis,onz,stan) kraakbeen is WW(pv,tgw,ev) zijn opgetreden WW(vd,vrij,zonder) optreden . <au s=N00024> wel BW() wel is WW(pv,tgw,ev) zijn er VNW(aanw,adv-pron,stan,red,3,getal) er wat VNW(onbep,pron,stan,vol,3o,ev) wat irritatie N(soort,ev,basis,zijd,stan) irritatie aan VZ(init) aan de LID(bep,stan,rest) de binnenmeniscus N(soort,ev,basis,zijd,stan) binnenmeniscus geconstateerd WW(vd,vrij,zonder) constateren . LET() . <au s=N00024> er VNW(aanw,adv-pron,stan,red,3,getal) er zal WW(pv,tgw,ev) zullen per VZ(init) per wedstrijd N(soort,ev,basis,zijd,stan) wedstrijd dan BW() dan ook BW() ook worden WW(inf,vrij,zonder) worden gekeken WW(vd,vrij,zonder) kijken of VG(onder) of Danny SPEC(deeleigen) _ Blind SPEC(deeleigen) _ vanaf VZ(init) vanaf nu BW() nu inzetbaar ADJ(vrij,basis,zonder) inzetbaar is WW(pv,tgw,ev) zijn maar VG(neven) maar er VNW(aanw,adv-pron,stan,red,3,getal) er werd WW(pv,verl,ev) worden eerst BW() eerst gevreesd WW(vd,vrij,zonder) vrezen voor VZ(init) voor helemaal BW() helemaal nooit BW() nooit meer VNW(onbep,grad,stan,vrij,zonder,comp) veel kunnen WW(inf,nom,zonder,ev-n) kunnen spelen WW(inf,vrij,zonder) spelen . LET() . <au s=N00024> nou BW() nou dat VNW(aanw,pron,stan,vol,3o,ev) dat valt WW(pv,tgw,met-t) vallen dus BW() dus gelukkig ADJ(vrij,basis,zonder) gelukkig mee VZ(fin) mee . LET() . <au s=N00024> ben WW(pv,tgw,ev) zijn 'k VNW(pers,pron,nomin,red,1,ev) ik erg ADJ(vrij,basis,zonder) erg blij ADJ(vrij,basis,zonder) blij mee VZ(fin) mee persoonlijk ADJ(vrij,basis,zonder) persoonlijk als VZ(init) als fan N(soort,ev,basis,zijd,stan) fan zullen WW(pv,tgw,mv) zullen we VNW(pers,pron,nomin,red,1,mv) we maar BW() maar zeggen WW(inf,vrij,zonder) zeggen . LET() .
Terug naar