POS-tagging en lemmatisering
Hieronder wordt in een driekoloms formaat achtereenvolgens de woordvorm weergegeven en de daarmee geassocieerde POS-tag en het lemma. Iedere annotatie-eenheid wordt voorafgegaan door een code, waarbij au staat voor 'annotation unit' en s voor spreker. Sprekers zijn geanonimiseerd en worden aangeduid door middel van een sprekeridentificatiecode (b.v. N00023).
Voor een verklaring van de gebruikte tags, zie Van Eynde (2003). [Hier beschikbaar in .ps- en .pdf-formaat.]
<au s=N00023> Always*v SPEC(vreemd) _ Have*v SPEC(vreemd) _ And*v SPEC(vreemd) _ Always*v SPEC(vreemd) _ Will*v SPEC(vreemd) _ de LID(bep,stan,rest) de nieuwe ADJ(prenom,basis,met-e,stan) nieuw Ace*v SPEC(vreemd) _ Of*v SPEC(vreemd) _ Base*v SPEC(vreemd) _ en VG(neven) en hij VNW(pers,pron,nomin,vol,3,ev,masc) hij klinkt WW(pv,tgw,met-t) klinken nog BW() nog leuk ADJ(vrij,basis,zonder) leuk het VNW(pers,pron,stan,red,3,ev,onz) het is WW(pv,tgw,ev) zijn wel BW() wel een LID(onbep,stan,agr) een beetje N(soort,ev,dim,onz,stan) beetje een LID(onbep,stan,agr) een ABBA-achtig ADJ(prenom,basis,zonder) ABBA-achtig -typig SPEC(afgebr) _ uh TSW() uh liedje N(soort,ev,dim,onz,stan) lied weet WW(pv,tgw,ev) weten je VNW(pr,pron,stan,red,2v,ev) je wel BW() wel ja TSW() ja ABBA-achtig ADJ(vrij,basis,zonder) ABBA-achtig -typig SPEC(afgebr) _ . LET() . <au s=N00023> ja TSW() ja nou BW() nou zo BW() zo is WW(pv,tgw,ev) zijn misschien BW() misschien verkeerde ADJ(prenom,basis,met-e,stan) verkeerd woordkeuze N(soort,ev,basis,zijd,stan) woordkeuze maar VG(neven) maar uhm TSW() uhm zo BW() zo ga WW(pv,tgw,ev) gaan 'k VNW(pers,pron,nomin,red,1,ev) ik het VNW(pers,pron,stan,red,3,ev,onz) het wel BW() wel noemen WW(inf,vrij,zonder) noemen achtig SPEC(meta) _ en VG(neven) en typig SPEC(meta) _ . LET() . Terug naar