POS-tagging en lemmatisering

Hieronder wordt in een driekoloms formaat achtereenvolgens de woordvorm weergegeven en de daarmee geassocieerde POS-tag en het lemma. Iedere annotatie-eenheid wordt voorafgegaan door een code, waarbij au staat voor 'annotation unit' en s voor spreker. Sprekers zijn geanonimiseerd en worden aangeduid door middel van een sprekeridentificatiecode (b.v. N00023).

Voor een verklaring van de gebruikte tags, zie Van Eynde (2003). [Hier beschikbaar in .ps- en .pdf-formaat.]

Fragment fn000010

<au s=N00023>
Always*v SPEC(vreemd)  _
Have*v  SPEC(vreemd)   _
And*v  SPEC(vreemd)  _
Always*v  SPEC(vreemd)  _
Will*v  SPEC(vreemd)   _
de  LID(bep,stan,rest)   de
nieuwe  ADJ(prenom,basis,met-e,stan)  nieuw
Ace*v  SPEC(vreemd)  _
Of*v  SPEC(vreemd)  _
Base*v  SPEC(vreemd)  _
en  VG(neven)  en
hij  VNW(pers,pron,nomin,vol,3,ev,masc)  hij
klinkt  WW(pv,tgw,met-t)   klinken
nog  BW()   nog
leuk  ADJ(vrij,basis,zonder)  leuk
het  VNW(pers,pron,stan,red,3,ev,onz)  het
is  WW(pv,tgw,ev)   zijn
wel  BW()   wel
een  LID(onbep,stan,agr)   een
beetje  N(soort,ev,dim,onz,stan)   beetje
een  LID(onbep,stan,agr)  een
ABBA-achtig  ADJ(prenom,basis,zonder)   ABBA-achtig
-typig SPEC(afgebr)   _
uh  TSW()   uh
liedje  N(soort,ev,dim,onz,stan)  lied
weet  WW(pv,tgw,ev)  weten
je  VNW(pr,pron,stan,red,2v,ev)  je
wel  BW()   wel
ja  TSW()   ja
ABBA-achtig  ADJ(vrij,basis,zonder)   ABBA-achtig
-typig SPEC(afgebr)  _
LET()   .
<au s=N00023>
ja  TSW()  ja
nou  BW()   nou
zo  BW()   zo
is  WW(pv,tgw,ev)  zijn
misschien  BW()  misschien
verkeerde  ADJ(prenom,basis,met-e,stan)   verkeerd
woordkeuze  N(soort,ev,basis,zijd,stan)   woordkeuze
maar  VG(neven)   maar
uhm  TSW()   uhm
zo  BW()  zo 
ga  WW(pv,tgw,ev)  gaan
'k  VNW(pers,pron,nomin,red,1,ev)   ik
het  VNW(pers,pron,stan,red,3,ev,onz)  het
wel  BW()  wel
noemen  WW(inf,vrij,zonder)   noemen
achtig  SPEC(meta)  _
en  VG(neven)  en
typig SPEC(meta)  _
LET()  .

Terug naar