Het .wrd-formaat

Bestanden van het type .wrd (te vinden in /data/annot/text/wrd/ van de annotatie-DVD die deel uitmaakt van versie 1.0) bevatten een manueel geverifieerde woordoplijning waarbij de woorden van het orthografisch transcript zijn gekoppeld aan het geluidssignaal. De bestanden zijn in ShortTextGrid-formaat en kunnen worden gemaakt, gewijzigd of bekeken met behulp van het programma PRAAT. Voor een beschrijving van het ShortTextGrid-formaat, zie beschrijving van het .ort-formaat. Voor iedere spreker zijn twee tiers voorzien. De eerste tier heeft de sprekercode als tiernaam en is identiek aan de gelijknamige tier in het .ort-bestand. De daaropvolgende tier krijgt dezelfde naam met suffix _FON (resp. N98765 en N98765_FON) en bevat het fonetisch transcript uit het .fon-bestand. De tijdmarkeringen op beide tiers zijn gelijk.

Een interval in de tier met orthografisch transcript is gevuld met ofwel precies één woord (al dan niet met underscores), ofwel een enkele underscore ("_") ofwel een pauze (leeg interval).

In de tier met het fonetisch transcript kunnen de volgende verschijnselen zich voordoen:

Voor een overzicht van de gebruikte fonetische symbolen, zie beschrijving van het .fon-formaat. Analoog aan het .fon-formaat bevat een .wrd-bestand geen BACKGOUND- en/of COMMENT-tier.