Het .pro-formaat

Bestanden van het type .pro (te vinden in /data/annot/text/pro1/ en /data/annot/text/pro2/ van de annotatie-DVD die deel uitmaakt van versie 1.0) bevatten een prosodische annotatie, gebaseerd op het orthografisch transcript uit het .ort-bestand. De .pro-bestanden zijn in ShortTextGrid-formaat en kunnen worden gemaakt, gewijzigd of bekeken met behulp van het programma PRAAT. Voor een beschrijving van het ShortTextGrid-formaat, zie beschrijving van het .ort-formaat. Het formaat bevat tijdmarkeringen die onafhankelijk zijn van de tijdmarkeringen in het orthografisch transcript. Voor iedere spreker is precies één tier voorzien. De tiernaam is gelijk aan de sprekercode. In tegenstelling tot het .ort-bestand bevat een .pro-bestand geen COMMENT- of BACKGROUND-tier. Van elk .pro-bestand is ook een XML-variant beschikbaar in het zogenaamde .prx-formaat. Deze bestanden zijn te vinden in /data/annot/xml/prx1 en /data/annot/xml/prx2 van de annotatie-DVD.

Naast de in het .ort-formaat gebruikte tekens en symbolen wordt in het prosodisch transcript gebruik gemaakt van een extra symbolenset om prosodische fenomenen aan te duiden:

|| Duidt een sterke grens aan. ja dat weet ik || maar wanneer
ik ben bij de politie||commissaris ontboden
| Duidt een zwakke grens aan. jan | en ook piet
dit is werkelijk on|ge|looflijk
^ Het klinkergedeelte van een prominente lettergreep wordt omgeven door het '^'-symbool ^i^k ben thuis
het is ^eeu^wen gel^e^den
% Een abnormaal verlengde klank, zonder dat deze de lettergreep prominent maakt wordt omgeven door het '%'-symbool. %ja% || maar dat is verk^ee^rd
hij is pas viere%n%d^e^rtig

Sterke en zwakke grenzen (resp. '|' en '||') worden omgeven door spaties tenzij deze voorkomen binnen een woord.

Voor een uitgebreide toelichting op het .pro-formaat kan het Protocol voor de prosodische annotatie (Martens, J.-P. 2002) worden geraadpleegd; hier beschikbaar in .ps- en .pdf-formaat.