CDATA

Begrepet CDATA , (på engelsk karakterdata , på spansk ' tegndata' ), brukes til forskjellige, men relaterte, formål i SGML- og XML-markeringsspråkene. Begrepet indikerer at en viss del av dokumentet er generelle data, snarere enn ikke-karakterdata eller karakterdata med en mer spesifikk og begrenset struktur.

CDATA-seksjoner i XML

I et dokument er en CDATA-seksjon en som tilhører et dokument som er merket slik at parseren tolker det som en tegnstreng og ikke som merket innhold. Det er ingen semantisk forskjell mellom en tegnstreng i en CDATA-seksjon og syntaksen som brukes.

Syntaks og tolkning

En CDATA-seksjon begynner med følgende sekvens

< ![CDATA[

og slutter med den første forekomsten av sekvensen

]]>

Alle tegn som er innelukket mellom disse to sekvensene tolkes som tegn, ikke som merker eller enhetsreferanser. Hvert tegn tas bokstavelig, det eneste unntaket er sekvensen ]]>av tegn. I:

<sender> John Smith </sender>

start- og sluttmerkene "sender" tolkes som merker. Men hvis det er skrevet slik:

<![CDATA[<sender>John Smith</sender>]]>

da tolkes koden på samme måte som om den hadde blitt skrevet slik:

Det vil si at "etikettene" vil ha nøyaktig samme tilstand som

< avsender > John Smith < /sender >

De vil bli behandlet som tekst.

Eksterne lenker