next up previous
Siguiente: El programa conversor Superior: RTHC: Libertad para el Anterior: El proyecto RTHC

El formato RTF

RTF es uno de los formatos nativos del Microsoft Word. Teóricamente, todas y cada una de sus opciones son representables en este formato. Teniendo en cuenta que las opciones de Word se han ido añadiendo a lo largo de los años, el RTF es bastante desordenado.

Los elementos básicos que constituyen un documento RTF son:

Palabras de control
una serie de caracteres alfabéticos, precedidos de una barra invertida y seguidos, optativamente, por un parámetro numérico (que puede ser negativo).
Símbolos de control
una barra invertida seguida de un solo caracter no alfabético.
Caracter especial
una barra invertida seguida de un apóstrofo y dos caracteres hexadecimales.
Grupos
elementos contenidos entre llaves.
Texto
todo lo demás.

Estos elementos se agrupan en el documento RTF prácticamente sin orden establecido. Uno puede encontrarse cualquier combinación de palabras de control, texto y grupos, aunque ciertas combinaciones tienen significados definidos, como las tablas o las listas. Las especificaciones oficiales tan sólo definen cierta estructura para la cabecera del documento, proponiendo una descripción en seudo-BNF incompleta e inexacta.

La casi inexistente sintaxis de RTF hace que diseñar un analizador sea complicado. Por si fuera poco, el propio Microsoft Word, la implementación que se ha seguido como modelo, incumple bajo ciertas condiciones la especificación oficial.


next up previous
Siguiente: El programa conversor Superior: RTHC: Libertad para el Anterior: El proyecto RTHC

Download this document: [src.tar.gz][ps.gz][html.tar.gz][dvi.gz]

Congreso HispaLinux 2000