Descripción general de los formatos de archivo XML en 2007 Office system

Actualizado: enero de 2009

Se aplica a: Office Resource Kit

 

Última modificación del tema: 2009-01-07

2007 Microsoft Office system incluye nuevos formatos de archivo XML eficaces que se basan en estándares abiertos. Los nuevos formatos de archivo XML permiten crear rápidamente documentos de orígenes de datos diversos, lo que agiliza el ensamblado de documentos, la minería de datos y la reutilización del contenido. Los formatos simplifican el intercambio de datos entre aplicaciones de 2007 Office System y sistemas empresariales.

Es posible crear un documento con los nuevos formatos XML mediante cualquier tecnología y herramienta estándar, y no se requiere 2007 Office System. Los usuarios pueden aumentar la productividad mediante la publicación, búsqueda y reutilización de información con mayor rapidez y precisión en el entorno que elijan.

Los nuevos formatos XML se basan en tecnologías ZIP y XML estándar del sector, admiten una integración completa con cualquier proveedor de tecnología y se encuentran disponibles mediante una licencia libre de regalías. La especificación del formato de archivo XML se publicará y proporcionará con la misma licencia libre de regalías de los esquemas de referencia de Microsoft Office 2003 para una gran variedad de usos profesionales.

Ventajas de los nuevos formatos de archivo XML

Los nuevos formatos XML ofrecen una serie de ventajas para programadores, profesionales de TI y usuarios. Entre estas ventajas se incluyen las siguientes:

  • Formato de archivo compacto. Los documentos se comprimen automáticamente y el tamaño se llega a reducir hasta un 75%.

  • Recuperación de archivos dañados mejorada. El almacenamiento modular de datos permite abrir archivos incluso si un componente del archivo, como un gráfico o una tabla, está dañado.

  • Documentos más seguros. El código incrustado, como el de los objetos OLE o el de Microsoft Visual Basic para Aplicaciones (VBA), se almacena en una sección independiente del archivo para poder identificarlo fácilmente y procesarlo de forma específica. Los administradores de TI pueden bloquear los documentos que contienen macros o controles no deseados, lo que aumenta la seguridad de los documentos al abrirlos para los usuarios.

  • Integración más sencilla. Los programadores tienen acceso directo a contenido específico del archivo, como gráficos, comentarios y metadatos del documento.

  • Aumento de la transparencia y la seguridad de la información. Los documentos se pueden compartir confidencialmente, ya que la información de identificación personal, como nombres de usuario, comentarios, marcas de revisión y rutas de acceso a archivos, puede identificarse y eliminarse fácilmente.

  • Compatibilidad. Mediante la instalación de una sencilla actualización, los usuarios de Microsoft Office 2000, Microsoft Office XP y Office 2003 pueden abrir, modificar y guardar documentos en uno de los nuevos formatos XML.

Estructura de los nuevos formatos de archivo XML

La estructura básica de todos los formatos XML de 2007 Office System consta de cinco elementos:

  • Parte inicial. Parte superior de la jerarquía.

  • Partes XML. Archivos o carpetas compuestos por XML que incluyen el contenido del archivo.

  • Partes no XML. Partes que no son XML y que, por lo general, son imágenes u objetos OLE.

  • Partes de relación. Tipo de parte que, por lo general, apunta a otras partes para definir la jerarquía relacional de la estructura de partes.

  • Paquete ZIP. Partes de paquetes de un solo archivo.

Parte inicial

La parte inicial es una parte XML de relación que se puede considerar como la parte superior y determina el tipo de archivo. Por ejemplo, si el nombre del contenedor principal es WordDoc, la extensión del nombre de archivo es .docx.

Partes XML

Cuando un archivo con formato de Office XML se guarda en 2007 Office System, se divide en un conjunto de partes lógicas que describe al archivo completo. En el caso de Office Word 2007, esta división permite consultar y modificar el archivo fácilmente fuera de la aplicación original de Office.

Por ejemplo, para un programador es más fácil quitar propiedades de documentos de un archivo, ya que las propiedades están ubicadas en una sola parte, que se puede quitar del contenedor de documentos mediante su eliminación. Con WordprocessingML (incluido como formato de archivo XML opcional en Microsoft Office 2003), la eliminación de comentarios conllevaba analizar el archivo completo para encontrar y quitar el XML que representaba el contenido del comentario. Con el nuevo formato de archivo, los datos relacionados con las características se dividen en partes. Los comentarios, vínculos, encabezados, pies y otros datos se encuentran en partes independientes que se pueden quitar. No es necesario analizar el documento de Word completo.

Partes no XML

Las partes no XML suelen ser imágenes y objetos OLE. Cualquier tipo de archivo que use contenido binario o no use XML se identifica como no XML. Una parte no XML es frecuentemente un archivo adjunto o incrustado en un documento. En la documentación del esquema de formato XML de Office Word 2007 se explica la relación literal y la jerarquía del esquema que usa Word con archivos de este tipo.

Parte de relación

Una parte de relación es una parte XML que apunta a otras partes y define la jerarquía relacional de las partes. La mayoría de las partes XML de alto nivel son de relación. Las partes XML que contienen datos y no apuntan a otras partes se denominan también primitivas y suelen tener un tipo de contenido de aplicación/xml.

Paquete ZIP

El uso de un paquete ZIP ofrece las siguientes ventajas en todas las aplicaciones:

  • Estándar abierto. El algoritmo de compresión ZIP es un estándar abierto definido correctamente.

  • Tamaño de archivo reducido. Los archivos suelen ser más pequeños que los archivos binarios equivalentes. En general, los archivos de Office Word 2007 tienen un tamaño un 75% inferior con respecto a los equivalentes binarios en función de la cantidad de imágenes.

  • Mayor eficacia. Los archivos son más eficaces y menos sensibles a posibles errores de archivo. Los archivos anteriores requerían que el archivo estuviera completamente intacto para funcionar correctamente.

Aunque el uso de un paquete ZIP implica que el archivo es binario, el conjunto de interfaces de programación de aplicaciones (API) WinFX proporciona soporte nativo para el formato del paquete en el espacio de nombres System.IO.Packaging. Esto permite a los programadores crear herramientas que procesan el formato y funcionan directamente en el modelo lógico (partes) sin necesidad de tener en cuenta la expansión o compresión del paquete.

Descargar este libro

En este tema se incluye el siguiente libro descargable para facilitar la lectura y la impresión: