h3411 Document Um Architecture WP

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 38

Arquitectura de Documentum de EMC: Proporciona los Fundamentos y Servicios para Administrar Contenido en Toda la Empresa

Una Revisin Detallada

Resumen

Documentum de EMC es una plataforma completa de administracin de contenido empresarial para ordenar el flujo y la entrega de informacin del negocio no estructurada en toda la empresa. Basada en una arquitectura extensible, abierta, escalable y segura que cumple las necesidades de organizaciones internacionales distribuidas, la plataforma Documentum incluye un conjunto de productos y servicios integrados que funcionan de manera conjunta. La solucin Documentum de administracin de contenido end-to-end resuelve una variedad de aspectos del negocio estratgicos, que abarcan desde la creacin o captura, la organizacin y el almacenamiento de informacin electrnico hasta la entrega puntual y el archiving.

Enero de 2008

Copyright 2008 EMC Corporation. Todos los derechos reservados. EMC considera que la informacin de esta publicacin es precisa en el momento de su publicacin. La informacin est sujeta a cambios sin previo aviso. LA INFORMACIN DE ESTA PUBLICACIN SE PROPORCIONA TAL CUAL. EMC CORPORATION NO SE HACE RESPONSABLE NI OFRECE GARANTA DE NINGN TIPO CON RESPECTO A LA INFORMACIN DE ESTA PUBLICACIN Y, ESPECFICAMENTE, RENUNCIA A TODA GARANTA IMPLCITA DE COMERCIABILIDAD O CAPACIDAD PARA UN PROPSITO DETERMINADO. El uso, la copia y la distribucin de cualquier software de EMC descrito en esta publicacin requiere una licencia de software correspondiente. Para obtener una lista ms actualizada de nombres de productos EMC, consulte EMC Corporation Trademarks en EMC.com. Todas las otras marcas comerciales que aparecen aqu son propiedad de sus respectivos dueos. Nmero de Pieza H3411 Arquitectura de Documentum de EMC Una Revisin Detallada 2

Tabla de Contenido

Resumen ejecutivo............................................................................................. 4 Introduccin........................................................................................................ 4


Pblico ..........................................................................................................................................4

Cmo incorporar orden a la informacin del negocio no estructurada ........ 4


Beneficios para el negocio: Ms all de los silos de informacin ................................................4 Lo que ofrece Documentum de EMC ...........................................................................................5

Documentum de EMC: Una arquitectura en niveles ....................................... 6 El grupo kernel: Almacenamiento, acceso y proteccin del contenido en una infraestructura de contenido unificada ................................................. 7
Objetos de contenido....................................................................................................................7 Almacenamiento de objetos de contenido....................................................................................8 Anatoma del repositorio...............................................................................................................8 Conexin a una infraestructura de almacenamiento de informacin subyacente ........................11 Servicios de seguridad ...............................................................................................................12

El grupo de servicios de aplicaciones: Administracin de contenido como mdulos relacionados entre s ............................................................. 17
Servicios de cumplimiento de normas........................................................................................17 Servicios Principales de Contenido ............................................................................................20 Process Services ........................................................................................................................28

El grupo de herramientas: Creacin de Aplicaciones de Contenido........... 31


Enterprise Content Services y la API de Documentum..............................................................31 Documentum Foundation Services ............................................................................................32 Documentum Foundation Classes de EMC ...............................................................................34 Business Objects Framework .....................................................................................................34

El grupo de experiencias: Cmo administrar las interacciones de los usuarios finales ................................................................................................ 36
El entorno del Web Development Kit..........................................................................................36 Conectores de Aplicaciones .......................................................................................................37 Una extensin Webtop ...............................................................................................................37 Portlets para portales empresariales..........................................................................................37

Conclusin........................................................................................................ 38

Arquitectura de Documentum de EMC Una Revisin Detallada

Resumen ejecutivo
En la economa actual impulsada digitalmente, la informacin del negocio se presenta de diversas maneras: documentos de texto, hojas de clculo, imgenes, archivos XML, pginas Web, video en movimiento completo (FMV, Full-Motion Video), streaming de audio, mensajes de correo electrnico, mensajes instantneos y contenido fijo (como informes, registros e imgenes escaneadas). Este contenido no estructurado, que abarca desde grficos de ingeniera y procedimientos de fabricacin hasta material de marketing y presentaciones de ventas, es crtico para el funcionamiento eficaz y sin problemas de una empresa. El contenido no estructurado, como los datos financieros que impulsan los sistemas contables, debe administrarse de manera sistemtica. Un sistema de administracin de contenido empresarial proporciona esta solucin sistemtica para la captura, la organizacin, el almacenamiento y la entrega de contenido no estructurado en toda la empresa y ms all. Con un sistema de administracin de contenido empresarial, la informacin no estructurada se administra conforme a las normas, las polticas y los procedimientos predefinidos del negocio. Adems, se establecen relaciones entre las piezas de contenido, de modo que los mismos elementos pueden utilizarse en diferentes contextos y tipos de generaciones. El sistema incorpora inteligencia a las colecciones de contenido al crear esquemas de categorizacin y metadatos que facilitan y optimizan la bsqueda y la recuperacin. Adems, este sistema facilita la publicacin de contenido a travs de varios canales; por ejemplo, un mismo conjunto de palabras e imgenes puede publicarse en un sitio Web, transmitirse como fax, imprimirse como documento y enviarse a un dispositivo inalmbrico porttil. El sistema garantiza el archiving y la retencin a largo plazo para responder a los requerimientos de cumplimiento de normas. En resumen, los sistemas de administracin de contenido empresarial automatizan el procesamiento del ciclo de vida del contenido.

Introduccin
La plataforma de administracin de contenido Documentum de EMC es la base sobre la cual se desarrollan las soluciones y aplicaciones basadas en contenido, que abarcan desde la administracin de documentos del negocio y la publicacin de contenido en sitios Web multilinges hasta la colaboracin mediante herramientas interactivas. En este white paper, se describe en detalle la arquitectura de Documentum de EMC y se identifican los cuatro principales grupos de capacidades que forman la base de una estrategia de administracin de contenido empresarial. Adems, se explica la manera en que Documentum se aplica a un enfoque orientado al servicio para aplicaciones basadas en contenido.

Pblico
Este white paper est dirigido a desarrolladores de aplicaciones y ejecutivos de TI que desean unificar los silos de informacin verticales mediante la estandarizacin en una plataforma orientada al servicio, con una arquitectura slida que puede administrar los activos de contenido de una organizacin mientras proporciona escalabilidad superior y facilidad de uso.

Cmo incorporar orden a la informacin del negocio no estructurada


Beneficios para el negocio: Ms all de los silos de informacin
Los sistemas de administracin de contenido empresarial permiten integrar departamentos y otros grupos que anteriormente funcionaban en silos de informacin separados. De hecho, la informacin puede compartirse con asociados de negocios y otros integrantes de toda la empresa.

Arquitectura de Documentum de EMC Una Revisin Detallada

Por qu es esto necesario y, adems, poderoso? Sin duda, el departamento de investigacin y desarrollo continuar generando especificaciones y patentes de productos, mientras el departamento de marketing genera material publicitario y comunicados de prensa, y la organizacin de servicio al cliente responde a las consultas de los clientes. Sin embargo, cada vez ms los empleados y asociados de negocios necesitan acceder a informacin y compartirla ms all de los lmites departamentales; por ejemplo, cuando presentan un nuevo producto o crean una experiencia del cliente innovadora.

Lo que ofrece Documentum de EMC


Documentum de EMC es una plataforma completa de administracin de contenido empresarial para ordenar el flujo y la entrega de informacin del negocio no estructurada en toda la empresa. Basada en una arquitectura extensible, abierta, escalable y segura que cumple las necesidades de organizaciones internacionales distribuidas, la plataforma Documentum incluye un conjunto de productos y servicios integrados que funcionan de manera conjunta en diversas combinaciones. La solucin Documentum de administracin de contenido end-to-end resuelve una variedad de aspectos del negocio estratgicos, que abarcan desde la creacin o captura, la categorizacin y el almacenamiento de informacin electrnico hasta la entrega puntual y el archiving. Global y distribuida. Para empresas con sitios y clientes distribuidos en todo el mundo, Documentum administra usuarios y contenido independientemente de la ubicacin fsica. Incluye capacidades exclusivas de almacenamiento en memoria cach para brindar administracin de contenido de alto performance en cualquier lugar del mundo. La arquitectura almacena metadatos y contenido multilinge en repositorios compartidos para adaptarse a los idiomas y a la moneda local, y que forman un nico repositorio virtual que abarca los distintos idiomas y zonas geogrficas. Extensible. Documentum puede ampliarse para cumplir necesidades operacionales exclusivas mediante la incorporacin de reglas del negocio u objetos de contenido personalizados. Documentum incorpora una arquitectura orientada a servicios (SOA, Service-Oriented Architecture) que aprovecha las capacidades de los servicios Web para integrarse con distintas aplicaciones empresariales. Es posible desarrollar plugins personalizados e implementarlos en reas clave, con autenticacin de usuarios, manejo de medios enriquecidos y soporte para almacenamiento de informacin heredado. Abierta. Puesto que Documentum se basa en estndares, se integra fcilmente con las infraestructuras de TI existentes. Existen interfaces de programacin de aplicaciones (APIs, Application Programming Interfaces) estndar de Documentum para WebDAV, FTP, SMB, JDBC y el estndar de servicios Web, WSDL. La arquitectura es totalmente compatible con J2EE (para aplicaciones basadas en Web) y proporciona soporte completo para el entorno Microsoft .NET y el procesamiento de XML. Adems, Documentum se integra de manera inmediata con aplicaciones y sistemas empresariales, incluidos los servicios de directorio que usan el estndar LDAP. Escalable. A medida que las necesidades de una organizacin aumentan y se tornan ms complejas, la solucin Documentum administra de manera eficaz volmenes crecientes de contenido, grandes cargas de trfico, mayor cantidad de usuarios y procesos de flujo de trabajo complejos; y lo hace de manera rentable y con un alto performance continuo. Documentum resuelve los problemas de latencia de la red y distribucin de gran escala a los que se enfrentan las empresas internacionales. La arquitectura Documentum aprovecha al mximo la escalabilidad de la plataforma de hardware subyacente mediante el uso de sistemas de mltiples procesadores y entornos de clustering y almacenamiento en memoria cach (escalabilidad horizontal y vertical). Segura. Documentum aplica niveles de seguridad apropiados a medida que las organizaciones permiten que el contenido del repositorio est disponible para una amplia variedad de usuarios y colaboradores. Las listas de control de acceso determinan los usuarios, los grupos y las funciones que pueden acceder al repositorio, o a los objetos especficos que contiene, al igual que las operaciones que se pueden realizar. La informacin confidencial incluida en los almacenes de archivos del repositorio puede encriptarse. Las comunicaciones de red entre los servidores y con las computadoras cliente pueden protegerse mediante Secure Sockets Layer (SSL). Documentum tambin proporciona soporte para firmas electrnicas y ofrece

Arquitectura de Documentum de EMC Una Revisin Detallada

auditora de gran alcance para todas las actividades del sistema. Finalmente, Documentum protege el contenido mvil; es decir, los documentos y dems objetos que se trasladan a travs de la red y ms all del mbito del repositorio.

Documentum de EMC: Una arquitectura en niveles


La plataforma Documentum proporciona un entorno unificado para la captura, el almacenamiento, el acceso, la organizacin, el control, la recuperacin, la entrega y el archiving de cualquier tipo de informacin no estructurada en una empresa. Tambin soporta los recursos que permiten administrar dicho contenido en toda la empresa y publicar contenido en Internet. La plataforma Documentum consta de cuatro grupos conceptuales: El kernel es un entorno unificado para el almacenamiento, el acceso y la proteccin de contenido. Los servicios de aplicaciones proporcionan diversos servicios en el nivel de aplicaciones para la organizacin, el control, la secuencia y el envo de contenido hacia el repositorio, y desde ste. Las herramientas ofrecen capacidades para el desarrollo y la implementacin de aplicaciones de contenido; es decir, aplicaciones de nivel empresarial que utilizan contenido en el contexto de procesos del negocio. Este grupo tambin proporciona los servicios Web para la integracin de objetos relacionados con el contenido con aplicaciones empresariales externas. Las experiencias brindan el entorno y las interfaces que permiten a los usuarios procesar y usar la funcionalidad de administracin de contenido en aplicaciones de escritorio o basadas en navegador.

Cada uno de estos grupos comprende una serie de componentes que, en conjunto, forman una arquitectura unificada, uniforme y extensible, como se muestra en la Figura 1.

Arquitectura de Documentum de EMC Una Revisin Detallada

Figura 1. La plataforma Documentum consta de cuatro grupos: kernel (inferior, violeta), servicios de aplicaciones (medio, dorado), experiencias (superior, gris) y herramientas (derecha, azul). Analicemos las capacidades de estos cuatro grupos e identifiquemos cmo se relacionan entre s para proporcionar un entorno integral para la administracin de contenido en toda la empresa.

El grupo kernel: Almacenamiento, acceso y proteccin del contenido en una infraestructura de contenido unificada
La plataforma Documentum se basa en un repositorio de toda la empresa en el que los servicios lgicos para acceder al contenido estn separados de los sistemas subyacentes para su almacenamiento. Para una aplicacin, el repositorio de Documentum se presenta como un entorno unificado, aunque el contenido puede residir en mltiples servidores y dispositivos de almacenamiento de informacin fsicos, y estar distribuido a travs de toda la organizacin. En otras palabras, el funcionamiento del repositorio es independiente de la tipologa de red. El repositorio de Documentum almacena contenido de manera uniforme, independientemente del tipo de contenido, el tamao o la complejidad del archivo y el formato de archivo. Los tipos de archivo incluyen, entre otros, los siguientes: Documentos de texto comunes Documentos compuestos (que incluyen grficos y texto con formato complejo e interconectados) Pginas Web Archivos XML y jerarquas de archivos XML Imgenes escaneadas Fotografas digitalizadas Activos digitales multimedia (como msica, sonidos y video en movimiento completo) Imgenes mdicas Documentos fijos (como resultados e informes de aplicaciones empresariales) Correo electrnico y mensajes instantneos Contenido colaborativo (como conversaciones organizadas en varios canales, conversaciones a travs de Internet, wikis, votaciones y notas) Grficos de diseo asistido por computadora (CAD, Computer-Aided Design) Documentos y registros de datos de aplicaciones de planificacin de recursos empresariales (ERP, Enterprise Resource Planning) Entornos de realidad virtual

Objetos de contenido
La plataforma Documentum define el contenido del repositorio como objetos (los objetos de contenido pueden incluir una coleccin de objetos). Los objetos constan de tres partes: activos de contenido o datos de origen, atributos de contenido o metadatos, y mtodos u operaciones. Los activos de contenido o datos de origen representan la informacin principal almacenada en su formato nativo. Los atributos de contenido o metadatos describen los activos de contenido mediante determinados descriptores, como palabras clave, versin, vnculos y fecha de creacin. Los mtodos u operaciones son las instrucciones que se realizarn en los activos de contenido, como transformacin, notificacin y visualizacin.

Arquitectura de Documentum de EMC Una Revisin Detallada

Los conjuntos de atributos y de mtodos de un objeto de contenido son configurables y extensibles. Mediante las herramientas de desarrollo de Documentum, los desarrolladores pueden crear nuevos tipos de objetos que se comporten exactamente de la manera establecida segn necesidades especficas del negocio. Adems, los atributos de contenido caracterizan las relaciones entre los objetos de contenido almacenados. El repositorio organiza el contenido en funcin de sus metadatos; los usuarios y las aplicaciones utilizan los metadatos para recuperar contenido relevante.

Almacenamiento de objetos de contenido


El repositorio de Documentum funciona como un entorno unificado para el almacenamiento de objetos de contenido. Estos objetos se almacenan en sus formatos nativos, y tambin pueden encriptarse segn los requerimientos del negocio. De esta manera, las aplicaciones se basan en un nico conjunto de servicios e interfaces de programacin para acceder al contenido, independientemente de dnde y cmo estn almacenados los objetos de contenido. El repositorio aplica medidas de seguridad para garantizar que slo los usuarios y las aplicaciones con autorizacin puedan acceder a los activos de contenido y a los ndices de atributos de contenido. El repositorio de Documentum responde a las necesidades del negocio de la organizacin. Esta capacidad de adaptacin y flexibilidad resulta particularmente importante para organizaciones de gran tamao que operan en diversas ubicaciones y que requieren un repositorio distribuido para el almacenamiento, el almacenamiento en memoria cach, la bsqueda y la actualizacin de contenido, mientras administra el acceso rpido en toda la empresa. El alcance virtual del repositorio de Documentum permite implementar entornos distribuidos de diversas maneras, que garantizan el acceso en toda la empresa, mejoran el performance del sistema y responden a los requerimientos de cumplimiento de normas y seguridad subyacentes. Una empresa cuenta con varias opciones para disear e implementar el repositorio virtual del modo que mejor se adapte a sus objetivos operacionales. Por ejemplo, una empresa internacional puede alojar un repositorio de contenido de Documentum en mltiples regiones geogrficas y almacenar contenido localmente para cumplir con las garantas de calidad de servicio corporativas. Esta compaa puede adems proporcionar soporte para una serie de sucursales en ubicaciones remotas a fin de optimizar la productividad del usuario final y los objetivos del negocio. Los documentos importantes, los archivos multimedia de gran tamao y otros tipos de contenido de misin crtica pueden distribuirse de manera fundamentada y almacenarse en memoria cach en las sucursales, donde estn disponibles inmediatamente para los usuarios locales (sin la degradacin del performance que ocurre al acceder a archivos a travs de conexiones de bajo ancho de banda). Los usuarios de las sucursales pueden acceder al contenido y modificarlo segn lo requieran sus tareas; la seguridad general y los controles de acceso se extienden a todo el entorno empresarial de manera transparente. Las actualizaciones realizadas por usuarios de las sucursales pueden sincronizarse con los repositorios regionales de manera predecible, optimizados para garantizar la capacidad de respuesta de la experiencia del usuario y el grado de actualizacin del contenido revisado. El resultado final es un repositorio virtual distribuido, en el que el contenido se administra (independientemente del lugar geogrfico o el ancho de banda de red) para cumplir metas y objetivos estratgicos del negocio.

Anatoma del repositorio


El repositorio de Documentum consta de tres componentes principales, los cuales se comportan como una nica entidad desde el punto de vista de una aplicacin: un almacn de archivos que contiene los activos de contenido, tablas de atributos dentro de una base de datos relacional e ndices de texto completo (vea la Figura 2).

Arquitectura de Documentum de EMC Una Revisin Detallada

Figura 2. El repositorio de Documentum est formado por cuatro componentes: un almacn de archivos que contiene los activos de contenido, tablas de atributos dentro de una base de datos relacional, ndices de texto completo y servicios de directorio. Todos los componentes se comportan como una nica entidad desde el punto de vista de una aplicacin.

Almacn de archivos y RDBMS


Por lo general, los atributos de contenido se almacenan en una base de datos relacional para permitir la rpida consulta y recuperacin. Los activos de contenido se almacenan como archivos en el almacn de archivos. El almacn de archivos puede ser un file system del sistema operativo del host o un sistema de almacenamiento de informacin accedido por contenido (CAS, Content-Addressed Storage), como Centera de EMC. Los almacenes basados en sistemas de los archivos pueden alojarse en diferentes tipos de entornos de almacenamiento de informacin. Por ejemplo, los archivos de video en movimiento completo pueden residir en un servidor de streaming de alto performance, mientras que los archivos orientados a texto pueden alojarse en un servidor de archivos adaptado para la bsqueda rpida de nombres de archivos. Si, por motivos operacionales, de performance o de seguridad, una empresa administra todo el contenido en un sistema de administracin de bases de datos relacionales (RDBMS, Relational Database Management System), los activos de contenido tambin pueden almacenarse como objetos binarios grandes (BLOB, binary large object) adyacentes a las tablas de atributos.

ndices de texto completo


La plataforma Documentum mantiene un ndice de texto completo de todos los activos de contenido basados en texto almacenados en el repositorio de Documentum, por lo que permite realizar bsquedas rpidamente en grandes colecciones de informacin no estructurada. Los activos de contenido indexados incluyen documentos, archivos de texto, componentes XML, archivos HTML y pistas de subttulos de archivos de video. La plataforma Documentum incorpora el Servidor de Indexacin FAST, una tecnologa de bsqueda empresarial lder en la industria. La capacidad de bsqueda es modular, con motores alternativos para ofertas de Documentum especficas en el mercado. Por ejemplo, la edicin de fabricante original de Documentum, Arquitectura de Documentum de EMC Una Revisin Detallada 9

desarrollada para proveedores de software que incorporan la plataforma Documentum en sus productos, ofrece la alternativa open-source Lucene como el motor predeterminado. Sin embargo, para todas las ofertas estndar para clientes empresariales, el motor de bsqueda FAST est incorporado en el repositorio. El ndice de texto completo, que se crea automticamente mediante un proceso de indexacin cuando se agrega contenido al repositorio, incluye: Todas las palabras de los activos de contenido almacenados en el repositorio. Todas las palabras clave y dems atributos de contenido (o metadatos) que describen los activos de contenido.

El proceso de indexacin, por lo general, se aloja en un servidor independiente. Como parte del proceso de recopilacin de contenido, un agente de ndices enva contenido a un servidor de ndices, que mantiene la base de datos de ndice de texto completo. La plataforma Documentum garantiza que el performance y la escalabilidad de las consultas no se vean afectados por el tamao del repositorio: para escalar a la recopilacin de contenido de alta velocidad, el proceso de indexacin puede ejecutarse en mltiples canales de indexacin implementados en varias CPUs. Esto es de particular importancia en aplicaciones de archiving de contenido para correo electrnico, informes empresariales y datos SAP. La Figura 3 muestra los flujos de los procesos de indexacin y consulta.

Figura 3. La plataforma Documentum mantiene un ndice de texto completo de todos los activos de contenido basados en texto almacenados en el repositorio de Documentum. La integracin se logra mediante un conjunto de plug-ins y APIs para las funciones de consulta e indexacin. Adems de realizar bsquedas de texto en los activos de contenido, el motor de texto completo tambin busca todos los atributos de contenido. Por lo tanto, en una nica consulta, el motor de bsqueda analiza el contenido en dos niveles: los activos de contenido y los atributos de contenido, y presenta listas de resultados unificadas. Como parte de los algoritmos de consulta, el motor de bsqueda analiza y normaliza el texto, e identifica sinnimos en funcin de un diccionario de trminos relacionados. El motor de bsqueda puede Arquitectura de Documentum de EMC Una Revisin Detallada 10

almacenar y soportar mltiples idiomas en un mismo ndice, lo que elimina la necesidad de contar con varios ndices especficos para cada idioma. Actualmente, se proporciona soporte para ms de 70 idiomas.

Conexin a una infraestructura de almacenamiento de informacin subyacente


El repositorio de Documentum se conecta de manera transparente con la infraestructura de almacenamiento de informacin subyacente, la cual consta de mltiples unidades de discos y otros tipos de dispositivos de almacenamiento masivo. La infraestructura de almacenamiento de informacin puede disearse para cumplir las necesidades especficas de diversas organizaciones en cuanto a confiabilidad, seguridad, polticas, costos y operaciones. La plataforma Documentum no realiza distincin entre el contenido almacenado en diferentes tipos de entornos; en cambio, se basa en las APIs del file system para comunicarse con la interfaz del file system del almacn de archivos subyacente. Documentum soporta cualquier tipo de sistema de almacenamiento de informacin, desde discos duros locales de un servidor y arreglos de discos RAID accesibles a travs de la red hasta entornos de almacenamiento de informacin conectado en red (NAS, Network-Attached Storage) o entornos de almacenamiento de informacin en red (SAN, Storage Area Network) complejos, de cualquier fabricante de almacenamiento de informacin. El sistema de almacenamiento de informacin es transparente para la plataforma Documentum. La plataforma Documentum tambin proporciona dos servicios especficos de almacenamiento de informacin que permiten a los diseadores de sistemas mejorar las capacidades de almacenamiento de contenido: Content Storage Services y Content Services para Centera de EMC.

Content Storage Services


Content Storage Services incorpora un motor de polticas de almacenamiento de informacin al repositorio de Documentum, que permite la ejecucin activada por eventos, ad hoc y batch de polticas de migracin y asignacin de almacenamiento. Los administradores de almacenamiento de informacin pueden definir, administrar y actualizar las polticas de almacenamiento de contenido para almacenar el contenido "activo" o actualizado con frecuencia en un conjunto de dispositivos, y el contenido en archiving en otro. Content Storage Services incluye eventos de auditora y logs de migracin, que simplifican las capacidades de cargo al usuario y reporting. Por ejemplo, cuando el contenido es creado inicialmente, puede almacenarse de manera automtica en un dispositivo de almacenamiento de informacin en lnea. El contenido de acceso frecuente puede conservarse en un entorno de almacenamiento de informacin de alto performance, mientras que el contenido al que se accede con poca frecuencia puede migrarse de manera programada a un entorno de almacenamiento de informacin near-line ms econmico. El contenido valioso que debe conservarse por perodos predeterminados, como las versiones finales de documentos del negocio, puede almacenarse automticamente en un entorno de almacenamiento de informacin de gran seguridad. En el caso del contenido transitorio, como los sucesivos borradores de documentos del negocio u otros elementos en curso de ejecucin, es posible almacenarlo de manera segura, obtener acceso a l rpidamente segn sea necesario y, luego, depurarlo de manera rutinaria cuando finaliza el proyecto.

Content Services para Centera de EMC


Content Services para Centera de EMC representa el puente entre el repositorio de Documentum y Centera, un sistema de almacenamiento de informacin accedido por contenido (CAS) de EMC que asegura el acceso rpido, fcil y en lnea, con autenticidad de contenido garantizada y escalabilidad a petabytes. Las capacidades de administracin de contenido empresarial de la plataforma Documentum funcionan de manera transparente con la arquitectura CAS de Centera de EMC, a fin de ofrecer un nivel de kernel extensible y escalable para los activos de contenido fijo. Al brindar estas valiosas capacidades en el nivel de Arquitectura de Documentum de EMC Una Revisin Detallada

11

almacenamiento de informacin, Centera de EMC complementa la seguridad en el nivel de software y el cumplimiento de normas que proporciona Documentum para los activos de contenido fijo. Centera de EMC ofrece un entorno de almacenamiento de informacin seguro y escalable para lograr retencin, proteccin y eliminacin rentables de contenido fijo, incluidos los registros electrnicos, el archiving de correo electrnico y las imgenes escaneadas, dentro de un entorno empresarial. Centera de EMC est optimizado para almacenar contenido de archiving y de larga duracin. Content Services para Centera de EMC se basa en la arquitectura de plug-in de la plataforma Documentum. El contenido se almacena directamente en Centera de EMC, que funciona como almacn de archivos en lugar de un file system del sistema operativo subyacente. Los objetos de contenido incluyen "comprobantes" emitidos por Centera, que se almacenan como propiedades de los objetos de contenido en el repositorio de Documentum. Centera de EMC garantiza que no existan duplicados o versiones redundantes, lo que mejora la eficacia y el performance general del almacenamiento de informacin.

Servicios de seguridad
Content Server de Documentum de EMC proporciona la seguridad principal, y se puede incorporar seguridad adicional a travs de Trusted Content Services y de Information Rights Management Services. Los servicios principales de seguridad incluyen: Autenticacin Autorizacin Auditora

Cada uno de ellos cumple una funcin nica dentro de la arquitectura de seguridad de una organizacin. En primer lugar, la plataforma Documentum se basa en la infraestructura de seguridad subyacente de toda la empresa para autenticar el acceso al repositorio. A continuacin, la plataforma administra listas de control de acceso (ACLs, Access Control Lists) para autorizar el acceso al contenido almacenado en el repositorio. Es posible utilizar herramientas de auditora flexibles para realizar auditoras de cualquier tipo de actividad; la pista de auditora se almacena en el repositorio. Luego, la plataforma puede encriptar todas las comunicaciones entre el servidor de contenido y otros sistemas, como clientes, aplicaciones basadas en Web y servidores de directorios. Analicemos cada uno de estos servicios.

Autenticacin
La plataforma Documentum se basa, inicialmente, en los mecanismos de autenticacin de la base de datos o el sistema operativo subyacente, como el desafo nombre de usuario/contrasea, para administrar el acceso al repositorio. La plataforma soporta la autenticacin basada en token para el acceso en el nivel de aplicaciones, lo que garantiza que las aplicaciones cliente tengan tokens vlidos para conectarse con el repositorio y obtener acceso al contenido. La plataforma incluye conexiones de RSA Access Manager para el inicio de sesin nico. Los mecanismos de autenticacin pueden extenderse para incluir validacin Kerberos y plug-ins de autenticacin de CA Netegrity. Administracin de identidades empresariales La plataforma Documentum est diseada para integrarse de manera transparente en la arquitectura de seguridad de una empresa. Cuando existe un servicio de directorio empresarial, la plataforma se basa en ste para la administracin de identidades empresariales. Arquitectura de Documentum de EMC Una Revisin Detallada

12

La plataforma Documentum proporciona soporte para conexiones con mltiples servicios de directorio y puede integrarse con varios servidores de directorio populares, incluidos Microsoft Active Directory, Sun ONE Directory Server, Oracle Internet Directory, IBM Tivoli Directory Server y Novell eDirectory. La plataforma tambin soporta el servicio Microsoft Active Directory Application Mode (ADAM). La plataforma utiliza el Protocolo Ligero de Acceso a Directorio (LDAP, Lightweight Directory Access Protocol) para sincronizar identidades de grupo y usuarios de toda la empresa, lo que garantiza que las identidades de los usuarios se administren como un recurso de toda la empresa, sin agregar una carga administrativa adicional.

Autorizacin
Una vez que un usuario o una aplicacin autentica una identidad, la persona o el programa pueden acceder al contenido almacenado en funcin de los privilegios asociados con dicha identidad. Las reglas de autorizacin (tambin denominadas controles de acceso o permisos) determinan el contenido al que se puede acceder o que se puede modificar. La plataforma Documentum asigna reglas de autorizacin mediante listas de control de acceso (ACLs), que se aplican de manera automtica a todos los objetos del repositorio en el momento en que stos se crean. Las ACLs pueden ser modificadas manualmente por los usuarios y automticamente mediante cambios del ciclo de vida, procesos del negocio y otras aplicaciones. La plataforma Documentum aplica la autorizacin en el nivel de objetos. Por lo tanto, cada objeto de contenido, versin y generacin, al igual que cada contenedor (desde carpetas hasta servidores de almacenamiento de informacin) y dems objetos (procesos del negocio, polticas, pistas de auditora, etc.) estn protegidos por una ACL durante todo su ciclo de vida. Tres criterios para las ACLs La plataforma Documentum autoriza el acceso en funcin de tres criterios: Asignacin explcita a un usuario individual Pertenencia a un grupo de usuarios Asignacin a una funcin predefinida

Las personas, los grupos y las funciones pueden ser propietarios de un objeto de contenido administrado por la plataforma Documentum. Por ejemplo, durante el desarrollo de un comunicado de prensa (CP), cualquier persona con la funcin "Administrador de CP" puede estar autorizada para crear un nuevo comunicado de prensa, y cualquier integrante del "Grupo de CP" puede tener privilegios para editarlo. Las tareas pueden compartirse (y coordinarse) mediante la administracin de definiciones de funciones en todo el grupo de trabajo, de manera que la administracin de un comunicado de prensa no est limitada a una persona especfica predefinida. Permisos bsicos La plataforma Documentum proporciona siete niveles de permisos bsicos, o privilegios de acceso: Ninguno: los objetos de contenido del repositorio no pueden ser vistos, lo que reduce la complejidad al ocultar el contenido irrelevante para usuarios predefinidos. Adems, es una manera eficaz para proteger proyectos o documentos confidenciales, y garantizar que slo las personas y los procesos con privilegios adecuados puedan encontrar referencias de objetos en el repositorio. Exploracin: los atributos de contenido (o metadatos) para objetos de contenido pueden ser vistos, pero los activos de contenido no se pueden abrir ni leer. Lectura: los activos de contenido se pueden abrir y leer, pero no se pueden modificar.

Arquitectura de Documentum de EMC Una Revisin Detallada

13

Relacin: un usuario puede crear relaciones entre un determinado objeto de contenido y otros objetos del repositorio. Este permiso es utilizado por herramientas, como anotaciones, en donde cada anotacin es un nuevo objeto que se relaciona con un objeto de contenido existente. Versin: un usuario puede realizar cambios en un activo de contenido, pero no puede sobrescribir una versin previa; los cambios se guardan en una nueva versin, que puede incluir un archivo modificado, metadatos modificados, o ambos. Escritura: un usuario puede realizar cambios en un objeto de contenido (tanto en el activo de contenido como en los metadatos asociados) y guardar dichos cambios sin crear una nueva versin. Este nivel de control de acceso, por lo general, est limitado al propietario del contenido. Eliminacin: un usuario puede eliminar un objeto de contenido.

Este conjunto de permisos es acumulativo: cada nivel concede automticamente todos los derechos de acceso de los niveles inferiores. Por ejemplo, un usuario con privilegios de "escritura" tendr tambin permisos de "versin", "relacin", "lectura" y "exploracin" sobre el contenido. El privilegio de "eliminacin" es un caso especial que analizaremos ms adelante. Privilegios de eliminacin en el nivel de objetos El permiso de "eliminacin de objetos" concede privilegios de eliminacin mientras deniega otros niveles de acceso; es decir, un usuario o proceso puede eliminar un objeto de contenido sin contar con permisos de escritura, versin, lectura o relacin. Esta capacidad permite al administrador de registros, bibliotecario o archivista corporativo eliminar objetos del repositorio en funcin de polticas de retencin, sin tener acceso a ningn aspecto de su contenido. Permisos ampliados La plataforma Documentum soporta mltiples permisos ampliados para administrar objetos de contenido en el repositorio. Cambiar ubicacin: un usuario puede cambiar la ubicacin de un activo de contenido de una carpeta a otra. De manera predeterminada, un usuario con permiso de "exploracin" u otro superior tiene privilegios de "cambiar ubicacin". Modificar permisos: un usuario que no sea el propietario del contenido puede cambiar los permisos estndar de un activo de contenido. Cambiar propietario: un usuario que no sea el propietario del contenido puede cambiar el propietario de un activo de contenido. Esto es importante cuando se debe reasignar la propiedad del contenido, y el propietario original del contenido no est disponible. Ejecutar procedimiento: un usuario puede ejecutar un procedimiento externo en activos de contenido, como creacin y generacin. De manera predeterminada, un usuario con permiso de "exploracin" u otro superior hereda privilegios de "ejecutar procedimiento". Cambiar estado: un usuario puede cambiar el estado del ciclo de vida de un activo de contenido.

La plataforma Documentum controla el acceso a los objetos de contenido y protege el modo en que se organizan y categorizan en el repositorio. Como resultado, la plataforma Documentum proporciona los servicios de seguridad principales que determinan las acciones que se pueden realizar en un objeto de contenido. Auditora Cada operacin realizada por el repositorio de Documentum puede registrarse en un registro auditable. La pista de auditora puede configurarse por completo en el administrador de Documentum (donde tambin puede ser visualizada) y est protegida en el repositorio mediante encriptacin segura.

Arquitectura de Documentum de EMC Una Revisin Detallada

14

La pista de auditora cumple con los exigentes requerimientos de la reglamentacin 21 CFR Parte 11 de la FDA, la cual se considera un benchmark de auditora. Adems, la pista de auditora puede lograr mayores niveles de detalle y alcance para los eventos auditados, y utilizarse para realizar un seguimiento de las posibles infracciones de seguridad y para optimizar la utilizacin del sistema. Cada registro auditable enumera los valores nuevos y anteriores asociados con un evento (como la hora y el nombre de usuario relacionados con el check-out de un documento del repositorio), lo que permite determinar rpidamente lo que se modific. Los usuarios finales y administradores tambin pueden ver el historial de los documentos y dems objetos almacenados en el repositorio, por lo que pueden determinar cmo y cundo ocurren cambios en la informacin. Comunicaciones encriptadas Todas las comunicaciones que involucran al servidor de contenido (por ejemplo, las comunicaciones entre Content Server y un servidor de aplicaciones, entre Content Server y computadoras de escritorio clientes y entre Content Server y un servidor de directorios) utilizan la encriptacin estndar SSL para impedir las infracciones de seguridad por "escucha clandestina malintencionada".

Trusted Content Services


La plataforma Documentum incorpora Trusted Content Services para resolver situaciones de seguridad especficas de las aplicaciones ms all de los mecanismos de autenticacin y autorizacin proporcionados por los servicios de seguridad principales de la plataforma de contenido. Trusted Content Services incluye: Almacenes de archivos encriptados. Los archivos de contenido del repositorio pueden encriptarse para impedir la intrusin en el nivel del sistema y para proteger los archivos de contenido almacenados en medios de backup. Esta encriptacin puede realizarse de manera selectiva por almacn de archivo, de modo que cada repositorio combine contenido encriptado y no encriptado. Destruccin digital de elementos eliminados. La destruccin digital destruye de manera definitiva contenido en el nivel del sistema operativo mediante la sobrescritura de los datos en el dispositivo de almacenamiento de informacin. La plataforma Documentum destruye contenido almacenado en file systems y dispositivos CAS. Soporte para firmas electrnicas. Los usuarios pueden firmar documentos electrnicos de manera que cumplan con los estndares establecidos de la industria para comprobar la integridad del documento firmado.

Adems, Trusted Content Services puede enriquecer el modelo de seguridad subyacente y ampliar los mecanismos de autorizacin mediante el control de acceso obligatorio (MAC, Mandatory Access Control). Este mecanismo proporciona un nivel de seguridad adicional antes de conceder a los usuarios autenticados acceso a un objeto de contenido. En concreto, MAC permite: Ejecutar reglas de membresa. Garantiza que un usuario sea miembro de un grupo definido externamente antes de comprobar los privilegios de autorizacin. Ejecutar reglas de restriccin. Restringe los privilegios de acceso de un usuario a un nivel especfico, incluso si la ACL establece un nivel de acceso superior. Aplicar control de acceso en el nivel de aplicaciones. Ampla una ACL con una configuracin de seguridad especfica de la aplicacin.

Arquitectura de Documentum de EMC Una Revisin Detallada

15

Information Rights Management Services


Information Rights Management (IRM) Services ampla la seguridad y los controles de acceso en documentos y otros tipos de contenido ms all de los lmites de la plataforma de contenido. IRM Services protege el contenido mvil que requiere proteccin persistente en toda la red y en cualquier lugar en el que se ubique y almacene contenido. IRM Services ampla la plataforma Documentum al incorporar un servidor de polticas IRM al entorno empresarial, como se muestra en la Figura 4. Este servidor establece las polticas mediante las cuales los documentos, mensajes de correo electrnico y otros tipos de objetos pueden abrirse, visualizarse, imprimirse y distribuirse fuera del repositorio. Antes de abandonar Content Server de Documentum, el contenido junto con la poltica de uso se protegen mediante encriptacin. Slo el archivo encriptado (que incluye el contenido) se transfiere desde el repositorio, y est disponible fuera del permetro de seguridad. IRM Services soporta otras aplicaciones Microsoft Office (Word, PowerPoint, Excel y Outlook) y aplicaciones Adobe PostScript, HTML, RIM BlackBerry y Lotus Notes. Adems, puede personalizarse para soportar otros tipos de formatos de archivo.

Figura 4. IRS Services incorpora un Servidor de Polticas IRM al entorno de informacin empresarial para proteger el contenido que ya no administra Content Server de Documentum. IRM Services controla el proceso por el cual se desencripta el contenido y se habilita el acceso a ste para los destinatarios. El usuario final debe acceder a un servidor de polticas a travs de la red a fin de obtener una clave para desencriptar el contenido. El servidor de polticas utiliza su propio mecanismo de autenticacin para comprobar la identidad del usuario. Una vez realizada la autenticacin, el servidor de polticas proporciona al usuario final una clave para desencriptar el contenido. Despus de la desencriptacin, el uso del contenido por parte del usuario estar limitado por la poltica de uso predefinida. Por ejemplo, podran aplicarse lmites sobre la cantidad de veces que puede visualizarse el contenido, si los destinatarios pueden imprimir o copiar el documento en otro archivo, si los destinatarios pueden enviar el documento a terceros, u otras restricciones operacionales.

Arquitectura de Documentum de EMC Una Revisin Detallada

16

El grupo de servicios de aplicaciones: Administracin de contenido como mdulos relacionados entre s


La plataforma Documentum aprovecha las capacidades de Content Server de Documentum de EMC al proporcionar una serie completa de servicios de aplicaciones para administrar contenido. Estos servicios funcionan como mdulos relacionados entre s: un servicio llama a otro para obtener la informacin o funcionalidad necesaria. La plataforma Documentum incorpora tres conjuntos de servicios de aplicaciones: Servicios de cumplimiento de normas, Servicios principales de contenido y Servicios de procesos.

Servicios de cumplimiento de normas


Los Servicios de cumplimiento de normas proporcionan capacidades para la retencin de contenido y la administracin de contenido como registros. stos son Retention Policy Services y Records Manager, respectivamente.

Retention Policy Services


Retention Policy Services (RPS) especifica y aplica la retencin de objetos en el repositorio de Documentum al adjuntar una o ms polticas de retencin a dichos objetos. Los objetos, o registros, retenidos son inalterables; es decir, no se pueden modificar ni eliminar durante el perodo de retencin. Una capacidad de retencin adicional retiene documentos en funcin de eventos ad hoc, como una auditora o un litigio. Mediante la aplicacin de polticas a contenedores (como carpetas) o a procesos (como flujos de trabajo o ciclos de vida), la retencin de documentos se aplica de manera programtica, con escasa intervencin humana o sin ella. Las polticas y herramientas de automatizacin tambin pueden utilizarse para la eliminacin de contenido (o archiving permanente o destruccin), lo que garantiza que los archivos se eliminen de manera adecuada y ayuda a limitar la acumulacin de contenido. RPS mejora los controles estndar de Documentum en tres importantes dimensiones: Notificaciones: notifica a los propietarios o a las autoridades en funcin de eventos de activacin, como el inicio o la finalizacin de una fase de retencin. Auditora: audita y registra el "antes" y el "despus" de los cambios en los metadatos durante una accin de conservacin de registros. Reporting: proporciona motores de consulta de reporting con criterios de conservacin de registros estndar e informes de conservacin de registros predefinidos.

Con RPS, las organizaciones pueden responder a las reglamentaciones de cumplimiento de normas, los requerimientos legales y las mejores prcticas. RPS puede incorporarse de manera independiente a cualquier entorno de Documentum soportado. RPS es el motor de retencin que respalda la aplicacin Records Manager de Documentum de EMC.

Records Manager
Records Manager de Documentum de EMC amplia las capacidades principales de administracin de contenido de Documentum al agregar determinadas caractersticas y funcionalidad, como planes de archivos corporativos, clasificacin y seguridad en el nivel de archivos y el nivel de sitios.

Arquitectura de Documentum de EMC Una Revisin Detallada

17

La arquitectura de Records Manager brinda funcionalidad de conservacin de registros como servicios que pueden utilizarse tanto para registros fsicos como electrnicos (vea la Figura 5). Dicha funcionalidad se incorpora en mdulos especficos. Al seleccionar los mdulos de Records Manager adecuados, los clientes pueden implementar una solucin de registros que cumple con sus requerimientos exclusivos. Adems, los clientes pueden agregar mdulos adicionales en caso de que sus requerimientos cambien.

Figura 5. Las capacidades de administracin de registros de Documentum proporcionan soporte para documentos electrnicos, correo electrnico y documentos impresos como registros administrados. Estas capacidades aprovechan las ofertas complementarias de la plataforma Documentum en general. Records Manager aprovecha Retention Policy Services y la capacidades de la plataforma Documentum para ofrecer capacidades de administracin de registros de manera modular. Los mdulos y sus capacidades se describen en la Tabla 1. Tabla 1. Caractersticas y mdulos de Records Manager

Mdulo de Records Manager Polticas de contencin

Capacidades Controla el nmero de niveles en la jerarqua de plan de archivos o carpetas y las acciones permitidas en cada nivel, como check-in o declaracin de registros. Las polticas de contencin tambin permiten o bloquean el control de conservacin de registros por tipo de documento, y limitan la cantidad de clasificaciones de un registro, lo que, desde el punto de vista de la arquitectura, es equivalente a la cantidad de vnculos asociados con un objeto. Proporciona un esquema de clasificacin permanente y de todo el sistema para los registros, ya que define la denominacin de registros, la organizacin y los metadatos descriptivos, especificados y administrados por un administrador de registros. Un documento se declara abiertamente como registro al almacenarlo en una ubicacin administrada por el plan de archivos, y se clasifica utilizando metadatos especificados por este plan. La retencin es definida por la clasificacin.

Plan de archivos

Arquitectura de Documentum de EMC Una Revisin Detallada

18

Mdulo de Records Manager Polticas de denominacin

Capacidades Configura las convenciones de denominacin para los registros y el plan de archivos al controlar los atributos que se utilizan, el formato de fecha que se aplica, si las entradas realizadas por personas deben validarse, el modo en que los nombres se generan de manera dinmica y mucho ms. Ampla la seguridad existente de Documentum al incorporar permisos en el nivel de documentos que son especficos en lugar de acumulativos. Por ejemplo, la posibilidad de conceder capacidades de "exploracin" a un determinado usuario, grupo o funcin para un tipo de documento en particular, como facturas. Determina el perodo de retencin de un documento, una carpeta o un gabinete, en funcin de requerimientos operacionales, legales, reglamentarios, fiscales o internos. Mientras dura la poltica de retencin aplicada, el objeto administrado no puede ser eliminado ni revisado de modo alguno, aunque es posible ingresar una nueva versin del objeto. Ampla los controles de acceso al incorporar permisos basados en la participacin a un grupo designado, y al restringir los permisos para los usuarios que forman parte de todos los grupos designados.

Polticas de seguridad

Polticas de retencin

Marcas complementarias/marcas compartidas

La modularidad y la arquitectura orientada a servicios de Records Manager simplifican la incorporacin de la funcionalidad de conservacin de registros de Documentum a otros sistemas, incluidas las aplicaciones externas. En la Tabla 2 se describen stos y otros principios relacionados con la arquitectura. Tabla 2. Principios de la arquitectura de Records Manager

Principios de la arquitectura Arquitectura modular Incorpora funcionalidad similar de conservacin de registros en mdulos plugand-play especficos.

Por qu es importante

Ejemplo

Simplifica y agiliza la implementacin, ya que permite a los sitios instalar la funcionalidad sin complicar la configuracin, la administracin ni la interfaz de usuario.

Alinee los controles de conservacin de registros con su entorno reglamentario. O comience de manera sencilla y agregue funcionalidad cuando sea relevante.

Arquitectura de Documentum de EMC Una Revisin Detallada

19

Principios de la arquitectura Arquitectura de mltiples niveles Separa la inteligencia del negocio de la interfaz de usuario.

Por qu es importante

Ejemplo

Simplifica el uso compartido y la incorporacin de la funcionalidad de registros en aplicaciones externas, ya que se basa exclusivamente en la lgica del negocio y no en la interfaz de usuario. Proporciona un mayor nivel de eficacia al usar o ampliar las APIs proporcionadas, ya que los cambios deben realizarse en un solo lugar; proporciona el nivel de lgica del negocio.

Automatice las declaraciones de registros en sistemas de lneas del negocio, como una aplicacin de administracin de contratos.

Entornos de polticas Personalizan o mejoran el comportamiento del sistema al agregar lgica del negocio mediante el administrador de polticas aplicadas, de acuerdo con pautas claras y estandarizadas respecto de los entornos.

Simplifica las extensiones y personalizaciones; no se necesita un desarrollador.

Agregue distintos destinatarios de notificaciones simplemente mediante la incorporacin de una poltica en el "entorno de accin" existente. Aplique polticas por tipos de objeto u otras condiciones. Por ejemplo, aplique diferentes reglas de denominacin para distintos niveles del plan de archivos. O bien automatice la clasificacin adecuada de registros por tipo de documento, como facturas o contratos. Permita que las aplicaciones de asociados de negocios o los sistemas de negocios internos incorporen la declaracin de registros como un servicio Web dentro de la aplicacin. Agregue la funcionalidad de registros, como los niveles de autorizacin de seguridad de DOD, a los usuarios actuales de Documentum.

Permite la personalizacin basada en mltiples atributos variados, incluidos los calificadores de polticas.

Interfaz abierta Interfaces basadas en Java o en servicios Web que extienden la funcionalidad existente de Documentum mientras respetan las prcticas estndar de Documentum.

Permite la integracin a travs de servicios Web sin soporte para Java.

Agrega la funcionalidad de Records Manager a un entorno de Documentum sin desechar ni duplicar trabajo anterior.

Servicios Principales de Contenido


Los Servicios principales de contenido brindan las capacidades fundamentales para el acceso y el almacenamiento de informacin del repositorio. stos incluyen servicios de biblioteca, servicios de flujo de trabajo, servicios de ciclo de vida, servicios XML, Enterprise Content Integration Services, Content Transformation Services, Content Intelligence Services y Content Delivery Services.

Arquitectura de Documentum de EMC Una Revisin Detallada

20

Servicios de biblioteca
Los servicios de biblioteca administran contenido de tres maneras fundamentales: Capacidades de check-in/check-out (o bloqueo): garantizan que los usuarios con privilegios de edicin no sobrescriban las versiones ya editadas ni realicen actualizaciones incompatibles. Por ejemplo, cuando una persona edita un documento, otra persona no puede sobrescribir los cambios implementados. Capacidades de control de versiones: realizan un seguimiento de mltiples versiones de documentos u otros objetos de contenido y, adems, proporcionan la posibilidad de volver a versiones previas, segn sea necesario. Por ejemplo, el repositorio puede conservar mltiples versiones de un conjunto de pginas Web, y volver a una versin previa cuando sea necesario. Capacidades de generaciones bsicas: mantienen representaciones alternativas de documentos u otros objetos de contenido con diferencias de formato, resolucin o idioma. La plataforma Documentum puede producir generaciones automticamente mediante convertidores incorporados y mantener la relacin entre el objeto original y sus generaciones, por lo que garantiza la integridad del objeto y permite a los usuarios administrar las generaciones de manera individual o colectiva. Por ejemplo, el contenido creado inicialmente como un documento de Microsoft Word puede generarse como un archivo con formato fijo PDF de Adobe Acrobat; o bien como una pgina Web con formato HTML con sus archivos asociados de imgenes incorporadas.

Los servicios de biblioteca, a su vez, emplean un amplio conjunto de servicios de seguridad para determinar el modo en que se autentica y autoriza el acceso de usuarios o aplicaciones al contenido del repositorio.

Servicios del flujo de trabajo


El flujo de trabajo de Documentum automatiza las actividades y las polticas del negocio vinculadas al contenido del repositorio. Los flujos de trabajo estn definidos por un modelo, por el conjunto de etapas que componen el proceso y por las acciones que deben llevarse a cabo en cada etapa. Un flujo de trabajo puede describir un proceso simple o complejo: puede ser serial, con actividades consecutivas, o paralelo, con actividades simultneas. Tambin puede combinar actividades seriales y paralelas. Debido a que el estado del flujo de trabajo de un objeto se define por una serie de atributos vinculados con dicho objeto, ste "viaja" junto con el objeto. Por ejemplo, es posible que el flujo de trabajo de un comunicado de prensa requiera un proceso de aprobacin que involucre a cinco personas y siete pasos seriales. La plataforma Documentum administra continuamente el estado de mltiples instancias de cada flujo de trabajo (con frecuencia, cientos o miles de stas) mediante el almacenamiento de los objetos del flujo de trabajo en el repositorio de Documentum. De manera similar, las plantillas de flujo de trabajo (definiciones) se almacenan como objetos de repositorio para que se puedan aplicar varios servicios, como seguridad, control de versiones y retencin.

Servicios del ciclo de vida


La plataforma Documentum define, asigna e implementa reglas flexibles del ciclo de vida del contenido en virtud de polticas del negocio establecidas por la empresa. Al igual que con el flujo de trabajo, el estado del ciclo de vida de un objeto se define por una serie de atributos vinculados con dicho objeto, de modo que ste tambin "viaja" junto con el objeto. Sin embargo, en lugar de estar definidos por un modelo flexible de flujo de trabajo, los servicios de ciclo de vida se definen por un conjunto de polticas o reglas del negocio. Mientras que un flujo de trabajo distribuye un documento entre varios usuarios y tareas automticas, los ciclos de vida definen las reglas del negocio en relacin con los cambios que se aplican al contenido a medida que pasa por distintas etapas predefinidas (por ejemplo, "versin preliminar", "en revisin", "activo" y "obsoleto"). Como es de esperarse, a diferencia del flujo de trabajo, cada objeto de contenido tiene un solo ciclo de vida. Arquitectura de Documentum de EMC Una Revisin Detallada 21

Los servicios del ciclo de vida automatizan las polticas del ciclo de vida del contenido del repositorio. Estos servicios asignan una etapa del ciclo de vida al objeto de contenido y luego administran la transicin del objeto de una etapa a otra. Las organizaciones pueden extender las etapas del ciclo de vida para abarcar sus propias polticas operativas (vea la Figura 6).

Figura 6. Los servicios del ciclo de vida asignan una etapa del ciclo de vida a un objeto de contenido y luego administran la transicin del objeto de una etapa a otra. Los servicios del ciclo de vida constituyen una poderosa capacidad de administracin de contenido. Es posible asignar a las etapas del ciclo de vida polticas que impongan cambios en el control de accesos, la ubicacin lgica y fsica, las reglas de retencin, la rotulacin, la asignacin de nombres, el control de versiones, la generacin, el flujo de trabajo y los procesos del negocio. Existen diferentes definiciones del ciclo de vida para los distintos tipos de objetos. Por ejemplo, tomemos en cuenta los ciclos de vida de los comunicados de prensa y las solicitudes de patentes. Cuando una empresa elabora un comunicado de prensa, cualquier miembro del departamento de Comunicaciones Corporativas puede editarlo antes de su aprobacin. nicamente los gerentes de marketing y los gerentes de productos responsables de los productos mencionados en el comunicado de prensa tienen acceso a las versiones preliminares. Una vez que se aprueba el comunicado de prensa, todos los gerentes senior de la empresa pueden leerlo, pero nicamente el director de Comunicaciones Corporativas puede modificarlo. Cuando se publica la versin final en el sitio Web de la empresa, todas las versiones anteriores (o preliminares) se eliminan de manera automtica del repositorio, transcurridos 30 das. Estas polticas de acceso son independientes del flujo de trabajo que deriva el comunicado de prensa a los gerentes de la empresa que deben aprobarlo antes de que pueda remitirse a la etapa final. Cuando una empresa crea una solicitud de patente, nicamente los investigadores designados y los asesores legales del staff pueden editar su contenido; los directores de investigacin y los asesores corporativos pueden leerla. Una vez que se completa la solicitud y se la remite a una autoridad externa de adjudicacin de patentes, otros investigadores y gerentes de la empresa pueden leer la solicitud. Todas las versiones preliminares de la solicitud pasan automticamente a archiving por un perodo de siete aos. La versin remitida se clasifica de manera automtica como registro y se enva al archiving de la empresa para almacenamiento perpetuo en un entorno seguro de almacenamiento de informacin.

Servicios XML
La plataforma Documentum proporciona un conjunto principal de servicios XML para la administracin de documentos XML en su formato original. Los documentos XML corresponden a un tipo especial de contenido: archivos de texto que abarcan conjuntos predefinidos de elementos XML, en los cuales los elementos se identifican mediante etiquetas con formato Arquitectura de Documentum de EMC Una Revisin Detallada 22

XML. Como estndar de la industria, XML en s es un lenguaje de marcado estructurado e independiente de las plataformas que separa el contenido del formato. El etiquetado del contenido y la separacin entre contenido y formato proporcionan diversas ventajas para la administracin de contenido, que incluyen inteligencia y reutilizacin de contenido mejoradas; por ejemplo, se puede consultar el contenido mediante etiquetas y valores predefinidos para mejorar la precisin de la bsqueda. Tambin es posible almacenar el contenido en una sola fuente, para despus reasignarlo y convertirlo a mltiples formatos en varios tipos de dispositivos de visualizacin. En los ltimos aos, XML se transform en el lenguaje universal para el intercambio automtico de contenido entre aplicaciones no relacionadas que se ejecutan en entornos basados en Web. La plataforma Documentum conserva la estructura y los enlaces jerrquicos entre los componentes y los documentos XML. Proporciona la capacidad de analizar, validar, transformar y almacenar los documentos XML entrantes y, tambin, permite realizar tareas de mapping en ellos. Adems, tambin soporta aplicaciones XML que almacenan directamente el contenido etiquetado como XML al repositorio de Documentum y administran el contenido de ste. Los servicios XML ofrecen dos funciones esenciales para la administracin de documentos XML en su formato original: validacin de contenido XML y fragmentacin XML. Validacin de contenido XML La validacin de contenido XML garantiza que los elementos XML de un documento XML estn correctamente formados y adhieran a una definicin predeterminada. La plataforma Documentum puede validar documentos XML en cualquier momento, incluso durante la incorporacin al repositorio. Se puede validar un documento XML con un esquema XML o una definicin de tipo de documento (DTD, Document Type Definition). Tambin es posible efectuar una validacin extendida mediante las interfaces SAX2 y DOM. El proceso de validacin garantiza que los componentes, los atributos, la estructura, los tipos y los valores correspondan al formato especificado. Por otra parte, la plataforma Documentum tambin administra las DTDs y los esquemas como objetos del repositorio de Documentum que se pueden someter a control de versiones, asegurar o retener como registros. Fragmentacin XML Al segmentar (o fragmentar) un documento XML en sus respectivos elementos, los fragmentos resultantes se administran por separado como objetos de contenido individuales. Estos fragmentos poseen las mismas caractersticas que otros objetos de contenido: cada uno cuenta con sus propios niveles de seguridad y atributos de contenido predefinidos, como se muestra en la Figura 7.

Figura 7. Los fragmentos XML se administran como objetos individuales, al igual que cualquier otro objeto de contenido del repositorio de Documentum. Arquitectura de Documentum de EMC Una Revisin Detallada 23

La fragmentacin facilita la reutilizacin. Es posible combinar y generar en diferentes contextos un conjunto de objetos de contenido individuales a fin de cumplir las distintas necesidades del negocio. Los fragmentos son componentes de documentos virtuales. Por ejemplo, para producir un comunicado de prensa, es posible presentar un conjunto de titulares de noticias como resumen de noticias, y cada titular se puede asociar con los prrafos de noticias pertinentes.

ECI Services para bsqueda federada


La plataforma Documentum incluye tecnologas y servicios para integracin, acceso y consulta de contenido ajeno a la informacin almacenada en un repositorio de Documentum. Estos servicios de bsqueda federada se basan en una tecnologa ECI que aprovecha un entorno de adaptadores para diversos repositorios internos y externos. La bsqueda federada resulta til para la interaccin con la informacin almacenada en repositorios de terceros (no de Documentum) y sitios Web externos. La plataforma Documentum se vale de la bsqueda federada para realizar bsquedas en mltiples repositorios y consultar y recuperar contenido de fuentes de informacin externas, que incluyen: FileNet, Open Text, Microsoft SharePoint, IBM Lotus Notes y almacenes de contenido de otros proveedores SAP, Oracle y otros proveedores de aplicaciones empresariales Bases de informacin de Lexis/Nexis y Factiva, y otros entornos dinmicos de contenido basados en Web Intranets estticas a las que acceden entornos de bsqueda de terceros como el motor de bsqueda Autonomy y la aplicacin empresarial de bsqueda Google Motores de bsqueda de escritorio proporcionados por Google y otros motores de bsqueda en lnea, como Google, Yahoo y Voila

ECI Services emplea un entorno de adaptador y de intermediacin de consultas para permitir estas capacidades de bsqueda federada (vea la Figura 8). Cada fuente de informacin recibe un adaptador exclusivo que asigna los metadatos relacionados con el contenido y definidos en una fuente de informacin externa a un esquema soportado por la plataforma Documentum.

Figura 8. ECI Services se basa en un entorno de adaptador que permite capacidades de bsqueda federada. Arquitectura de Documentum de EMC Una Revisin Detallada 24

ECI Services operan mediante un proceso de dos pasos. Primero, el intermediario de consultas ECI asigna una consulta a un formato soportado por una fuente de informacin externa y, posteriormente, remite la consulta a la fuente. Posteriormente, el procesador de consultas recibe la informacin solicitada desde la fuente externa, extrae los metadatos, filtra la respuesta y devuelve los resultados. Los usuarios pueden enviar de manera simultnea una misma consulta a mltiples fuentes de informacin por medio de cualquier cliente, recibir los resultados de varios procesadores de consultas que interacten con fuentes externas y fusionar los resultados en un solo conjunto en funcin de criterios predefinidos (por ejemplo, pertinencia o fecha de publicacin).

Content Transformation Services


Documentum ofrece una serie de Content Transformation Services (CTS) para convertir los distintos tipos de contenido, como documentos, fotos, archivos de video e imgenes mdicas, a distintos formatos y resoluciones. CTS tambin ofrece anlisis de contenido, extraccin de metadatos y vistas previas en miniatura para tipos de contenido de medios enriquecidos. Content Transformation Services (vea la Figura 9) constituye mdulos autnomos diseados para ejecutar tareas especficas. Algunos de estos mdulos son: Document Transformation Services (DTS): soporta transformacin de documentos; por ejemplo, conversin de documentos de MS Office a formato PDF y HTML. DTS ejecuta un proceso independiente en el servidor, sin necesidad de autenticacin del usuario. La transformacin puede ser activada por los usuarios (desde la interfaz de usuario) o por un proceso del negocio o un cambio en las etapas del ciclo de vida (de manera automtica). Advanced Document Transformation Services (ADTS): extiende los servicios DTS al incorporar soporte para formatos de documentos adicionales: Microsoft Project, Microsoft Visio, AutoCAD y documentos de varias pginas en formato TIFF. ADTS crea marcadores y preserva los enlaces dentro de los documentos; adems, soporta varias opciones avanzadas para controlar los formatos de salida PDF. ADTS incluye capacidad activa de storyboard para navegar directamente los documentos PDF almacenados en el repositorio de Documentum. XML Transformation Services (XTS): brinda una amplia variedad de transformaciones a formato XML, un motor eXtensible Stylesheet Language Transformations (XSLT) con soporte completo para XSL-FO, un kit de herramientas de hojas de estilo y soporte para la transformacin de esquemas XML. XTS transforma XML a formatos Web populares (como HTML), formatos mviles (como WML, cHTML y XHTML Basic), formato PDF, formatos de archivo de ayuda (como JavaHelp, Microsoft WinHelp y Microsoft Compiled HTML Help), formato de texto enriquecido (RTF) y PostScript. El kit de herramientas proporciona soporte para estndares Darwin Information Typing Architecture (DITA) y DocBook. XTS puede convertir XML de un esquema a otro cuando los flujos de trabajo, los ciclos de vida, las acciones basadas en usuario u otras aplicaciones lo solicitan. Regulatory Publishing Transformation Services de Documentum: ofrece capacidades mejoradas de transformacin de PDF, las cuales brindan soporte para el proceso de envo de especificaciones de documentos electrnicos tcnicos comunes (eCTD, Electronic Common Technical Document). Estos servicios presentan opciones de transformacin avanzadas para la creacin de archivos PDF. Media Transformation Services (MTS): proporciona transformacin y anlisis de medios enriquecidos para activos digitales estticos, incluidas fotos, imgenes escaneadas y presentaciones con dispositivas de Microsoft PowerPoint. MTS es capaz de leer y escribir metadatos asociados con activos digitales, como la tecnologa de etiquetado Adobe XMP. MTS incluye capacidades para administrar de manera automtica diapositivas de PowerPoint como objetos individuales y extraer vistas previas en miniatura e imgenes de baja resolucin desde activos de alta resolucin. Como resultado, es posible administrar activos digitales de manera centralizada y reutilizarlos en diferentes contextos. Las capacidades de configuracin de MTS pueden integrar el soporte de la plataforma Documentum para repositorios de medios enriquecidos con la infraestructura subyacente de almacenamiento de contenido.

Arquitectura de Documentum de EMC Una Revisin Detallada

25

Audio/Video Transformation Services: ampla las capacidades de soporte de MTS para mltiples formatos de audio, video y animacin. Estos servicios tambin integran el almacenamiento de streaming media y su implementacin en la infraestructura de almacenamiento de contenido. Medical Imaging Transformation Services: ampla MTS con la incorporacin de soporte para acceso a metadatos, administracin y almacenamiento de imgenes mdicas. Este servicio soporta el estndar de Imgenes Digitales y Comunicacin en Medicina (DICOM, Digital Imaging and Communications in Medicine), un conjunto predefinido de metadatos para el almacenamiento de imgenes mdicas en el repositorio de Documentum.

Figura 9. Los desarrolladores de aplicaciones pueden emplear la arquitectura plug-in modular de Content Transformation Services para desarrollar e implementar nuevos servicios de transformacin.

Content Intelligence Services


Mediante Content Intelligence Services (CIS), es posible analizar el texto de documentos u otros objetos de contenido y clasificar de manera automtica los activos de contenido; en otras palabras, CIS determina el contenido del texto. Los resultados de la clasificacin se pueden utilizar para llenar automticamente los metadatos de contenido o para asignar los activos de contenido a una taxonoma. CIS utiliza algoritmos lingsticos para analizar el contenido, que incluyen trminos relacionados con el contenido, palabras clave y atributos vinculados al dominio de informacin de una empresa. CIS combina contenido de diversas fuentes, lo somete a un programa analizador y emplea tres motores para examinar el texto resultante, como se muestra en la Figura 10.

Arquitectura de Documentum de EMC Una Revisin Detallada

26

Figura 10. Content Intelligence Services analiza el texto de documentos u otros objetos de contenido y clasifica de manera automtica los activos de contenido. Los tres motores de anlisis son los siguientes: Motor de extraccin de informacin: extrae etiquetas, propiedades de contenido y texto del contenido analizado y genera metadatos; los resultados que arroja se refinan an ms con los otros dos motores. Motor de clasificacin conceptual: asocia el contenido analizado con categoras predeterminadas o taxonomas conceptuales. Motor de anlisis semntico: analiza el contenido sobre la base de taxonomas especficas de la empresa u otras consideraciones semnticas.

CIS genera una lista de conceptos contenidos en el conjunto de documentos u otros objetos de contenido. Estos conceptos pueden mejorar la precisin de la bsqueda y, asimismo, brindar la capacidad de categorizar el repositorio de manera automtica.

Content Delivery Services


La plataforma Documentum ofrece sofisticados servicios de implementacin y suministro de contenido, a fin de suministrar contenido a entornos de servidores Web, portales empresariales y servidores de aplicaciones. La distribucin se puede basar en conjuntos de reglas o consultas del negocio, que definen la frecuencia de las actualizaciones y el contenido que se distribuye. La plataforma es capaz de soportar conjuntos individuales de reglas de distribucin para cada entorno. La plataforma Documentum se puede integrar con una amplia gama de servidores de aplicaciones, personalizacin, e-commerce y portales de proveedores de empresas accesibles mediante red, como BEA, IBM, Microsoft, Oracle, Sun y SAP; adems puede proporcionar contenido a dichos servidores. Site Caching Services La plataforma Documentum incluye Site Caching Services, que incrementa la flexibilidad para distribuir contenido a diversos entornos de implementacin. Los administradores de estos entornos externos pueden Arquitectura de Documentum de EMC Una Revisin Detallada 27

valerse de las capacidades que ofrece la plataforma Documentum para control de versiones, flujo de trabajo, ciclo de vida y otras capacidades de administracin de contenido que permiten mantener el contenido de sus aplicaciones. Site Deployment Services Site Deployment Services de Documentum complementa los servicios de Site Caching Services al suministrar contenido de manera automtica a mltiples entornos de servidores Web o servidores Web externos. En caso de que no sea posible suministrar el contenido de acuerdo con la programacin, estos servicios tambin soportan rollback con autorreparacin (vea la Figura 11).

Figura 11. La plataforma Documentum incluye Site Caching Services y Site Deployment Services para implementacin de contenido en aplicaciones y servidores Web. La plataforma Documentum puede almacenar en la memoria cach conjuntos predefinidos de documentos u otros objetos de contenido, incluidos los activos y atributos de contenido, o metadatos, en servidores intermedios de un repositorio con memoria cach optimizado y de alta velocidad. Esto permite a las aplicaciones acceder a estos atributos y activos para personalizar e incorporar de manera automtica el contenido administrado por la empresa.

Process Services
Las capacidades de Process Services de la plataforma Documentum incluyen Collaborative Services, capacidades de administracin de espacios de trabajo compartidos y administracin de procesos del negocio, un conjunto de productos para la administracin de procesos del negocio en todos los niveles de la empresa.

Collaborative Services
La plataforma Documentum ofrece Collaborative Services basado en seis objetos colaborativos: salas, canales de discusin, carpetas contextuales, notas, calendarios y tablas de datos.

Arquitectura de Documentum de EMC Una Revisin Detallada

28

Las salas corresponden a espacios de trabajo ad hoc compartidos que cuentan con sus propias listas de membresa y derechos de propiedad. nicamente los usuarios de la lista de miembros pueden acceder a una sala y su contenido. Las salas soportan usuarios internos y externos. Tambin es posible que los miembros sean ajenos a la organizacin y no cuenten con otro tipo de autenticacin para tener acceso a la plataforma Documentum. Los canales de discusin son conjuntos de mensajes organizados en torno de un tema predefinido. Es posible establecer una conexin entre un canal de discusin y cualquier otro objeto almacenado dentro del repositorio de Documentum, como un documento o un conjunto de documentos almacenados en una carpeta. Las carpetas contextuales recopilan y organizan el contenido en un entorno colaborativo, con lo cual proporcionan informacin adicional acerca del propsito de una carpeta. Esta informacin descriptiva puede aparecer como un encabezado banner o como un entorno de "mini ayuda" dentro del contexto de la visualizacin de una carpeta. Las notas son archivos de texto basados en Web y almacenados en el repositorio que mantienen el contexto (y los enlaces) de los objetos relacionados. Por ejemplo, una nota puede ser un comentario en un prrafo de un documento, una anotacin anexada a un documento completo o un resumen de una serie de documentos almacenados dentro de una carpeta. Los calendarios permiten a los miembros organizar, rastrear y programar eventos para sus equipos. Las tablas de datos constituyen un mecanismo simple para recopilar informacin mediante un formulario y organizar las entradas clasificadas por campos resultantes en un formulario tabular. Cada fila de la tabla de datos corresponde a un objeto del repositorio y se puede derivar a revisin y aprobacin mediante un flujo de trabajo. Tambin es posible anexar notas y canales de discusin a la fila.

Estos objetos colaborativos se almacenan del mismo modo que otros objetos de contenido del repositorio de Documentum. Se administran mediante varios servicios de repositorio, que incluyen check-in/out, bsqueda, flujo de trabajo, retencin, seguridad y ciclo de vida. Collaborative Services soporta suscripciones. Los miembros pueden subscribirse a cualquier objeto de inters dentro de una sala (por ejemplo, todos los elementos de una carpeta o un canal de discusin en particular) y recibir notificaciones automticas cuando la informacin asociada con dichos objetos experimente cambios. Collaborative Services brinda interfaces orientadas a los servicios para solicitar los objetos colaborativos. Al mismo tiempo, es posible combinar Collaborative Services con servicios asociados de la plataforma. Por ejemplo, es posible administrar automticamente como registro un canal de discusin vinculado a la autora y edicin de una aplicacin de patente y, adems, aplicarle las mismas polticas de retencin que a los propios documentos preliminares de patente.

Administracin de procesos del negocio


La plataforma Documentum ofrece una completa serie de productos de BPM, conocida como "Documentum Process Suite", que administra todo el ciclo de vida de los procesos del negocio en los distintos niveles de la empresa (vea la Figura 12). La serie soporta metodologas de perfeccionamiento continuo del performance del negocio. Coordina, adems, procesos ajenos a Documentum, como aplicaciones, fuentes de datos y sistemas externos. La serie Process Suite combina un motor de procesos y un motor de monitoreo de actividades del negocio (BAM, Business Activity Monitoring), adems del repositorio de contenido central, para proporcionar amplias capacidades de BPM. Debido a que la serie se basa en la arquitectura unificada de la plataforma Documentum, puede administrar con facilidad cualquier tipo de contenido como parte de carga de los procesos, desde formularios electrnicos y documentos XML hasta documentos compuestos y medios enriquecidos.

Arquitectura de Documentum de EMC Una Revisin Detallada

29

Figura 12. La plataforma Documentum brinda una serie de productos de BPM que permiten administrar los procesos del negocio que involucran mucho contenido en todos los niveles de la empresa. El motor de monitoreo de actividades del negocio (BAM) controla los aspectos crticos de los procesos del negocio y proporciona informes actualizados. Business Process Engine ejecuta y administra los procesos end-to-end y se integra con aplicaciones externas mediante un entorno SOA. Todo el contenido se almacena y administra en el repositorio. Process Suite soporta un entorno grfico de diseo de procesos del negocio orientado a objetos. Process Builder especifica el flujo de contenido entre actividades y la lgica que determina la secuencia de las actividades. Los procesos y las actividades se pueden reutilizar y distribuir completamente. Process Builder soporta tipos de datos globales estructurados como parte de su modelo subyacente de datos. En consecuencia, es posible incorporar datos estructurados como tipos de datos livianos en el funcionamiento de los modelos de procesos y, asimismo, presentarlos mediante las herramientas de reporting. En el tiempo de ejecucin, Business Process Engine interacta con el contenido del repositorio, siguiendo los pasos de un proceso del negocio segn lo define Process Suite. De este modo, Business Process Engine recopila informacin de un formulario basado en navegador o de un servicio de Protocolo Simple de Acceso a Objetos (SOAP, Simple Object Access Protocol) y, luego, ejecuta una serie de servicios orientados a los procesos. El motor de procesos incluye administracin constante de estado, servicios de administracin de colas, entorno automatizado de tareas, servicios de temporizadores/plazos, seguimiento de auditoras, recopilacin de datos y servicios de combinacin para estructurar la secuencia predefinida de acciones y actividades que conforman el proceso del negocio. Process Suite soporta un entorno extensible de administracin de procesos del negocio, en el cual es posible incorporar herramientas de terceros, como el motor ILOG Rules, el motor de anlisis Cognos y el optimizador/simulador IDS Scheer. El resultado es un slido entorno de procesos del negocio que aprovecha el contenido administrado y estructura el flujo de contenido en todos los niveles de la empresa.

Arquitectura de Documentum de EMC Una Revisin Detallada

30

El grupo de herramientas: Creacin de Aplicaciones de Contenido


La plataforma Documentum incluye un grupo de herramientas que brinda acceso al contenido del repositorio y a todos los servicios de nivel de plataforma. El grupo consta de componentes predefinidos e interfaces de programacin de aplicaciones (APIs, Application Programming Interfaces) asociadas que permiten realizar personalizaciones, integraciones y desarrollo de aplicaciones. Adems, las APIs se abstraen y se presentan como componentes interactivos combinados libremente dentro de una arquitectura orientada a los servicios (SOA, Service-Oriented Architecture). Las capacidades de ECM se presentan como un catlogo integral de servicios compartidos y servicios Web. Este grupo brinda un conjunto consistente de APIs y un modelo unificado de objetos y programacin. Los desarrolladores de aplicaciones pueden usar estos componentes y APIs para desarrollar aplicaciones en el lado del cliente y basadas en servidores que interacten con el contenido del repositorio. Pueden aprovechar estos objetos compuestos que combinan funciones relacionadas con el contenido para desarrollar rpidamente aplicaciones empresariales integradas. Asimismo, los desarrolladores de aplicaciones pueden combinar los servicios y objetos de administracin de contenido con otras funciones de aplicaciones empresariales para aprovechar la flexibilidad de un entorno de desarrollo SOA.

Enterprise Content Services y la API de Documentum


El grupo de herramientas abarca Enterprise Content Services (ECS), APIs basadas en estndares y un conjunto extensible de objetos del negocio para desarrollar e implementar aplicaciones de contenido (vea la Figura 13).

Figura 13. El grupo de herramientas abarca Documentum Foundation Classes (DFC), APIs basadas en estndares y un conjunto extensible de objetos del negocio para desarrollar e implementar aplicaciones de contenido. Documentum Foundation Services (DFS) presenta funciones de administracin de contenido de Documentum, como servicios Web. Los servicios DFS son el primer conjunto de objetos de negocios incluidos en Enterprise Content Services, la arquitectura orientada a los servicios de Documentum que permite la integracin con aplicaciones externas en conformidad con los estndares. Los servicios ECS engloban las funciones centrales de administracin de contenido de la plataforma de Documentum como un conjunto de servicios Web individuales y presentan estas funciones como objetos del negocio. Estn diseados para facilitar el desarrollo y el soporte de las aplicaciones de contenido. Fomentan la reutilizacin y reducen la curva de aprendizaje de los desarrolladores. Dado que renen servicios comunes en Arquitectura de Documentum de EMC Una Revisin Detallada 31

objetos relacionados con el negocio, los servicios ECS estn diseados para brindar una gran agilidad a los desarrolladores de aplicaciones, a fin de cumplir las exigencias de los entornos de negocios que cambian constantemente. El grupo de herramientas ofrece los servicios Documentum Foundation Services (DFS) como el conjunto principal de objetos de ECS. Los servicios DFS son un conjunto de objetos y servicios que cumplen con SOA, destinados al desarrollo de aplicaciones de contenido dentro de un entorno de servicios Web. Documentum Compliance Services y Documentum Collaboration Services son conjuntos de objetos de ECS que se incluirn prximamente con la plataforma Documentum.

Documentum Foundation Services


Documentum Foundation Services (DFS) es un entorno de desarrollo de arquitectura orientada al servicio (SOA) y API. Este entorno reemplaza y mejora considerablemente el entorno de servicios Web anterior. DFS ofrece un conjunto de objetos y servicios de negocios listos para utilizar, diseados desde su base para presentar funcionalidades de administracin de contenido clave como servicios Web que cumplen con los estndares. DFS garantiza que la plataforma Documentum pueda funcionar como parte integral de la infraestructura de la informacin de la organizacin, desarrollada mediante servicios Web.

Componentes combinados libremente


DFS proporciona servicios relacionados con contenido y combinados libremente, que pueden ensamblarse dinmicamente para cumplir con las necesidades del negocio. Son servicios autnomos: la modificacin o mejora de las funciones de un servicio no afecta al resto. Los DFS estn basados en servicios Web, un entorno de software basado en estndares, con el reconocimiento del Consorcio W3C, (World Wide Web Consortium), y estn diseados para soportar la interaccin interoperable de mquina a mquina en una red. Los componentes de DFS se registran y descubren mediante un registro central o directorio (como Universal Description, Discovery e Integration Directory). Los componentes de DFS se describen en los trminos del Lenguaje de Descripcin de Servicios Web (WSDL, Web Services Description Language). Cada componente de DFS ofrece una pequea variedad de servicios simples para otros componentes. DFS ofrece: Un conjunto de servicios principales y extendidos, implementados como servicios Web, que presentan la funcionalidad de la administracin de contenido de Documentum. Un SDK Java para permitir el desarrollo de los consumidores de servicios mediante el soporte de tiempo de ejecucin de clientes y el desarrollo de servicios personalizados basados en Objetos Java Simples (POJOs, Plain Old Java Objects) u Objetos del Negocio basados en el Servicio (SBOs, Service-Based Business Objects) mediante el soporte de tiempo de ejecucin de servicios. Una interfaz de servicio WSDL para permitir el desarrollo de consumidores de servicios mediante plataformas de desarrollo que soportan mensajera SOAP, incluso .NET.

El diseo de este modelo de datos y servicios DFS simplifica el proceso de desarrollo de aplicaciones empresariales al reducir la complejidad general de la API y alinear la semntica de los servicios y de los objetos de datos con las necesidades de la lgica del negocio de EMC. Esto soporta el desarrollo rpido y dinmico de las aplicaciones mediante las herramientas de coordinacin de procesos del negocio (como BMP) y facilita la integracin de la administracin del contenido empresarial en una empresa orientada a los servicios (SOE, Service-Oriented Enterprise).

Arquitectura de Documentum de EMC Una Revisin Detallada

32

Los servicios DFS tambin respetan los objetos de BOF (Business Object Framework). Por lo tanto, los servicios pueden llamar e invocar objetos predefinidos cuando se los integra con el repositorio de Documentum.

Servicios listos para utilizar


Documentum brinda un conjunto principal de servicios que representa las funciones ms importantes de un sistema genrico de ECM. Cada servicio proporciona un conjunto de operaciones independientes. El servicio de objetos, por ejemplo, proporciona una funcionalidad de administracin de contenido bsica en operaciones como "Crear", "Obtener", "Actualizar" y "Eliminar". Los servicios DFS actuales y sus funciones relacionadas se describen en la Tabla 3.

Tabla 3. Funciones y servicios DFS Servicio Objeto Descripcin Operaciones fundamentales de ECM para creacin, obtencin, actualizacin y eliminacin de objetos de repositorio, adems de operaciones de copia y movimiento. Operaciones que producen y controlan versiones en el repositorio, como check-in y check-out. Operaciones de obtencin de datos de repositorios mediante consultas ad hoc, como traspasos, consultas de cach, resultados y generador de consultas. Operaciones que examinan los metadatos del repositorio. Operaciones relacionadas con bsquedas basadas en propiedades y de texto completo en el repositorio de la empresa y en recursos de informacin externos. Operaciones de obtencin de datos acerca de las plantillas de procesos de flujos de trabajo almacenadas en repositorios y una operacin que inicia una instancia de proceso de flujo de trabajo.

Control de versiones

Consulta

Esquema Bsqueda

Flujo de trabajo

Los desarrolladores de aplicaciones pueden desarrollar aplicaciones de Internet enriquecidas enlazando servicios de contenido, proporcionados por DFS, con servicios Web de aplicaciones y entornos externos y, de esta manera, ofrecer soluciones habilitadas por el contenido que aprovechan el contenido empresarial de nuevas maneras.

Documentum Composer
Los desarrolladores de aplicaciones pueden utilizar Documentum Composer de EMC, un entorno de desarrollo integrado (IDE, Integrated Development Environment) basado en Eclipse para desarrollar, implementar y configurar aplicaciones que se ejecutan en la plataforma Documentum. Al aprovechar los IDEs basados en estndares, los desarrolladores pueden aumentar la productividad y reducir los costos de desarrollo de aplicaciones. Eclipse habilita un ecosistema de clientes, asociados de negocios y analistas de negocios.

Arquitectura de Documentum de EMC Una Revisin Detallada

33

Documentum Composer soporta una serie de mecanismos para el rpido desarrollo de las aplicaciones. Incluye un modelo de plug-in bien definido para sumar funcionalidad al entorno de las aplicaciones. Al igual que los IDEs basados en Eclipse, Composer se integra con la amplia variedad de recursos de aplicaciones (y sus diversos editores) disponibles para los desarrolladores en los entornos computacionales de empresas. Composer permite que mltiples herramientas compartan un conjunto comn de recursos de informacin. Proporciona un entorno abierto, con puntos de extensin e interfaces bien definidos. Como resultado, los desarrolladores de aplicaciones pueden aprovechar sus inversiones en DFS y ECS; pueden desarrollar con facilidad aplicaciones orientadas a los servicios Web que integren objetos relacionados con el contenido con recursos y servicios de aplicaciones empresariales externas.

Documentum Foundation Classes de EMC


Documentum Foundation Classes (DFC) es la interfaz de programacin soportada y publicada para obtener acceso a la funcionalidad de la plataforma Documentum. DFC presenta el modelo de objeto de Documentum como una biblioteca orientada al objeto para que la utilicen otras aplicaciones. DFC proporciona bibliotecas de clases Java y de modelos de objetos de componentes (COM, Component Object Model) que presentan las funciones que impulsan la plataforma Documentum. Los desarrolladores de aplicaciones pueden utilizar lenguajes de programacin y herramientas de desarrollo, incluso las desarrolladas en Java, Visual Basic, C# y C++, para crear aplicaciones personalizadas.

Interfaces de programacin de aplicaciones basadas en estndares


Documentum de EMC ofrece un entorno unificado de desarrollo de aplicaciones. Adems de DFC, la plataforma Documentum soporta una cantidad de APIs basadas en estndares (desde aplicaciones de autora, dispositivos de captura, bases de datos de terceros, servidores de aplicaciones y otros componentes empresariales) para interactuar con el repositorio de Documentum. Estas APIs basadas en estndares interactan con DFC de manera transparente, enviando y recibiendo llamadas. Los desarrolladores de aplicaciones pueden escoger las APIs que mejor se adapten a sus aplicaciones. El estndar API incluye JDBC, WebDAV, protocolo de transferencia de archivos (FTP) y servicios de archivos en red en el nivel del sistema operativo (File Share Services). Se describen de la siguiente manera: JDBC: muchas aplicaciones basadas en servidores utilizan protocolos de acceso de datos Java estndar para obtener acceso al contenido del repositorio mediante los JDBC Services de Documentum. Estos servicios hacen que el repositorio de Documentum "parezca" una base de datos JDBC. WebDAV: la plataforma Documentum soporta al servidor WebDAV que permite trabajar con aplicaciones de escritorio conscientes de WebDAV, como Adobe Photoshop y Adobe InDesign, para utilizar este protocolo para interactuar con el repositorio de Documentum. FTP: la plataforma Documentum proporciona un servidor FTP que permite trabajar con herramientas de terceros, como Macromedia Dreamweaver, para integraciones con el repositorio de Documentum. File Share Services: la plataforma Documentum soporta los servicios de espacio compartido en el nivel de la red, lo que permite que el repositorio de Documentum "parezca" una unidad de red compartida para aplicaciones de escritorio distintas. Estas aplicaciones pueden utilizar sus propios mecanismos de acceso a los file systems y agregar contenido al repositorio de Documentum.

Business Objects Framework


La plataforma Documentum incluye Business Objects Framework (BOF), un entorno estructurado para desarrollar aplicaciones de contenido. BOF ahorra a los desarrolladores de aplicaciones los detalles de implementacin de DFC detalladas de las plataformas y el modelo de objeto subyacente en el que se basa Arquitectura de Documentum de EMC Una Revisin Detallada

34

DFC. Por lo tanto, BOF permite a los desarrolladores de aplicaciones desarrollar con facilidad componentes con un alto nivel de reutilizacin que se pueden compartir entre mltiples aplicaciones. El funcionamiento de BOF consiste en abstraer las APIs de Documentum y agregar conjuntos de estas APIs a un nivel lgico del negocio. BOF proporciona una manera de desarrollar componentes lgicos del negocio reutilizables, llamados objetos del negocio. (Los objetos del negocio son entidades con clases y propiedades predefinidas [atributos] y pueden tener contenido no estructurado asociado con ellas). BOF puede implementar la lgica del negocio como componentes reutilizables que se pueden conectar a aplicaciones de red o de clientes del segmento intermedio. Estos objetos del negocio combinan la lgica de la presentacin y del negocio con el acceso directo a todos los Servicios de Contenidos.

Tipos de objetos del negocio


La plataforma Documentum soporta varios tipos de objetos del negocio. Los objetos del negocio basados en el tipo estn fuertemente relacionados con un tipo de objeto almacenado en el repositorio de Documentum. Los desarrolladores de aplicaciones pueden agregar mtodos adicionales al tipo de objeto configurado o incorporado. Algunos ejemplos son "catlogo", "producto", "contrato" y "cliente". Los objetos del negocio basados en el servicio proporcionan mtodos que llevan a cabo procedimientos ms generalizados que, por lo general, no estn restringidos a un tipo de objeto o repositorio especfico. En cambio, esos objetos representan un conjunto de funciones que pueden operar en otros tipos de objetos del negocio. Algunos ejemplos son los servicios de "distribucin", "alertas al buzn de correo" y "exportacin de catlogos".

Un mtodo asociado con un objeto del negocio se puede llamar desde otras aplicaciones basadas en DFC. Los lenguajes JSP, ASP, Visual Basic y otros pueden obtener acceso a los dos tipos de objetos del negocio.

Aspectos
La plataforma Documentum soporta aspectos, un entorno adicional para extender el comportamiento y los atributos del objeto. Los aspectos son un tipo de entidad de BOF que se puede adjuntar de manera dinmica a instancias del objeto para proporcionar campos y mtodos ms all de los estndares para el tipo de objeto. El comportamiento extendido puede incluir una funcionalidad que se aplica a los tipos en toda la jerarqua del objeto. Los aspectos aceleran el desarrollo de las aplicaciones y mejoran la reutilizacin de cdigos, ya que los atributos y el comportamiento extendidos no alteran las definiciones de tipo subyacentes. Por ejemplo, un aspecto puede definir un objeto como conservable o visible en la Web. Este aspecto nico se puede aplicar a mltiples tipos de objetos diferentes. Los aspectos aceleran el desarrollo de las aplicaciones y mejoran la reutilizacin de cdigos, ya que los atributos y el comportamiento extendidos no alteran las definiciones de tipo subyacentes. Los aspectos se pueden asociar con un objeto individual o un tipo de objeto. Cuando se asocia un aspecto con un tipo de objeto, tambin se lo asocia de manera automtica con cada objeto nuevo del tipo de objeto especificado. Tambin se pueden definir propiedades para los aspectos. Las propiedades definidas para un aspecto aparecen ante los usuarios como definidas para el tipo de objeto del objeto al que se asign el aspecto.

Arquitectura de Documentum de EMC Una Revisin Detallada

35

El grupo de experiencias: Cmo administrar las interacciones de los usuarios finales


El entorno del Web Development Kit
La plataforma Documentum incluye un Web Development Kit (WDK), un entorno de desarrollo de aplicaciones que permite desarrollar aplicaciones para clientes y usuarios basadas en Web. La plataforma Documentum tambin utiliza WDK para proporcionar una serie de Conectores de Aplicaciones para integrar la funcionalidad de Documentum con Word, Excel, PowerPoint y el Cliente de Documentum para Outlook, y utiliza los portlets para presentar la funcionalidad de Documentum desde un portal. El entorno WDK ofrece a los desarrolladores de aplicaciones un entorno unificado y consistente para crear aplicaciones basadas en Web mediante el acceso al repositorio de Documentum. El entorno WDK se vale de un enfoque de eventos de control de formularios, consistente con .NET WebForms y el estndar Java Server Faces (JSR 127). WDK ofrece cientos de componentes prediseados que cumplen con la norma JSR 168, que es el estndar de la comunidad Java para desarrollar portlets. Estos componentes permiten a los desarrolladores de Documentum crear y personalizar fcilmente aplicaciones de contenido basado en Web. De hecho, todos los clientes y las aplicaciones de Documentum se crean mediante WDK, incluso Webtop, Web Publisher y Compliance Manager. El entorno WDK ofrece un conjunto de servicios WDK que se ejecutan localmente en un dispositivo en el lado del cliente (ya sea en un navegador o en aplicaciones de escritorio) e interactan con objetos del negocio en el lado del servidor (desarrollados con BOF) o con funciones DFC (vea la Figura 14).

Figura 14. La plataforma Documentum incluye un Web Development Kit para desarrollar aplicaciones centradas en la Web y basadas en navegador, y aplicaciones de escritorio basadas en Windows. Arquitectura de Documentum de EMC Una Revisin Detallada

36

En las aplicaciones de escritorio basadas en Windows, el entorno WDK proporciona objetos COM para enviar y recibir mensajes HTTP hacia un servidor de aplicaciones Web y desde l. Los mensajes se intercambian como documentos XML.

Conectores de Aplicaciones
Los Conectores de Aplicaciones son componentes de WDK que brindan acceso a los servicios de contenido y al repositorio de Documentum desde aplicaciones de escritorio, como Microsoft Office. Los Conectores de Aplicaciones estn basados en un entorno abierto que permite a los desarrolladores agregar conectores como plug-ins. Como los Conectores de Aplicaciones funcionan de forma consistente en varias aplicaciones de escritorio, un solo conjunto cumple con todas las necesidades de los desarrolladores de aplicaciones. Los Conectores de Aplicaciones aparecen como elementos de men en los mens desplegables de las aplicaciones de escritorio. Desde Microsoft Word, Excel y PowerPoint, los Conectores de Aplicaciones llaman directamente a los componentes en el lado del servidor en la plataforma Documentum, llevan a cabo la accin y devuelven los resultados a la aplicacin de Office que realiz la llamada. Por ejemplo, un usuario de Microsoft Word podra utilizar el men de Documentum para realizar consultas sobre los documentos almacenados en el repositorio de Documentum y obtener acceso a ellos. El Conector de Aplicaciones primero autentica el usuario y despus autoriza los derechos de acceso, lo que permite al usuario obtener acceso de manera sencilla a los documentos de Word. Mientras tanto, las polticas del negocio de la plataforma Documentum administran el contenido en el lado del servidor. Los desarrolladores de aplicaciones pueden usar el SDK de Conectores de Aplicaciones para desarrollar conectores de aplicaciones adicionales para las aplicaciones de escritorio que deseen.

Una extensin Webtop


La plataforma Documentum proporciona extensiones para Webtop de Documentum de EMC para obtener funcionalidad adicional, como la administracin de colaboraciones y registros, que se puede agregar a cualquier cliente Documentum, incluso Webtop, Digital Asset Manager y Web Publisher. Estas extensiones son componentes de WDK basados en navegador que pueden obtener acceso a los servicios de registros proporcionados por las extensiones de la plataforma. Las extensiones de las plataformas agregan funcionalidad y nuevos tipos de objetos administrados en el repositorio, como salas, canales de discusin, carpetas contextuales y notas.

Portlets para portales empresariales


Por ltimo, el entorno WDK soporta JSR 168 para desarrollar portlets, componentes conectables administrados que se muestran en un portal empresarial. WDK proporciona acceso nativo a las capacidades de administracin de contenido subyacentes de la plataforma Documentum en el contexto de un portal empresarial. EMC ofrece un conjunto de portlets prediseados JSR 168 basados en WDK con funcionalidades comunes, como "Bandeja de entrada", "Mis carpetas" y "Bsqueda". Sin embargo, los desarrolladores pueden utilizar el WDK para crear cualquier otro tipo de portlet basado en los componentes del WDK. Nota: EMC tambin ofrece portlets para el Portal SAP, llamados iViews. Como el Portal SAP no soporta el estndar JSR 168, los portlets de SAP se crean mediante la tecnologa SAP nativa.

Arquitectura de Documentum de EMC Una Revisin Detallada

37

Conclusin
La arquitectura de Documentum de EMC proporciona una estrategia para resolver las necesidades actuales de administracin de contenido no estructurado y para invertir en oportunidades futuras para obtener ganancias de las aplicaciones centradas en el contenido. Documentum brinda los servicios para administrar la informacin no estructurada del negocio en una empresa y ms all de ella. Con la plataforma Documentum, las empresas pueden asegurarse de que el contenido no estructurado se almacene, proteja, proporcione y archive de manera sistemtica, segn las reglas del negocio predefinidas y en funcin de polticas y procedimientos establecidos. La plataforma Documentum permite a las empresas desarrollar slidas aplicaciones de contenido que solucionan problemas de misin crtica del negocio. Por ejemplo, los comerciantes y asociados de negocios externos pueden obtener acceso con facilidad a informacin actualizada sobre productos, mientras los ingenieros y cientficos siguen los procesos de negocios al documentar nuevas tecnologas. Las empresas pueden hacer archiving del contenido y conservarlo para cumplir con los requerimientos de cumplimiento de normas, a la vez que permiten a diversos departamentos y asociados de negocios externos trabajar juntos con facilidad y compartir cualquier tipo de contenido en la red. Por ltimo, la plataforma Documentum ofrece componentes en el nivel de las aplicaciones para desarrollar aplicaciones de escala empresarial que utilizan el contenido en el contexto de los procesos de negocios y brinda una amplia variedad de experiencias de aplicaciones para las aplicaciones basadas en navegador y en escritorio. Estas capacidades constituyen la base para las soluciones del futuro: contenido administrado que diferentes aplicaciones pueden consumir y al que pueden acceder, segn sea necesario, por medio de servicios Web flexibles basados en entornos SOA.

Arquitectura de Documentum de EMC Una Revisin Detallada

38

También podría gustarte