document-understanding
2024.10
true
UiPath logo, featuring letters U and I in white

Guía del usuario de proyectos modernos de Document Understanding

Automation CloudAutomation Cloud Public SectorAutomation SuiteStandalone
Última actualización 20 de nov. de 2024

Tipos de documento

Un tipo de documento es la definición de un tipo lógico de documento que los distintos procesos empresariales deben tratar.

¿Qué es un tipo de documento y qué puede contener?

Los tipos de documentos incluyen facturas, registros médicos, formularios W-2 del IRS, contratos y otros. Un tipo de documento, además de un nombre, grupo y categoría, generalmente contiene una colección de campos.

Por ejemplo, las facturas generalmente contienen la siguiente información:
  • Nombre del proveedor, dirección del proveedor, nombre de facturación, dirección de facturación
  • Número de factura, número de orden de compra, condiciones de pago, fecha de vencimiento
  • Importe neto, importe de impuestos, descuento, importe total
  • Número de IVA, tipo de IVA
  • Número de cuenta bancaria, nombre del
Figura 1. Ejemplo de factura

Formatos de tipo de documento

Los tipos de documentos pueden clasificarse en función de su formato. Algunos tipos de documentos tienen un contenido muy estructurado, mientras que otros consisten principalmente en texto libre.

Los documentos se clasifican en tres formatos principales:
  • Structured
  • Semiestructurado
  • No estructurado
Nota: los documentos a menudo pueden ser una combinación de estas tres categorías. Un archivo puede tener una cabecera estructurada, seguida de un contenido no estructurado, de forma libre. También pueden contener contenido no estructurado con información específica que siempre aparece en un contexto estructurado o repetitivo.

Documentos estructurados

Los documentos estructurados incluyen:
  • Encuestas
  • Cuestionarios
  • Formularios de impuestos
  • Pasaportes
  • Licencias
  • Hojas de tiempo

Estos documentos están diseñados para recopilar información en un formato específico. Suelen contener pares clave-valor, tablas, texto escrito a mano, firmas y casillas de verificación. Estos documentos guían al usuario indicándole las zonas precisas para introducir cada dato. Estos documentos se denominan comúnmente formularios y se utilizan para recopilar datos de baja diversidad.

Ilustración 2. Carné de conducir, un ejemplo de un documento estructurado docs image

Documentos semiestructurados

Los documentos semiestructurados son documentos que no siguen un formato estricto como los formularios estructurados y no están vinculados a los campos de datos especificados. Estos no tienen un formulario fijo, sino que siguen un formato bastante común. Contienen partes fijas y variables como las tablas. También pueden contener párrafos, pero los datos se encuentran principalmente en los pares clave-valor. Los documentos semiestructurados incluyen:
  • Facturas
  • Recibos
  • Órdenes de compra
  • Informes de laboratorio de Healthcare
  • Extractos bancarios
  • Facturas de servicios públicos
Ilustración 3. Factura, un ejemplo de un documento semiestructurado docs image

Documentos no estructurados

Los documentos no estructurados son archivos que no siguen un modelo específico u organizado. No tienen un formato fijo y la información que contienen a menudo se presenta de forma no estructurada, lo que dificulta el procesamiento de los robots. Mientras que los humanos pueden entender fácilmente estos documentos, los datos pueden ser difíciles de interpretar para las máquinas. Los documentos no estructurados pueden adoptar muchas formas, incluidas:
  • Contratos
  • Contratos de alquiler
  • Informes anuales
  • Acuerdos
  • Nuevos artículos
Ilustración 4. Acuerdo de licencia, un ejemplo de un documento no estructurado docs image

¿Te ha resultado útil esta página?

Obtén la ayuda que necesitas
RPA para el aprendizaje - Cursos de automatización
Foro de la comunidad UiPath
Uipath Logo White
Confianza y seguridad
© 2005-2024 UiPath. Todos los derechos reservados.