- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- Puntos finales públicos
- 1040: tipo de documento
- 1040 Anexo C: tipo de documento
- 1040 Anexo D: tipo de documento
- 1040 Anexo E: tipo de documento
- 1040x: tipo de documento
- 3949a: tipo de documento
- 4506T: tipo de documento
- 709: tipo de documento
- 941x: tipo de documento
- 9465: tipo de documento
- ACORD125: tipo de documento
- ACORD126: tipo de documento
- ACORD131: tipo de documento
- ACORD140: tipo de documento
- ACORD25: tipo de documento
- Estados de cuenta bancarios: tipo de documento
- Facturas de carga: tipo de documento
- Certificado de incorporación: tipo de documento
- Certificado de origen: tipo de documento
- Comprobaciones: tipo de documento
- Certificado de producto secundario: tipo de documento
- CMS 1500: tipo de documento
- Declaración de conformidad de la UE: tipo de documento
- Estados financieros: tipo de documento
- FM1003: tipo de documento
- I9: tipo de documento
- Tarjetas de identificación: tipo de documento
- Facturas: tipo de documento
- Facturas2: tipo de documento
- Facturas Australia: tipo de documento
- Facturas China: tipo de documento
- Facturas Hebreo: tipo de documento
- Facturas India: tipo de documento
- Facturas Japón: tipo de documento
- Remisión de facturas: tipo de documento
- Listas de embalaje: tipo de documento
- Nóminas: tipo de documento
- Pasaportes: tipo de documento
- Órdenes de compra: tipo de documento
- Recibos: tipo de documento
- Recibos2: tipo de documento
- Recibos Japón: tipo de documento
- Notificaciones de remesas: tipo de documento
- UB04: tipo de documento
- Divulgación de cierre de hipotecas en EE. UU.: tipo de documento
- Facturas de servicios públicos: tipo de documento
- Títulos de vehículos: tipo de documento
- W2: tipo de documento
- W9: tipo de documento
- Idiomas admitidos
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Registro
- Lógica de licencias y tarificación
- Tutorial
- Solución de problemas
Guía del usuario de proyectos modernos de Document Understanding
Un tipo de documento es la definición de un tipo lógico de documento que los distintos procesos empresariales deben tratar.
¿Qué es un tipo de documento y qué puede contener?
Los tipos de documentos incluyen facturas, registros médicos, formularios W-2 del IRS, contratos y otros. Un tipo de documento, además de un nombre, grupo y categoría, generalmente contiene una colección de campos.
Por ejemplo, las facturas generalmente contienen la siguiente información:
- Nombre del proveedor, dirección del proveedor, nombre de facturación, dirección de facturación
- Número de factura, número de orden de compra, condiciones de pago, fecha de vencimiento
- Importe neto, importe de impuestos, descuento, importe total
- Número de IVA, tipo de IVA
- Número de cuenta bancaria, nombre del
Figura 1. Ejemplo de factura

Formatos de tipo de documento
Los tipos de documentos pueden clasificarse en función de su formato. Algunos tipos de documentos tienen un contenido muy estructurado, mientras que otros consisten principalmente en texto libre.
Los documentos se clasifican en tres formatos principales:
- Structured
- Semiestructurado
- No estructurado
Los documentos a menudo pueden ser una combinación de estas tres categorías. Un archivo puede tener un encabezado estructurado, seguido de un contenido no estructurado de forma libre. También pueden contener contenido no estructurado con información específica que siempre aparece en un contexto muy estructurado o repetitivo.
Documentos estructurados
Los documentos estructurados incluyen:
- Encuestas
- Cuestionarios
- Formularios de impuestos
- Pasaportes
- Licencias
- Hojas de tiempo
Estos documentos están diseñados para recopilar información en un formato específico. Suelen contener pares clave-valor, tablas, texto escrito a mano, firmas y casillas de verificación. Estos documentos guían al usuario indicándole las zonas precisas para introducir cada dato. Estos documentos se denominan comúnmente formularios y se utilizan para recopilar datos de baja diversidad.
Ilustración 2. Carné de conducir, un ejemplo de un documento estructurado

Documentos semiestructurados
Los documentos semiestructurados son documentos que no siguen un formato estricto como los formularios estructurados y no están vinculados a los campos de datos especificados. Estos no tienen un formulario fijo, sino que siguen un formato bastante común. Contienen partes fijas y variables como las tablas. También pueden contener párrafos, pero los datos se encuentran principalmente en los pares clave-valor. Los documentos semiestructurados incluyen:
- Facturas
- Recibos
- Órdenes de compra
- Informes de laboratorio de Healthcare
- Extractos bancarios
- Facturas de servicios públicos
Ilustración 3. Factura, un ejemplo de un documento semiestructurado

Documentos no estructurados
Los documentos no estructurados son archivos que no siguen un modelo específico u organizado. No tienen un formato fijo y la información que contienen a menudo se presenta de forma no estructurada, lo que dificulta el procesamiento de los robots. Mientras que los humanos pueden entender fácilmente estos documentos, los datos pueden ser difíciles de interpretar para las máquinas. Los documentos no estructurados pueden adoptar muchas formas, incluidas:
- Contratos
- Contratos de alquiler
- Informes anuales
- Acuerdos
- Nuevos artículos
Ilustración 4. Acuerdo de licencia, un ejemplo de un documento no estructurado
