- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Detalles del modelo
- Puntos finales públicos
- 1040: tipo de documento
- 1040 Anexo C: tipo de documento
- 1040 Anexo D: tipo de documento
- 1040 Anexo E: tipo de documento
- 1040x: tipo de documento
- 3949a: tipo de documento
- 4506T: tipo de documento
- 709: tipo de documento
- 941x: tipo de documento
- 9465: tipo de documento
- ACORD125: tipo de documento
- ACORD126: tipo de documento
- ACORD131: tipo de documento
- ACORD140: tipo de documento
- ACORD25: tipo de documento
- Estados de cuenta bancarios: tipo de documento
- Facturas de carga: tipo de documento
- Certificado de incorporación: tipo de documento
- Certificado de origen: tipo de documento
- Comprobaciones: tipo de documento
- Certificado de producto secundario: tipo de documento
- CMS 1500: tipo de documento
- Declaración de conformidad de la UE: tipo de documento
- Estados financieros: tipo de documento
- FM1003: tipo de documento
- I9: tipo de documento
- Tarjetas de identificación: tipo de documento
- Facturas: tipo de documento
- Facturas2: tipo de documento
- Facturas Australia: tipo de documento
- Facturas China: tipo de documento
- Facturas Hebreo: tipo de documento
- Facturas India: tipo de documento
- Facturas Japón: tipo de documento
- Remisión de facturas: tipo de documento
- Listas de embalaje: tipo de documento
- Nóminas: tipo de documento
- Pasaportes: tipo de documento
- Órdenes de compra: tipo de documento
- Recibos: tipo de documento
- Recibos2: tipo de documento
- Recibos Japón: tipo de documento
- Notificaciones de remesas: tipo de documento
- UB04: tipo de documento
- Divulgación de cierre de hipotecas en EE. UU.: tipo de documento
- Facturas de servicios públicos: tipo de documento
- Títulos de vehículos: tipo de documento
- W2: tipo de documento
- W9: tipo de documento
- Idiomas admitidos
- Paneles de insights
- Document Understanding implementado en Automation Suite
- Registro
- Lógica de licencias y tarificación
- Tutorial
- Solución de problemas

Document Understanding modern projects user guide
Tipos de documento
Un tipo de documento es la definición de un tipo lógico de documento que los distintos procesos empresariales deben tratar.
¿Qué es un tipo de documento y qué puede contener?
Los tipos de documentos incluyen facturas, registros médicos, formularios W-2 del IRS, contratos y otros. Un tipo de documento, además de un nombre, grupo y categoría, generalmente contiene una colección de campos.
Por ejemplo, las facturas generalmente contienen la siguiente información:
- Nombre del proveedor, dirección del proveedor, nombre de facturación, dirección de facturación
- Número de factura, número de orden de compra, condiciones de pago, fecha de vencimiento
- Importe neto, importe de impuestos, descuento, importe total
- Número de IVA, tipo de IVA
- Número de cuenta bancaria, nombre del
Figure 1. Invoice example

Formatos de tipo de documento
Los tipos de documentos pueden clasificarse en función de su formato. Algunos tipos de documentos tienen un contenido muy estructurado, mientras que otros consisten principalmente en texto libre.
Los documentos se clasifican en tres formatos principales:
- Structured
- Semiestructurado
- No estructurado
Documents can often be a combination of these three categories. A file can have a structured heading, followed by an unstructured, free-form content. They can also contain unstructured content with specific information that always appears in a very structured or repeating context.
Documentos estructurados
Los documentos estructurados incluyen:
- Encuestas
- Cuestionarios
- Formularios de impuestos
- Pasaportes
- Licencias
- Hojas de tiempo
Estos documentos están diseñados para recopilar información en un formato específico. Suelen contener pares clave-valor, tablas, texto escrito a mano, firmas y casillas de verificación. Estos documentos guían al usuario indicándole las zonas precisas para introducir cada dato. Estos documentos se denominan comúnmente formularios y se utilizan para recopilar datos de baja diversidad.
Figure 2. Driver license, an example of a structured document

Documentos semiestructurados
Los documentos semiestructurados son documentos que no siguen un formato estricto como los formularios estructurados y no están vinculados a los campos de datos especificados. Estos no tienen un formulario fijo, sino que siguen un formato bastante común. Contienen partes fijas y variables como las tablas. También pueden contener párrafos, pero los datos se encuentran principalmente en los pares clave-valor. Los documentos semiestructurados incluyen:
- Facturas
- Recibos
- Órdenes de compra
- Informes de laboratorio de Healthcare
- Extractos bancarios
- Facturas de servicios públicos
Figure 3. Invoice, an example of a semi-structured document

Documentos no estructurados
Los documentos no estructurados son archivos que no siguen un modelo específico u organizado. No tienen un formato fijo y la información que contienen a menudo se presenta de forma no estructurada, lo que dificulta el procesamiento de los robots. Mientras que los humanos pueden entender fácilmente estos documentos, los datos pueden ser difíciles de interpretar para las máquinas. Los documentos no estructurados pueden adoptar muchas formas, incluidas:
- Contratos
- Contratos de alquiler
- Informes anuales
- Acuerdos
- Nuevos artículos
Figure 4. License agreement, an example of an unstructured document
