- Información general
- Crear modelos
- Consumir modelos
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 9465: paquete ML
- ACORD125: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Datos y seguridad
- Lógica de licencias y tarificación
- Tutorial
Guía del usuario de Document Understanding
Anotar documentos
Después de crear tu proyecto y cargar tus documentos en un tipo de documento específico, se preanotan automáticamente. Esto se hace utilizando modelos especializados, basados en el esquema del tipo de documento. El esquema define claramente los campos que quieres extraer de un tipo de documento en particular. Para encontrar el esquema del tipo de documento, ve a la página Anotación y consulta la sección Campos.
Las anotaciones previas se indican con subrayados en el texto dentro del documento y no se pueden eliminar. Si son incorrectas y no se pueden hacer coincidir con un campo en particular, puedes ignorarlas. Durante el proceso de entrenamiento, solo se utilizan para el entrenamiento los campos confirmados, mientras que los subrayados no se tienen en cuenta.
A medida que vayas añadiendo más anotaciones, los subrayados preanotados deben alinearse progresivamente con tu entrada. Puede haber algunas inconsistencias entre subrayados y campos anotados por el usuario al principio. Sin embargo, a medida que realizas más anotaciones y mejora el modelo, los subrayados deben alinearse con mayor precisión con los datos proporcionados por el usuario.
En la siguiente imagen, la Dirección de envío ha sido preanotada incorrectamente para incluir el nombre de la persona.
Para solucionar esto, solo debes confirmar la dirección de envío. No es necesario eliminar el texto subrayado relacionado con el nombre. A medida que continúes con tu anotación y corrijas dichos errores, las ocasiones en que el texto subrayado no se alinea con el campo confirmado deben disminuir.
- Los tipos de documentos personalizados no se anotan automáticamente. Debes preanotar manualmente los documentos que son de tipo de documento personalizado.
- Para desencadenar el entrenamiento del modelo, se necesita un mínimo de 40 operaciones. Por ejemplo, si tienes 20 documentos, deberás anotar al menos 2 campos por documento, lo que daría como resultado un total de 40 operaciones.
Después de cargar y preanotar todos los documentos, tu objetivo es validar o modificar los campos preanotados. Para obtener un documento en el que todos los campos estén preanotados con precisión, selecciona Confirmar para aprobar todos los campos a la vez. Un documento, una vez confirmado, aparecerá con un símbolo de escudo verde en la lista de documentos.
Si un documento se confirma solo parcialmente, se marcará con un símbolo de escudo vacío en la lista de documentos. Esto simboliza que el proceso de anotación para este documento en particular es En progreso. Tu objetivo final debe ser asegurarte de que todos los documentos están Confirmados.
- La anotación previa es correcta y debe validarse.
- La anotación previa no es correcta y el campo está presente en el documento.
- La anotación previa no es correcta y falta el campo en el documento.
- No hay anotación previa.
Si la anotación previa es incorrecta, elige el texto y el campo correctos y selecciona Confirmar.
Puedes cambiar la configuración del tipo de documento desde la vista Anotar.
Para ello, haz clic en el icono de tres puntos ⁝ a la derecha del nombre del tipo de documento y selecciona Configuración.
- Modelo base: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del modelo base utilizado para el entrenamiento. Usar el modelo base más similar a su tipo de documento reducirá la cantidad de trabajo de anotación requerido.
- Número de idiomas: la estimación del tamaño del conjunto de datos utilizada en las acciones recomendadas depende de la cantidad de idiomas en el conjunto de datos. Más idiomas generalmente requieren anotar más datos.