- Información general
- Primeros pasos
- Crear modelos
- Consumir modelos
- Paquetes ML
- 1040: paquete ML
- 1040 Anexo C - Paquete ML
- 1040 Anexo D - Paquete ML
- 1040 Anexo E - Paquete ML
- 1040x: paquete ML
- 3949a: paquete ML
- 4506T: paquete ML
- 709: paquete ML
- 941x: paquete ML
- 9465: paquete ML
- ACORD126 - Paquete ML
- ACORD131 - Paquete ML
- ACORD140 - Paquete ML
- ACORD25 - Paquete ML
- Extractos bancarios: paquete ML
- Conocimientos de embarque: paquete ML
- Certificado de incorporación: paquete ML
- Certificado de origen: paquete ML
- Cheques: paquete ML
- Certificado de producto secundario: paquete ML
- CMS1500 - Paquete ML
- Declaración de conformidad de la UE: Paquete ML
- Estados financieros: paquete ML
- FM1003: paquete ML
- I9 - Paquete ML
- Documentos de identidad: paquete ML
- Facturas: paquete ML
- FacturasAustralia: paquete ML
- FacturasChina - Paquete ML
- Facturas en hebreo: paquete ML
- FacturasIndia - Paquete ML
- FacturasJapón - Paquete ML
- Envío de facturas: paquete ML
- Listas de embalaje: paquete ML
- Nóminas - - Paquete ML
- Pasaportes: paquete ML
- Órdenes de compra: paquete ML
- Recibos: paquete ML
- ConsejosDeRemesas: paquete ML
- UB04 - Paquete ML
- Facturas de servicios públicos: paquete ML
- Títulos de vehículos: paquete ML
- W2 - Paquete ML
- W9 - Paquete ML
- Puntos finales públicos
- Idiomas admitidos
- Paneles de insights
- Datos y seguridad
- Licencia
- Tutorial
Anotar documentos
After successfully creating your project and uploading your documents to a specific document type, they are automatically pre-annotated. This is done using a combination of generative and specialized models, based on the document type's schema. The schema clearly defines the fields you want to extract from a particular document type. To find the document type's schema, go to the Annotation page and check the Fields section.
Las anotaciones previas se indican con subrayados en el texto dentro del documento y no se pueden eliminar. Si son incorrectas y no se pueden hacer coincidir con un campo en particular, puedes ignorarlas. Durante el proceso de entrenamiento, solo se utilizan para el entrenamiento los campos confirmados, mientras que los subrayados no se tienen en cuenta.
As you continue to add more annotations, the pre-annotated underlines should progressively align with your input. There may be a few inconsistencies between underlines and user-annotated fields at the beginning. However, as you make more annotations and the model improves, the underlines should line up more precisely with the user-supplied data.
En la siguiente imagen, la Dirección de envío ha sido preanotada incorrectamente para incluir el nombre de la persona.
Para solucionar esto, solo debes confirmar la dirección de envío. No es necesario eliminar el texto subrayado relacionado con el nombre. A medida que continúes con tu anotación y corrijas dichos errores, las ocasiones en que el texto subrayado no se alinea con el campo confirmado deben disminuir.
- Los tipos de documentos personalizados no se anotan automáticamente. Debes preanotar manualmente los documentos que son de tipo de documento personalizado.
- Para desencadenar el entrenamiento del modelo, se necesita un mínimo de 40 operaciones. Por ejemplo, si tienes 20 documentos, deberás anotar al menos 2 campos por documento, lo que daría como resultado un total de 40 operaciones.
Después de cargar y preanotar todos los documentos, tu objetivo es validar o modificar los campos preanotados. Para obtener un documento en el que todos los campos estén preanotados con precisión, selecciona Confirmar para aprobar todos los campos a la vez. Un documento, una vez confirmado, aparecerá con un símbolo de escudo verde en la lista de documentos.
Si un documento se confirma solo parcialmente, se marcará con un símbolo de escudo vacío en la lista de documentos. Esto simboliza que el proceso de anotación para este documento en particular es En progreso. Tu objetivo final debe ser asegurarte de que todos los documentos están Confirmados.
- La anotación previa es correcta y debe validarse.
- La anotación previa no es correcta y el campo está presente en el documento.
- La anotación previa no es correcta y falta el campo en el documento.
- No hay anotación previa.
Si la anotación previa es incorrecta, elige el texto y el campo correctos y selecciona Confirmar.
Puedes cambiar la configuración del tipo de documento desde la vista Anotar.
Para ello, haz clic en el icono de tres puntos ⁝ a la derecha del nombre del tipo de documento y selecciona Configuración.
- Modelo base: las estimaciones del tamaño del conjunto de datos utilizadas en las acciones recomendadas dependen del modelo base utilizado para el entrenamiento. Usar el modelo base más similar a su tipo de documento reducirá la cantidad de trabajo de anotación requerido.
- Número de idiomas: la estimación del tamaño del conjunto de datos utilizada en las acciones recomendadas depende de la cantidad de idiomas en el conjunto de datos. Más idiomas generalmente requieren anotar más datos.