- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- FieldValueDetails Class
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Clase BasicDataPoint: vista previa
- Clase ExtractionResultHandler: vista previa
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Configurar la conexión externa
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Using the Classification Station
- Crear acción de clasificación de documentos
- Crear artefactos de validación de documentos
- Recuperar artefactos de validación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Entrenador del extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Redactar documento
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Extractor con aprendizaje automático
- Entrenador de extractor con aprendizaje automático
- Clasificador de aprendizaje automático
- Entrenador del clasificador de aprendizaje automático
- Clasificador generativo
- Extractor generativo
- Configurar autenticación
- Validar documentos con acciones de la aplicación
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Actividades generativas: buenas prácticas
- Extractor generativo: buenas prácticas
- Clasificador generativo: buenas prácticas
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
La Estación de clasificación te permite realizar, revisar y corregir la información de clasificación de documentos. Una vez abierto, presenta cualquier información de clasificación junto con el archivo que se está procesando. La estación de clasificación actúa como una herramienta de validación humana que te permite asignar tipos de documentos a cualquier archivo que quieras procesar, para cualquier subconjunto de páginas dentro de los archivos.
Figura 1. Una descripción general de la estación de clasificación, donde se clasifica un documento de muestra
Sección de vista de documentos
El área derecha de la Estación de clasificación contiene una versión interactiva del documento original, en la que se pueden seleccionar secciones de texto o documento y se pueden hacer clic en las palabras en función de la salida del proceso de digitalización. Esta área también contiene opciones para ampliar y reducir, seleccionar y rotar páginas, buscar en el documento o cambiar a la vista de texto.
Figura 2. Descripción general del área interactiva de la estación de clasificación, donde puedes seleccionar partes del documento
La siguiente tabla muestra las opciones disponibles en el área derecha de la pantalla de la estación de clasificación y sus descripciones. El área que te permite interactuar con el documento y seleccionar varias partes del mismo.
| Opción | Descripción |
|---|---|
| Muestra todos los accesos directos de teclado disponibles compatibles con la estación de clasificación, que puede incluir lo siguiente:
|
| Alterna entre la vista de texto y la vista de imagen del documento:
|
|
Nota: activo solo cuando la opción Vista de solo texto está activa | Establece el modo de selección mientras está en la vista de texto, que incluye las siguientes opciones:
|
| Establece el modo de selección mientras está en la vista de imagen, que incluye las siguientes opciones:
|
|
| Gira la página actual en sentido horario. |
|
| Inicia una búsqueda entre los resultados del documento utilizada por la Estación de clasificación. |
|
| Restablece el nivel de zoom del documento. Esta opción solo se activa si el documento se había ampliado o reducido previamente. |
| Amplía el documento. |
| Amplía la vista del documento. Nota: Para ampliar o reducir la vista, también puedes utilizar la combinación CTRL+rueda de desplazamiento del ratón: CTRL+desplazamiento hacia arriba para ver una sección específica del documento; CTRL+desplazamiento hacia abajo para ver una sección más grande del documento. |
Sección de clasificación de documentos
Los campos de clasificación están influidos por la Taxonomía y brindan tres situaciones posibles:
- Si se indica la clasificación de una parte determinada del documento y esta es correcta, no es necesario realizar ninguna acción en este campo.
- Si se proporciona la información de clasificación para parte del documento pero es errónea, puedes corregir los tipos de documentos asociados a ese rango de páginas.
- If there is no classification information provided for a given part of the document, you can either leave it as Not Classified or select the right document type for it.
- Si el rango de páginas proporcionado para una parte determinada del documento (clasificada o no, correctamente o no) no es exacto en cuanto a páginas (faltan o sobran páginas), puedes corregirlo moviendo páginas a las partes superior o inferior.
En el lado izquierdo de la pantalla puedes ver todos los tipos de documentos dentro del archivo. Puedes seleccionar el tipo de documento deseado (que se ha definido previamente en Taxonomía) para cualquier rango de páginas del documento, desde la lista desplegable de tipos de documentos. Mantén el puntero sobre la página, selecciona Opciones y luego selecciona el tipo de documento de la lista desplegable.
Figura 3. Seleccionar el tipo de documento de la lista desplegable
Seleccionar opciones
para el tipo de documento para ver el menú desplegable con las siguientes opciones disponibles:
-
Add reference - A reference can be added as support to the document type selection performed by the user.
Nota:Una referencia es un token o colección de tokens en un documento que se puede utilizar como palabras clave para identificar la clase del documento. Las referencias seleccionadas por el usuario se añaden al archivo de aprendizaje de palabras clave a través de Entrenar el alcance del clasificador.
Figura 4. La acción de añadir una referencia y resaltar la referencia
-
Remove reference - Removes a reference that was previously added for the given document type section.
Figura 5. La acción de eliminar una referencia
-
Cambiar referencia : cambia la referencia a una nueva, en caso de que ya exista una referencia. Selecciona Cambiar referencia y luego selecciona otra parte del documento.
Figura 6. La acción de cambiar una referencia
-
Move all pages up - Moves the entire section of pages up, to the previously defined document type, Option is active on all sections except for the first one. Using this option will delete the section you are acting upon, unifying the page range with the previous one.
Figura 7. La acción de mover todas las páginas hacia arriba
-
Move all pages down - Moves the entire section of pages down, to the next document type defined. Option is active on all sections except for the last one. Using this option will delete the section you are acting upon, unifying the page range with the next one.
Figura 8. La acción de mover todas las páginas hacia abajo
Otras opciones de clasificación
-
Split document - Marks the beginning of a new document type, from where the selection is done, and moves it under a new document type section.
Figura 9. La acción de dividir un documento
-
Arrastrar y soltar : si la propiedad EnablePageReorder está deshabilitada, esto permite la reordenación de las páginas entre secciones. Las páginas se pueden reorganizar con la opción Arrastrar y soltar solo si se mantiene el orden dentro de un documento (los números de página deben ser consecutivos). Arrastra y suelta páginas en el documento para reorganizarlas.
Figura 10. La acción de reorganizar las páginas de un documento
-
Reordenar páginas : arrastra y suelta páginas dentro del mismo documento para reordenarlas. Esta opción solo está disponible si la propiedad EnablePageReorder se establece en True en la actividad Mostrar estación de clasificación .
Figura 11. Reordenar las páginas dentro del mismo documento durante la clasificación
-
Eliminar referencia : elimina una referencia de una página específica. Selecciona Más opciones en la página del documento y luego Eliminar referencia.
Figura 12. La acción de eliminar una referencia
-
Resaltar referencia : resalta la referencia de una página específica. Selecciona Más opciones en la página del documento y luego Resaltar referencia.
Figura 13. La acción de resaltar una referencia
Atajos del teclado
Existen muchos atajos de teclado que pueden utilizarse para optimizar la interacción de las personas con la Estación de clasificación. Te animamos a utilizarlos tanto como sea posible. Estos pueden revisarse en la ventana emergente Atajos de teclado.
Para empezar a utilizar los accesos directos de teclado, ve a Más opciones, selecciona Atajos de teclado y luego selecciona Alternar accesos directos de teclado.
La siguiente lista muestra los accesos directos de teclado disponibles y sus descripciones correspondientes:
- Clasificación
- n: se mueve al siguiente campo;
- p: se desplaza al campo anterior;
- s: se divide después de la página seleccionada;
- h: resalta la referencia del grupo;
- a: añade/cambia una referencia;
- DEL: elimina una referencia;
- m + tecla de flecha hacia arriba↑: Mueve todas las páginas anteriores;
- m + tecla de flecha hacia abajo ↓: Mueve todas las páginas siguientes;
- teclas de flecha izquierda, derecha ←→ + teclas de flecha abajo, arriba↑↓: navegar por las páginas
- Document:
- d +: Acercar;
- d -: se aleja;
- d 0: restablece el zoom;
- dr: gira la página en el sentido de las agujas del reloj;
- dt: alterna el modo de texto;
- ds: cambia el modo de selección;
- da: borra la selección de anclaje dibujada;
- /: inicia una búsqueda.
- Accesibilidad:
- teclas de flecha izquierda, derecha ←→ + teclas de flecha hacia abajo, hacia arriba↑↓: navegar por las palabras y crear o más áreas de selección;
- Mayúsculas y teclas de flecha hacia abajo, hacia arriba, izquierda, derecha: cambiar el tamaño de la selección del área;
- Intro: Confirmar selección de área;
- PageDown Page Up: Página siguiente o anterior;
- ESC: Deseleccionar todo;
- Alt p: alterna el enfoque del visor de PDF.
- General:
- ?: Esta pantalla;
- !: Informar del documento como excepción;
- CTRL ENTER: Guardar clasificación;
- CTRL DEL: descartar todos los cambios actuales.
Interactuar con el documento en la estación de clasificación
Si tu caso de uso requiere resaltar los tipos de documentos seleccionados para cada grupo de páginas para el que estás revisando la clasificación, puedes utilizar las opciones disponibles.
Para seleccionar una parte del documento utilizando la opción de área personalizada dentro de la vista de imagen:
- Asegúrate de que se seleccione Vista de imagen.
- Selecciona Tokens y luego selecciona Área personalizada.
- Selecciona el área deseada en tu documento.
- Ve a las opciones más del documento en el lado izquierdo y elige si deseas Cambiar la referencia o Eliminar referencia.
Figura 14. Imagen animada que muestra cómo utilizar la selección personalizada en la vista de imagen
De forma similar a cómo seleccionas una parte del documento utilizando la opción de área personalizada dentro de la vista de imagen, haces lo mismo dentro de la vista de texto. La única diferencia es que te aseguras de que se seleccione Vista de texto.
Figura 15. Imagen animada que muestra cómo utilizar la selección personalizada en la vista de texto
Confirmación y validación de datos
Tienes las siguientes tres opciones disponibles en la parte inferior de la estación de clasificación para confirmar o descartar los cambios:
- Descartar cambios: descarta todos los cambios realizados por el usuario y vuelve al estado inicial de la tarea de validación.
- Guardar: guarda los datos confirmados y corregidos.
- Excepción
: informa del documento como una excepción.
Integración de Document Understanding
La actividad Mostrar estación de clasificación forma parte de Document Understanding Solutions. Consulta la Guía de Document Understanding para obtener más información.
: accesos directos de teclado;
: cambia el lado del panel de izquierda a derecha.
: vista de solo texto. 
: tokens.
: área personalizada;
: elige después de la selección. 

