- Información general
 - Contratos de procesamiento de documentos
- Notas relacionadas
 - Acerca de los contratos de procesamiento de documento
 - Clase Cuadro
 - Interfaz IPersistedActivity
 - Clase PrettyBoxConverter
 - Interfaz IClassifierActivity
 - Interfaz IClasificadorProveedorDeCapacidades
 - Clase ClassifierDocumentType
 - Clase ClassifierResult
 - ClassifierCodeActivity Class
 - ClassifierNativeActivity Class
 - ClassifierAsyncCodeActivity Class
 - Clase ClasificadorCapacidadDeTipoDeDocumento
 - ContentValidationData Class
 - EvaluatedBusinessRulesForFieldValue Class
 - EvaluatedBusinessRuleDetails Class
 - Clase
 - Clase
 - Clase ExtractorDocumentType
 - Clase ExtractorDocumentTypeCapabilities
 - Clase ExtractorFieldCapability
 - Clase
 - Clase ExtractorResult
 - FieldValue Class
 - FieldValueResult Class
 - Interfaz ICapabilitiesProvider
 - Interfaz IExtractorActivity
 - Clase ExtractorPayload
 - Enumeración DocumentActionPriority
 - Clase DocumentActionData
 - Enumeración DocumentActionStatus
 - DocumentActionType Enum
 - Clase DocumentClassificationActionData
 - Clase DocumentValidationActionData
 - Clase UserData
 - Clase Documento
 - Clase DocumentoDividirResultado
 - Clase DomExtensions
 - Clase Página
 - Clase SecciónDePágina
 - Clase de polígono
 - Clase PolygonConverter
 - Clase de metadatos
 - Clase GrupoDeWord
 - Clase Word
 - Enum FuenteDeProcesamiento
 - Clase ResultadosTablaCelda
 - Clase ResultadosTablaValor
 - Clase ResultadosTablaColumnaInfo
 - Clase TablaDeResultados
 - Enum Rotación
 - Rule Class
 - RuleResult Class
 - RuleSet Class
 - RuleSetResult Class
 - Enum TipoDeSección
 - Enum TipoDeGrupoDeWord
 - Interfaz IDocumentTextProjection
 - Clase ResultadoDeClasificación
 - Clase ResultadoDeExtracción
 - Clase ResultadosDeDocumento
 - Clase ResultadosDeLímitesDeDocumento
 - Clase ResultadosDePuntoDeDatos
 - Clase ResultadosDeValor
 - Clase ResultadosDeContenidoDeReferencia
 - Clase ResultadosDeValorDeTokens
 - Clase ResultadosDeCampoDerivado
 - Enum ResultadosDeFuenteDeDatos
 - Clase ResultadoDeConstantes
 - Clase ValorDeCampoSimple
 - Clase ValorDeCampoDeTabla
 - Clase GrupoDeDocumento
 - Clase TaxonomíaDeDocumento
 - Clase TipoDeDocumento
 - Clase Campo
 - Enum TipoDeCampo
 - FieldValueDetails Class
 - Clase InformaciónDeLenguaje
 - Clase MetadataEntry
 - Enumeración de tipo de texto
 - Clase TipoDeCampo
 - Interfaz de actividad de ITracking
 - Interfaz de ITrainableActivity
 - Interfaz ITrainableClassifierActivity
 - Interfaz ITrainableExtractorActivity
 - Clase TrainableClassifierAsyncCodeActivity
 - Clase TrainableClassifierCodeActivity
 - Clase TrainableClassifierNativeActivity
 - Clase TrainableExtractorAsyncCodeActivity
 - Clase TrainableExtractorCodeActivity
 - Clase TrainableExtractorNativeActivity
 
 - Document Understanding ML
 - Servidor local de OCR de Document Understanding
 - Document Understanding
- Notas relacionadas
 - Acerca del paquete de actividades Document Understanding
 - Compatibilidad de proyectos
 - Configurar la conexión externa
 - Establecer contraseña de PDF
 - Fusionar PDF
 - Obtener el recuento de páginas del PDF
 - Extraer texto en PDF
 - Extraer imágenes en PDF
 - Extraer rango de página en PDF
 - Extraer datos del documento
 - Cree una tarea de validación y espere
 - Esperar la tarea de validación y continuar
 - Crear tarea de validación
 - Clasificar documento
 - Crear tarea de validación de clasificación
 - Crear tarea de validación de clasificación y esperar
 - Esperar la tarea de validación de clasificación y reanudar
 
 - OCRInteligente
- Notas relacionadas
 - Acerca del paquete de actividades IntelligentOCR
 - Compatibilidad de proyectos
 - Configurar autenticación
 - Cargar taxonomía
 - Digitalizar documento
 - Clasificar ámbito de documento
 - Clasificador basado en palabras clave
 - Clasificador de proyectos de Document Understanding
 - Clasificador inteligente de palabra clave
 - Crear acción de clasificación de documentos
 - Crear artefactos de validación de documentos
 - Recuperar artefactos de validación de documentos
 - Esperar la acción de clasificación de documentos y reanudar
 - Entrenar el alcance de los clasificadores
 - Entrenador del clasificador basado en palabras clave
 - Entrenador del clasificador inteligente de palabra clave
 - Alcance de la extracción de información
 - Extractor de proyectos de Document Understanding
 - Entrenador del extractor de proyectos de Document Understanding
 - Extractor basado en regex
 - Extractor de forma
 - Extractor inteligente de formularios
 - Redactar documento
 - Crear acción de validación de documentos
 - Esperar la acción de validación de documentos y reanudar
 - Entrenar el alcance de los Extractores
 - Exportar resultados de extracción
 
 - Servicios ML
 - OCR
 - Contratos OCR
- Notas relacionadas
 - Acerca de los contratos OCR
 - Compatibilidad de proyectos
 - IOCRActivity Interface
 - OCRAsyncCodeActivity Class
 - OCRCodeActivity Class
 - OCRNativeActivity Class
 - Clase Carácter
 - Clase OCRResult
 - Clase Word
 - FontStyles Enum
 - OCRRotation Enum
 - Clase OCRCapabilities
 - OCRScrapeBase Class
 - OCRScrapeFactory Class
 - ScrapeControlBase Class
 - Enum ScrapeEngineUsages
 - ExtraerBaseDelEctor
 - Clase ScrapeEngineFactory
 - Clase ExtraerEngineProvider
 
 - OmniPage
 - PDF
 - [No en la lista] Abbyy
 - [No en la lista] Abbyy incrustado
 

Actividades de Document Understanding
Esta página te muestra cómo crear un flujo de trabajo que incluye actividades como Digitalizar documento, Ámbito de extracción de datos y Estación de validación presente.
Puedes utilizar estas actividades cuando deseas automatizar la extracción y validación de datos a partir de documentos del mismo tipo. Las facturas u órdenes de compra son un gran ajuste para este tipo de tareas.
El siguiente flujo de trabajo se centra en utilizar la actividad Digitalizar documento en una factura, seguida de validar la información con el uso de la actividad Estación de validación presente. El motor OCR elegido para este flujo de trabajo es UiPath® Document OCR, pero puedes reemplazarlo por cualquier otro de nuestros motores OCR. Se utiliza una taxonomía simple, creada en función del documento de factura elegido. Consulta Descripción general de la taxonomía para comprobar cómo crear tu taxonomía.
- Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
 - Arrastra un contenedor Secuencia hasta el Diseñador de flujo de trabajo.
 - Selecciona el contenedor Secuencia y crea la siguiente variable:
                  
- Nombre de la variable: 
taxonomy; - Tipo de variable: TaxonomíaDeDocumento;
 - Valor predeterminado: ninguno.
 
 - Nombre de la variable: 
 - Añade una actividad Cargar taxonomía dentro del contenedor Secuencia.
                  Añade la variable
taxonomyen el campo Taxonomía. - Añade una actividad Para cada después de la actividad Cargar taxonomía y dentro del contenedor Secuencia.
                  
- Añade la expresión 
docal campo ParaCada. - Agrega la expresión 
directory.GetFiles("TestData\InputDocs\")en el campo Entrada. - En el panel Propiedades, selecciona la opción String en la lista desplegable TipoDeArgumento.
 
 - Añade la expresión 
 - Selecciona el contenedor Cuerpo de la actividad Para cada y crea las variables mostradas en la siguiente tabla:
                  
                  
Tabla 1. Las variables que se crearán Tipo de variable
Valor predeterminado
docNameValorGenérico
N/D domDocumento
N/D textCadena
N/D extractionResultsResultadoDeExtracción
N/D validatedResultsResultadoDeExtracción
N/D  - Añade una actividad Asignar dentro del contenedor Cuerpo.
                  
- Añade la variable 
docNameen el campo Para. - Agrega la expresión 
System.IO.Path.GetFileNameWithoutExtension(doc)en el campo Valor. 
 - Añade la variable 
 - Añade una actividad Escribir línea después de la actividad Asignar.
                  Añade la expresión
"Digitizing "+docNameen el campo Texto. - Añade una actividad Digitalizar documento después de la actividad Escribir línea.
                  
- Establece la RutaDelDocumento como 
doc. - Añade la variable 
texten el campo TextoDeDocumento. - Añade la variable 
domen el campo ModeloDeObjetoDeDocumento . 
 - Establece la RutaDelDocumento como 
 - Arrastra un motor de OCR a la actividad Digitalizar documento . En este ejemplo se utilizaUiPath Document OCR .
 - Añade una actividad Escribir línea después de la actividad Digitalizar documento .
                  Añade la expresión
docName+" was digitized."en el campo Texto. - Añade una actividad Escribir línea después de la actividad Escribir línea.
                  Añade la expresión
"Opening the Validation Station"en el campo Texto. - Añade una actividad Intentar capturar después de la actividad Escribir línea.
 - Añade un contenedor Secuencia en la sección Intentar .
 - Añade una actividad Mostrar estación de validación dentro del contenedor Secuencia .
                  
- Agrega 
doccomo valor en el campo RutaDelDocumento . - Añade la variable 
texten el campo TextoDeDocumento. - Añade la variable 
domen el campo ModeloDeObjetoDeDocumento . - Añade la variable 
taxonomyen el campo Taxonomía. - Añade la variable 
extractedResultsen el campo ResultadosDeExtracciónAutomática . - Añade la variable 
validatedResultsen el campo ResultadosDeExtracciónValidados . 
 - Agrega 
 - Añade una actividad Escribir archivo de texto después de la actividad Estación de validación presente.
 - Ejecuta el proceso. El robot extrae datos automáticamente, clasifica los documentos, extrae un campo específico, prepara los datos para su validación y muestra los documentos extraídos.
 
ZIP del ejemplo: Ejemplo.
            La ejecución del flujo de trabajo abre el asistente de la Estación de validación . Aquí puedes verificar la información extraída o extraerla tú mismo usando las opciones de Tokens o Área personalizada . Si estableces un campo en la taxonomía como multivalor, se pueden extraer varios valores de ese campo. Esto puede ser útil para documentos con múltiples direcciones, diferentes monedas, etc.