- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Estación de validación
Esta página te muestra cómo crear un flujo de trabajo que incluye actividades como Digitalizar documento, Ámbito de extracción de datos y Estación de validación presente.
Puedes utilizar estas actividades cuando deseas automatizar la extracción y validación de datos a partir de documentos del mismo tipo. Las facturas u órdenes de compra son un gran ajuste para este tipo de tareas.
El siguiente flujo de trabajo se centra en utilizar la actividad Digitalizar documento en una factura, seguida de validar la información con el uso de la actividad Estación de validación presente. El motor OCR elegido para este flujo de trabajo es UiPath® Document OCR, pero puedes reemplazarlo por cualquier otro de nuestros motores OCR. Se utiliza una taxonomía simple, creada en función del documento de factura elegido. Consulta Descripción general de la taxonomía para comprobar cómo crear tu taxonomía.
- Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
- Arrastra un contenedor Secuencia hasta el Diseñador de flujo de trabajo.
- Selecciona el contenedor Secuencia y crea la siguiente variable:
- Nombre de la variable:
taxonomy
; - Tipo de variable: TaxonomíaDeDocumento;
- Valor predeterminado: ninguno.
- Nombre de la variable:
- Añade una actividad Cargar taxonomía dentro del contenedor Secuencia.
Añade la variable
taxonomy
en el campo Taxonomía. - Añade una actividad Para cada después de la actividad Cargar taxonomía y dentro del contenedor Secuencia.
- Añade la expresión
doc
al campo ParaCada. - Agrega la expresión
directory.GetFiles("TestData\InputDocs\")
en el campo Entrada. - En el panel Propiedades, selecciona la opción String en la lista desplegable TipoDeArgumento.
- Añade la expresión
- Selecciona el contenedor Cuerpo de la actividad Para cada y crea las variables mostradas en la siguiente tabla:
Tabla 1. Las variables que se crearán Tipo de variable
Valor predeterminado
docName
ValorGenérico
N/D dom
Documento
N/D text
Cadena
N/D extractionResults
ResultadoDeExtracción
N/D validatedResults
ResultadoDeExtracción
N/D - Añade una actividad Asignar dentro del contenedor Cuerpo.
- Añade la variable
docName
en el campo Para. - Agrega la expresión
System.IO.Path.GetFileNameWithoutExtension(doc)
en el campo Valor.
- Añade la variable
- Añade una actividad Escribir línea después de la actividad Asignar.
Añade la expresión
"Digitizing "+docName
en el campo Texto. - Añade una actividad Digitalizar documento después de la actividad Escribir línea.
- Establece la RutaDelDocumento como
doc
. - Añade la variable
text
en el campo TextoDeDocumento. - Añade la variable
dom
en el campo ModeloDeObjetoDeDocumento .
- Establece la RutaDelDocumento como
- Arrastra un motor de OCR a la actividad Digitalizar documento . En este ejemplo se utilizaUiPath Document OCR .
- Añade una actividad Escribir línea después de la actividad Digitalizar documento .
Añade la expresión
docName+" was digitized."
en el campo Texto. - Añade una actividad Escribir línea después de la actividad Escribir línea.
Añade la expresión
"Opening the Validation Station"
en el campo Texto. - Añade una actividad Intentar capturar después de la actividad Escribir línea.
- Añade un contenedor Secuencia en la sección Intentar .
- Añade una actividad Mostrar estación de validación dentro del contenedor Secuencia .
- Agrega
doc
como valor en el campo RutaDelDocumento . - Añade la variable
text
en el campo TextoDeDocumento. - Añade la variable
dom
en el campo ModeloDeObjetoDeDocumento . - Añade la variable
taxonomy
en el campo Taxonomía. - Añade la variable
extractedResults
en el campo ResultadosDeExtracciónAutomática . - Añade la variable
validatedResults
en el campo ResultadosDeExtracciónValidados .
- Agrega
- Añade una actividad Escribir archivo de texto después de la actividad Estación de validación presente.
- Ejecuta el proceso. El robot extrae datos automáticamente, clasifica los documentos, extrae un campo específico, prepara los datos para su validación y muestra los documentos extraídos.
ZIP
del ejemplo: Ejemplo.
La ejecución del flujo de trabajo abre el asistente de la Estación de validación . Aquí puedes verificar la información extraída o extraerla tú mismo usando las opciones de Tokens o Área personalizada . Si estableces un campo en la taxonomía como multivalor, se pueden extraer varios valores de ese campo. Esto puede ser útil para documentos con múltiples direcciones, diferentes monedas, etc.