- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Proceso Document Understanding - Plantilla Studio
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Datos del documento
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador inteligente de palabra clave
- Mostrar Estación de Clasificación
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Estación de validación
La extracción y validación de datos pueden ser divertidas y fáciles con el asistente de Estación de validación. A continuación puede encontrar detalles sobre la creación de un flujo de trabajo que incluya actividades como Digitalizar documento, Ámbito de extracción de datosy Mostrar estación de validación.
Puede hacer uso de estas actividades cuando necesite automatizar la extracción y validación de datos de documentos del mismo tipo. Las facturas u órdenes de compra son perfectas para este tipo de tareas.
El siguiente flujo de trabajo se centra en el uso de la actividad Digitalizar documento en una factura, seguido de la validación de la información con el uso de la actividad Presentar estación de validación . El motor de OCR elegido para este flujo de trabajo es UiPath® Document OCR , pero puedes sustituirlo por cualquier otro de nuestros motores de OCR.
La taxonomía también es simple, creada en función del documento de la factura utilizado. Aquí se muestra más detalles sobre cómo crear tu taxonomía.
Crear el flujo de trabajo
Así es como se puede construir el proceso de automatización:
- Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
- Arrastra un contenedor Secuencia hasta el Diseñador de flujo de trabajo.
-
Selecciona el contenedor Secuencia y crea la siguiente variable:
Nombre de la variable
Tipo de variable
Valor predeterminado
taxonomy
DocumentTaxonomy
-
Arrastra una actividad Cargar taxonomía dentro del contenedor Secuencia .
- Añade la variable
taxonomy
en el campo Taxonomía.
- Añade la variable
-
Arrastra una actividad Para cada debajo de la actividad Cargar taxonomía.
- Añade la expresión
doc
al campo ParaCada. - Agrega la expresión
directory.GetFiles("TestData\InputDocs\")
en el campo Entrada. - En el panel Propiedades, selecciona la opción String en la lista desplegable TipoDeArgumento.
- Añade la expresión
-
Selecciona el contenedor Cuerpo de la actividad Para cada y crea las siguientes variables:
Nombre de la variable
Tipo de variable
Valor predeterminado
docName
ValorGenérico
dom
Documento
text
Cadena
extractionResults
ResultadoDeExtracción
validatedResults
ResultadoDeExtracción
-
Añade una actividad Asignar dentro del contenedor Cuerpo.
- Añade la variable
docName
en el campo Para. - Agrega la expresión
System.IO.Path.GetFileNameWithoutExtension(doc)
en el campo Valor.
- Añade la variable
-
Añade la actividad Escribir línea debajo de la actividad Asignar.
- Añade la expresión
"Digitizing "+docName
en el campo Texto.
- Añade la expresión
-
Añade una actividad Digitalizar documento debajo de la actividad Escribir línea .
- Establece la RutaDelDocumento como
doc
. - Añade la variable
text
en el campo TextoDeDocumento. - Añade la variable
dom
en el campo ModeloDeObjetoDeDocumento .
- Establece la RutaDelDocumento como
- Arrastra un motor de OCR a la actividad Digitalizar documento . En este ejemplo se utilizaUiPath Document OCR .
-
Añade una actividad Escribir línea debajo de la actividad Digitalizar documento .
- Añade la expresión
docName+" was digitized."
en el campo Texto.
- Añade la expresión
-
Añade una actividad Escribir línea debajo de la actividad Escribir línea.
- Añade la expresión
"Opening the Validation Station"
en el campo Texto.
- Añade la expresión
- Añade la actividad Intentar capturar debajo de la actividad Escribir línea.
- Añade un contenedor Secuencia en la sección Intentar .
-
Añade una actividad Mostrar estación de validación dentro del contenedor Secuencia .
- Agrega
doc
como valor en el campo RutaDelDocumento . - Añade la variable
text
en el campo TextoDeDocumento. - Añade la variable
dom
en el campo ModeloDeObjetoDeDocumento . - Añade la variable
taxonomy
en el campo Taxonomía. - Añade la variable
extractedResults
en el campo ResultadosDeExtracciónAutomática . - Añade la variable
validatedResults
en el campo ResultadosDeExtracciónValidados .
- Agrega
- Añade una actividad Escribir archivo de texto debajo de la actividad Mostrar estación de validación .
- Ejecuta el proceso. El robot extrae datos automáticamente, clasifica los documentos, extrae un campo específico, prepara los datos para su validación y muestra los documentos extraídos.
Descarga el ejemplo desde aquí.
Uso de la estación de validación
La ejecución del flujo de trabajo abre el asistente de la Estación de validación . Aquí puedes verificar la información extraída o extraerla tú mismo usando las opciones de Tokens o Área personalizada . Si estableces un campo en la taxonomía como multivalor, se pueden extraer varios valores de ese campo. Esto puede ser útil para documentos con múltiples direcciones, diferentes monedas, etc.
Veamos cómo puede alternar entre las opciones de Tokens y Área personalizada .
Aquí tienes un ejemplo de cómo añadir un valor extra a un campo.
Puedes encontrar más información sobre cómo usar y personalizar la Estación de Validación aquí.