activities
latest
false
- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Validación manual para digitalizar documentos
- Extracción de datos basada en anclajes utilizando el extractor inteligente de formularios
- Estación de validación
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Validación manual para digitalizar documentos
Importante :
Este contenido se ha localizado parcialmente a partir de un sistema de traducción automática.
Actividades de Document Understanding
Last updated 21 de nov. de 2024
Validación manual para digitalizar documentos
El siguiente ejemplo explica cómo extraer datos manualmente de una imagen y presentar la salida en un archivo independiente. Presenta actividades como Digitalizar documento o Presentar estación de validación. Puedes encontrar estas actividades en el paquete UiPath.IntelligentOCR.Activities .
Nota: Este flujo de trabajo utiliza una versión anterior del paquete UiPath.IntelligentOCR.Activities .
Steps:
- Abre Studio y crea un nuevo Proceso llamado Principal de forma predeterminada.
Nota: asegúrate de añadir todos los archivos necesarios (
.json
archivos y todas las imágenes) dentro de la carpeta del proyecto. - Añade un contenedor Secuencia en el Diseñador de flujo de trabajo y crea las variables mostradas en la siguiente tabla:
Tabla 1. Variables que se crearán Tipo de variable
Valor predeterminado
Text
Cadena
DOM
UiPath.DocumentProcessing.Contracts.Dom.Document
Data
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
DocumentTaxonomy
UiPath.DocumentProcessing.Contracts.Taxonomy.DocumentTaxonomy
TaxonomyJSON
Cadena
HumanValidated
UiPath.DocumentProcessing.Contracts.Results.ExtractionResult
- Añade una actividad Leer archivo de texto dentro de la secuencia.
- En el panel Propiedades, añade el nombre del archivo, en este caso
"taxonomy.json"
, en el campo NombreDeArchivo. - Añade la variable
TaxonomyJSON
en el campo Contenido.
- En el panel Propiedades, añade el nombre del archivo, en este caso
- Añade una actividad Asignar después de la actividad Leer archivo de texto.
- Añade la variable
Data
al campo Para y la expresiónDocumentTaxonomy.Deserialize(TaxonomyJSON)
al campo Valor . Esta actividad crea la taxonomía para la extracción.
- Añade la variable
- Añade una actividad Digitalizar documento después de la actividad Asignar.
- En panel Propiedades añade el valor
1
en el campo GradoDeParalelismo. - Añade la expresión
"Input\Invoice01.tif"
en el campo Ruta del documento. - Añade la variable
DOM
en el campo ModeloDeObjetoDeDocumento . - Añade la variable
Text
en el campo TextoDeDocumento.
- En panel Propiedades añade el valor
- Añade un motor Google OCR dentro de la actividad Digitalizar documento.
- En el panel de propiedades, añade la variable
Image
al campo Imagen. - Seleccione la casilla de verificación de la opción ExtraerPalabras . Esta opción extrae la posición en pantalla de todas las palabras detectadas.
- Añade la expresión
"eng"
en el campo Idioma. - Selecciona la opción
Legacy
en la lista desplegable Perfil. - Agrega el valor
2
en el campo Escala.
- En el panel de propiedades, añade la variable
- Añade una actividad Estación de validación presente después de la actividad Digitalizar documento.
- En el panel Propiedades , añade la variable
DOM
en el campo ModeloDeObjetoDeDocumento . - Añade la expresión
"Input\Invoice01.tif"
en el campo Ruta del documento. - Añade la variable
Text
en el campo TextoDeDocumento. - Añade la variable
Data
en el campo Taxonomía. - Añade la variable
HumanValidated
en el campo ResultadosDeExtracciónValidados .
- En el panel Propiedades , añade la variable
- Añade una actividad Para cada en la actividad Estación de validación presente.
- En el panel Propiedades, selecciona la opción
UiPath.DocumentProcessing.Contracts.Results.ResultsDataPoint
en la lista desplegable TipoDeArgumento. - Añade la expresión
HumanValidated.ResultsDocument.Fields
en el campo Valores.
- En el panel Propiedades, selecciona la opción
- Añade una actividad Registrar mensaje dentro del Cuerpo de la actividad Para cada .
- Selecciona la opción
Info
de la lista desplegable Nivel. - Agrega la expresión
item.FieldName
en el campo Mensaje.
- Selecciona la opción
- Añade una actividad Mensaje de registro debajo de la primera actividad Mensaje de registro.
- Selecciona la opción
Info
de la lista desplegable Nivel. - Agrega la expresión
item.Values(0).Value.ToString
en el campo Mensaje.
- Selecciona la opción
- Añade una actividad Escritura de línea en las actividades de Registro de mensaje.
- Añade el valor
""
al campo Texto.
- Añade el valor
- Ejecuta el proceso. El robot utiliza las actividades IntelligentOCR para procesar manualmente los datos y presentar los resultados.
Consulta el siguiente enlace para descargar el ejemplo como archivo
ZIP
: Ejemplo.