- Información general
- Acerca de las actividades de Document Understanding
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Acerca de las actividades de Document Understanding
Las actividades de Document Understanding te permiten procesar, clasificar y extraer documentos, con el fin de automatizar la interpretación para ellos.
Las actividades de Document Understanding son un componente clave del procesamiento de documentos. Hace posible el procesamiento completo de los documentos al permitir que el sistema interprete el significado de un documento y extraiga información de él. Puedes utilizar métodos de clasificación de documentos y extracción de datos para extraer e interpretar información de varios documentos con diferentes estructuras.
En un nivel alto, los documentos pasan por los siguientes cinco pasos fundamentales:
- Definir tipos de documentos y datos que se extraerán;
- Proporcionar el texto y su ubicación;
- Clasificar los documentos de la lista especificada;
- Extraer la información;
- Confirmar los datos extraídos por parte de un humano.
Luego, los datos extraídos pueden exportarse y consumirse como desee.
Las actividades de Document Understanding incluyen los siguientes paquetes:
- Contratos de procesamiento de documentos: contiene estructuras de datos e interfaces que se utilizarán para integrarse con el marco de Document Understanding.
- Digitizador de Document Understanding: una biblioteca que contiene funciones relacionadas con la digitalización.
- ML de Document Understanding: contiene actividades que integran modelos de aprendizaje automático para los flujos de trabajo de Document Understanding.
- Servidor local de Document Understanding OCR: no contiene actividades, pero una vez instalado en un proyecto, te permite utilizar UiPath Document OCR ejecutándose localmente en la máquina del robot.
- Proceso de Document Understanding: una plantilla que proporciona registro, gestión de excepciones, mecanismos de reintento y todos los métodos que deben utilizarse en un flujo de trabajo de Document Understanding, listos para usar.
- Document Understanding: te permite procesar documentos.
- OCR Inteligente: contiene la infraestructura para habilitar los flujos de trabajo de procesamiento de documentos.
- Servicios ML: te permite recuperar y llamar a todas las habilidades ML disponibles en tu tenant, así como cargar archivos o crear tareas de etiquetado.
- OCR: contiene las actividades de UiPath Screen OCR y UiPath Document OCR que utilizan los motores OCR internos de UiPath.
- Contratos OCR: contiene los contratos necesarios para desarrollar nuevos motores OCR.
- OmniPage: contiene la actividad OmniPage OCR que extrae datos de un elemento o imagen de IU (interfaz de usuario) indicado utilizando el motor OmniPage OCR.
- PDF: contiene actividades diseñadas para extraer datos de archivos PDF y XPS.
Consulta Límites basados en la actividad o en la API para comprobar las especificaciones y parámetros actuales para una utilización óptima de los proyectos modernos de Document Understanding y las actividades de Document Understanding.
Windows: proyectos heredados de Studio | Proyectos de Windows (Modern) Studio | Proyectos de Studio multiplataforma | |
---|---|---|---|
Document Understanding ML | |||
Servidor local de OCR de Document Understanding | |||
Actividades de Document Understanding | |||
OCRInteligente | |||
Servicios ML | |||
OCR | |||
Contratos OCR | |||
omnipage | |||