activities
latest
false
- Información general
- Contratos de procesamiento de documentos
- Notas relacionadas
- Acerca de los contratos de procesamiento de documento
- Clase Cuadro
- Interfaz IPersistedActivity
- Clase PrettyBoxConverter
- Interfaz IClassifierActivity
- Interfaz IClasificadorProveedorDeCapacidades
- Clase ClassifierDocumentType
- Clase ClassifierResult
- ClassifierCodeActivity Class
- ClassifierNativeActivity Class
- ClassifierAsyncCodeActivity Class
- Clase ClasificadorCapacidadDeTipoDeDocumento
- Clase
- Clase
- Clase ExtractorDocumentType
- Clase ExtractorDocumentTypeCapabilities
- Clase ExtractorFieldCapability
- Clase
- Clase ExtractorResult
- Interfaz ICapabilitiesProvider
- Interfaz IExtractorActivity
- Clase ExtractorPayload
- Enumeración DocumentActionPriority
- Clase DocumentActionData
- Enumeración DocumentActionStatus
- DocumentActionType Enum
- Clase DocumentClassificationActionData
- Clase DocumentValidationActionData
- Clase UserData
- Clase Documento
- Clase DocumentoDividirResultado
- Clase DomExtensions
- Clase Página
- Clase SecciónDePágina
- Clase de polígono
- Clase PolygonConverter
- Clase de metadatos
- Clase GrupoDeWord
- Clase Word
- Enum FuenteDeProcesamiento
- Clase ResultadosTablaCelda
- Clase ResultadosTablaValor
- Clase ResultadosTablaColumnaInfo
- Clase TablaDeResultados
- Enum Rotación
- Enum TipoDeSección
- Enum TipoDeGrupoDeWord
- Interfaz IDocumentTextProjection
- Clase ResultadoDeClasificación
- Clase ResultadoDeExtracción
- Clase ResultadosDeDocumento
- Clase ResultadosDeLímitesDeDocumento
- Clase ResultadosDePuntoDeDatos
- Clase ResultadosDeValor
- Clase ResultadosDeContenidoDeReferencia
- Clase ResultadosDeValorDeTokens
- Clase ResultadosDeCampoDerivado
- Enum ResultadosDeFuenteDeDatos
- Clase ResultadoDeConstantes
- Clase ValorDeCampoSimple
- Clase ValorDeCampoDeTabla
- Clase GrupoDeDocumento
- Clase TaxonomíaDeDocumento
- Clase TipoDeDocumento
- Clase Campo
- Enum TipoDeCampo
- Clase InformaciónDeLenguaje
- Clase MetadataEntry
- Enumeración de tipo de texto
- Clase TipoDeCampo
- Interfaz de actividad de ITracking
- Interfaz de ITrainableActivity
- Interfaz ITrainableClassifierActivity
- Interfaz ITrainableExtractorActivity
- Clase TrainableClassifierAsyncCodeActivity
- Clase TrainableClassifierCodeActivity
- Clase TrainableClassifierNativeActivity
- Clase TrainableExtractorAsyncCodeActivity
- Clase TrainableExtractorCodeActivity
- Clase TrainableExtractorNativeActivity
- Digitalizador de Document Understanding
- Document Understanding ML
- Servidor local de OCR de Document Understanding
- Document Understanding
- Notas relacionadas
- Acerca del paquete de actividades Document Understanding
- Compatibilidad de proyectos
- Establecer contraseña de PDF
- Fusionar PDF
- Obtener el recuento de páginas del PDF
- Extraer texto en PDF
- Extraer imágenes en PDF
- Extraer rango de página en PDF
- Extraer datos del documento
- Cree una tarea de validación y espere
- Esperar la tarea de validación y continuar
- Crear tarea de validación
- Clasificar documento
- Crear tarea de validación de clasificación
- Crear tarea de validación de clasificación y esperar
- Esperar la tarea de validación de clasificación y reanudar
- OCRInteligente
- Notas relacionadas
- Acerca del paquete de actividades IntelligentOCR
- Compatibilidad de proyectos
- Configurar autenticación
- Cargar taxonomía
- Digitalizar documento
- Clasificar ámbito de documento
- Clasificador basado en palabras clave
- Clasificador de proyectos de Document Understanding
- Clasificador inteligente de palabra clave
- Crear acción de clasificación de documentos
- Esperar la acción de clasificación de documentos y reanudar
- Entrenar el alcance de los clasificadores
- Entrenador del clasificador basado en palabras clave
- Entrenador del clasificador inteligente de palabra clave
- Alcance de la extracción de información
- Extractor de proyectos de Document Understanding
- Extractor basado en regex
- Extractor de forma
- Extractor inteligente de formularios
- Mostrar Estación de Validación
- Crear acción de validación de documentos
- Esperar la acción de validación de documentos y reanudar
- Entrenar el alcance de los Extractores
- Exportar resultados de extracción
- Servicios ML
- OCR
- Contratos OCR
- Notas relacionadas
- Acerca de los contratos OCR
- Compatibilidad de proyectos
- IOCRActivity Interface
- OCRAsyncCodeActivity Class
- OCRCodeActivity Class
- OCRNativeActivity Class
- Clase Carácter
- Clase OCRResult
- Clase Word
- FontStyles Enum
- OCRRotation Enum
- Clase OCRCapabilities
- OCRScrapeBase Class
- OCRScrapeFactory Class
- ScrapeControlBase Class
- Enum ScrapeEngineUsages
- ExtraerBaseDelEctor
- Clase ScrapeEngineFactory
- Clase ExtraerEngineProvider
- OmniPage
- PDF
- [No en la lista] Abbyy
- [No en la lista] Abbyy incrustado
Actividades de Document Understanding
Última actualización 5 de dic. de 2024
Clase
La clase abstracta
ExtractorCodeActivity
, una combinación de la interfaz IExtractorActivity
y la clase abstracta CodeActivity
, es fundamental para construir un CodeActivity
para la extracción de datos de documentos.
- Espacio de nombres:
UiPath.DocumentProcessing.Contracts.DataExtraction
- Ensamblado:
UiPath.DocumentProcessing.Contracts
Clase abstracta que implementa la interfaz UiPath.DocumentProcessing.Contracts.DataExtraction.IExtractorActivity y la clase abstracta
System.Activities.CodeActivity
.
Esta clase se implementa para construir un
CodeActivity
para la extracción de datos de documentos, compatible con la actividad Ámbito de extracción de datos y la infraestructura de procesamiento de documentos.
Para implementar esta clase resumen, el método
Execute
(CodeActivityContext context
) debe reemplazarse.
La actividad Ámbito de extracción de datos rellena automáticamente todos los InArguments definidos para sus actividades secundarias. Estos InArguments incluyen la siguiente información:
- Detalles específicos sobre el documento que se está extrayendo. Esto incluye su ruta de archivo original, versión de texto y modelo de objeto de documento.
- Detalles sobre los campos que se espera que procese la actividad del extractor. Se configuran a través del asistente Configurar extractores en la actividad Ámbito de extracción de datos .
El OutArgument aloja los resultados de la extracción. Se compone de un objeto
ExtractorResult
, que contiene una lista DataPoints
con entradas para todos los campos de entrada identificados correctamente.
Constructores
ExtractorCodeActivity()
: un constructor predeterminado protegido.
Métodos
GetCapabilities()
: obtiene una lista de campos que el extractor es capaz de extraer, para cada tipo de documento, en tiempo de diseño. Este método solo se llamará en tiempo de diseño y, como tal, NO debe utilizar ningún InArgument(s)ProvidesCapabilities()
: devuelve verdadero si el extractor puede proporcionar una lista de capacidades.
Propiedades
DocumentPath
InArgument<string>
: la ruta del archivo al documento.DocumentText
InArgument<string>
: la versión de texto del documento.DocumentObjectModel
InArgument<UiPath.DocumentProcessing.Contracts.Dom.Document>
: el modelo de objeto de documento del documento.ExtractorDocumentType
InArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorDocumentType>
: la información del tipo de documento que tiene en cuenta el extractor.DocumentBounds
InArgument<UiPath.DocumentProcessing.Contracts.Results.ResultsDocumentBounds>
: el intervalo de páginas y los límites que tiene en cuenta el extractor.ExtractorResult
OutArgument<UiPath.DocumentProcessing.Contracts.DataExtraction.ExtractorResult>
: la salida de la actividad del extractor.PersistenceId
string
: el ID único y opaco que utilizan las actividades de ámbito para realizar un seguimiento y configurar correctamente la actividad del extractor.PredictionId
InArgument<string>
: identifica que el mismo documento se procesa en un flujo de trabajo. Se compone deDocumentId
+JobId
.