- Visão geral
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- ContentValidationData Class
- EvaluatedBusinessRulesForFieldValue Class
- EvaluatedBusinessRuleDetails Class
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- FieldValue Class
- FieldValueResult Class
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Rule Class
- RuleResult Class
- RuleSet Class
- RuleSetResult Class
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- FieldValueDetails Class
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Configuração da conexão externa
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Create Document Validation Artifacts
- Recuperar artefatos de validação de documento
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Document Understanding Project Extractor Trainer
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Rasurar documento
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded

Atividades de Document Understanding
UiPath.IntelligentOCR.Activities.Redaction.RedactDocument
A atividade Redact Document gera um PDF editado com base no PDF de entrada original (fornecido como o Caminho do Documento), nos campos de entrada Resultado da Extração e Palavras Para Redigir .
A atividade Redact Document usa o Modelo de Objeto de Documento para acessar o local de todas as palavras identificadas no PDF, enquanto os campos Resultado da Extração e Palavras Para Redigir são usados como entrada para os dados que devem ser escritos, da seguinte forma:
- Cada entrada na matriz de entrada Words To Redact é considerada como uma string para uma pesquisa contínua que não diferencia maiúsculas de minúsculas no documento para fins de edição.
- Os valores do Resultado da Extração que têm uma referência serão editados com base nesse valor de referência (incluindo seleções de áreas do cliente como referência para um valor). Tanto os campos regulares quanto as células da tabela são editados.
- Os valores de Resultado de extração que não têm referência (adicionados sem referência a um campo em que Requer Referência está definido como False) são considerados de forma semelhante às entradas no campo Words To Redact . Isso significa que todas as ocorrências daquele texto específico encontrado no documento de entrada serão editadas.
A atividade pesquisa palavras usando o Modelo de Objeto do Documento. Não há correspondência difusa disponível.
Para lidar com documentos extremamente confidenciais, é altamente recomendável realizar a validação humana dos resultados da extração e usar valores e seleções baseados em referência. Isso garante uma revisão abrangente de todos os dados que precisam ser editados, minimizando as chances de erros de OCR ou problemas de ordem das palavras que afetam a saída final da edição.
Painel do Designer
Entrada
- Caminho do Documento: o caminho para o documento que você deseja editar.
- Modelo de Objeto do Documento: o Modelo de Objeto do Documento para a entrada documentada obtido da atividade Digitalizar Documento .
- Resultados da Extração (Opcional): os resultados da extração do processo de extração de dados, armazenados em uma variável
ExtractionResult
. Você pode recuperá-la da atividade Data Extraction Scope . - Palavras a serem editadas (opcional): uma lista de strings que serão escritas, além dos dados provenientes do campo de entrada Resultados da extração .
- Arquivo de Saída: o caminho do arquivo de saída onde você deseja salvar o PDF editado.
Painel de Propriedades
- NomeDeExibição: o nome de exibição da atividade.
Entrada
- Caminho do Documento: o caminho para o documento que você deseja editar.
- Modelo de Objeto do Documento: o Modelo de Objeto do Documento para a entrada documentada obtido da atividade Digitalizar Documento .
- Resultados da Extração (Opcional): os resultados da extração do processo de extração de dados, armazenados em uma variável
ExtractionResult
. Você pode recuperá-la da atividade Data Extraction Scope . - Palavras a serem editadas (opcional): uma lista de strings que serão escritas, além dos dados provenientes do campo de entrada Resultados da extração .
- Arquivo de Saída: o caminho do arquivo de saída onde você deseja salvar o PDF editado.
- Particular: se selecionada, os valores de variáveis e argumentos não são mais registrados no nível Verbose.
Saída
- Arquivo de Saída: o arquivo de saída que contém as informações editadas.
Configurações da rasura
- CorDaBorda: a cor da borda usada para a edição.
- GrossuraDaBorda: a espessura da borda usada para a edição.
- Dpi: o valor de Pontos por tela que representa a qualidade das imagens incorporadas no PDF editado.
- CorDePreenchimento: a cor de preenchimento usada para a edição.