- Visão geral
- Sobre as atividades do Document Understanding
- Contratos de Processamento de Documentos
- Notas de versão
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Document Understanding
- Notas de versão
- Sobre o pacote de atividades Document Understanding
- Compatibilidade do projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Notas de versão
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do projeto
- Configuração da autenticação
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Document Understanding Project Classifier
- Intelligent Keyword Classifier
- Create Document Classification Action
- Aguardar ação de classificação do documento e retomar
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Document Understanding Project Extractor
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de versão
- Sobre os Contratos OCR
- Compatibilidade do projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Atividades de Document Understanding
Sobre as atividades do Document Understanding
As atividades do Document Understanding permitem que você processe, classifique e extraia documentos, com o objetivo de automatizar a interpretação para eles.
As atividades do Document Understanding são um componente-chave do processamento de documentos. Torna possível o processamento completo de documentos, permitindo que o sistema interprete o significado de um documento e extraia informações dele. Você pode usar métodos de classificação de documentos e extração de dados para extrair e interpretar informações de vários documentos com diferentes estruturas.
Em um nível alto, os documentos passam pelas seguintes cinco etapas fundamentais:
- Definição de tipos de documentos e dados a serem extraídos;
- Fornecimento do texto e sua localização;
- Classificação dos documentos da lista especificada;
- Extração das informações;
- Confirmação dos dados extraídos por um humano.
Em seguida, os dados extraídos podem ser exportados e consumidos da forma que você desejar.
As atividades do Document Understanding incluem os seguintes pacotes:
- Contratos de processamento de documentos: contém estruturas de dados e interfaces a serem usadas para se integrar com a estrutura do Document Understanding.
- Digitalizador do Document Understanding: uma biblioteca que contém funções relacionadas à digitalização.
- ML do Document Understanding: contém atividades que integram modelos de machine learning para fluxos de trabalho do Document Understanding.
- Servidor local do Document Understanding OCR: não contém atividades, mas, uma vez instalado em um projeto, permite que você use o UiPath Document OCR executando localmente na máquina do UiPath Robot.
- Processo do Document Understanding: um modelo que fornece registro, tratamento de exceções, mecanismos de novas tentativas e todos os métodos que devem ser usados em um fluxo de trabalho do Document Understanding pronto para uso.
- Document Understanding: permite que você processe documentos.
- OCR inteligente: contém a infraestrutura para habilitar fluxos de trabalho de processamento de documentos.
- Serviços de ML: permite que você recupere e chame todas as Habilidades de ML disponíveis no seu tenant, bem como carregue arquivos ou crie tarefas de rotulagem.
- OCR: contém as atividades UiPath Screen OCR e UiPath Document OCR, que usam os mecanismos de OCR internos da UiPath.
- Contratos de OCR: contém os contratos necessários para desenvolver novos mecanismos de OCR.
- OmniPage: contém a atividade OmniPage OCR, que extrai dados de um elemento ou imagem de interface do usuário indicado usando o mecanismo OmniPage OCR.
- PDF: contém atividades projetadas para extrair dados de arquivos PDF e XPS.
Acesse Limites baseados em Atividade ou API para verificar as especificações e parâmetros atuais para uma utilização ideal dos projetos modernos do Document Understanding e das atividades do Document Understanding.
Projetos do Windows - Legado do Studio | Projetos do Windows (Moderno) Studio | Projetos do Studio multiplataforma | |
---|---|---|---|
Document Understanding ML | |||
Document Understanding OCR Local Server | |||
Atividades de Document Understanding | |||
IntelligentOCR | |||
Serviços de ML | |||
OCR | |||
Contratos de OCR | |||
omnipage | |||