- Visão geral
- Contratos de Processamento de Documentos
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Atividades de Document Understanding
- Sobre o pacote Document Understanding
- Compatibilidade do Projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do Projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de Versão
- Sobre os Contratos OCR
- Compatibilidade do Projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Notas de Versão
Data de lançamento: 2 de maio de 2023
Corrigimos um bug que fazia com que a atividade Data Extraction Scope travasse quando a extração fosse concluída em todos os subdocumentos, exceto no primeiro. Isso ocorria quando um classificador era usado para realizar a separação de documentos e vários resultados de classificação eram retornados do Classify Document Scope.
Data de lançamento: 26 de abril de 2023
Adicionamos uma nova carga para o método .Serialize , que aceita um objeto SerializationSettings . Agora, você pode configurar se a serialização será feita usando uma convenção Pascal-Case ou CamelCase. O padrão é PascalCase. Isso se aplica às seguintes classes: Document, DocumentTaxonomy, DocumentSplittingResult, ClassificationResult e ExtractionResult.
Você ainda pode usar todos os métodos existentes no PascalCase e tudo é compatível com versões anteriores.
Você pode usar a desserialização com objetos serializados Pascal- Case ou CamelCase .
Novas classes foram adicionadas ao pacote UiPath.DocumentProcessing.Contracts , que contém informações sobre as Actions criadas no Actions Center.
Um novo método auxiliar, IsTextTypeInDocument, está disponível para detectar a presença de um tipo de texto (manuscrito ou caixas de seleção) em um documento usando um parâmetro TipoDeTexto .
Corrigimos um bug que fazia com que a propriedade TipoDeTexto fosse exibida nas seções Valores e Tokens . Agora, a propriedade é exibida apenas na seção Valores .
Data de lançamento: 24 de outubro de 2022
Refatoramos a classe Data Extraction Results para permitir seu uso no fluxo de trabalho. Implementamos uma nova estrutura de tabela e métodos auxiliares de tabela e, no momento, as estruturas antigas e novas estão disponíveis. O novo formato é suportado no Validation Station e outros componentes (treinadores, extratores etc.)
Cada palavra do Document Object Model agora pode ser definida como tipo Text, Handwritingou Checkbox.
A propriedade ResultsValue.Components , os construtores ResultsValue que têm componentes ResultsDataPoint[] como parâmetros, os métodos ResultsValue.CreateTableValue e o método ExtractionResult.FlattenFields agora estão marcados como obsoletos.
Há um novo valor ProcessingSource , chamado PdfAndOcr, que reflete uma página PDF que foi processada com processamento PDF nativo e processamento OCR.
Data de lançamento: 9 de maio de 2022
O pacote UiPath.DocumentProcessing.Contracts foi atualizado para .NET5 portátil, permitindo que você os execute em robôs Linux.
Algumas das classes incluídas no pacote UiPath.DocumentProcessing.Contracts foram atualizadas. Entre elas estão as classes Valor Simplificado, Valor de Resultados e Resultado de Extração.
Data de lançamento: 1º de outubro de 2021
A classe ClassificationResult recebeu novos métodos, Serialize e Deserialize, destinados a ajudá-lo a serializar e desserializar a saída de classificação.
Novos métodos, FlattenFields e GetFields, também foram adicionados à classe ExtractionResult para ajudá-lo a filtrar os campos com base na condição especificada.
O pacote UiPath.DocumentProcessing.Contracts foi atualizado para .NET5. Embora ambas as versões .NET continuem a ser suportadas, os projetos .NET5 só podem funcionar em arquiteturas de 64 bits.
Data de lançamento: 23 de março de 2021
ExtractionResult.AsDataSet(bool includeConfidence, bool includeOcrConfidence)
que pode ser usado para exportar um ExtractionResult
para um DataSet
, incluindo opcionalmente a confiança de OCR dos valores.
Compatibilidade com versões anteriores corrigida com UiPath.IntelligentOCR.Activities versões anteriores a 4.11.0.
Data de lançamento: 2 de outubro de 2020
A extração de valor nulo (vazio) é permitida para campos de extração de dados sem referência, classificações de documentos sem referência e valores criados pelo usado na Estação de Validação sem referência.
ExtractionResults
.
Adicionado suporte para metadados em nível de campo em Taxonomia.
Data de lançamento: 4 de maio de 2020
VisualLineNumber
foi adicionada à classe pública Word indicando em qual linha visual a palavra está colocada. Isso pode ser encontrado no namespace UiPath.DocumentProcessing.Contracts.Dom .
GetVisualTextProjection
foi adicionado à classe Document , permitindo que você acesse um arranjo visual das palavras. Isso pode ser encontrado no namespace UiPath.DocumentProcessing.Contracts.Dom .
Data de lançamento: 23 de setembro de 2019
Data de lançamento: 19 de junho de 2019
Data de lançamento: 21 de maio de 2019
Data de lançamento: 22 de abril de 2019
Nossa primeira iteração do pacote de Contratos de Processamento de Documentos permite que você integre suas próprias atividades de extração e classificação de dados com as atividades do IntelligentOCR . Isso significa que você pode integrar facilmente seus próprios algoritmos de processamento de documentos na infraestrutura UiPath, referenciando os contratos fornecidos neste pacote e implementando seus próprios classificadores e extratores em seus fluxos de trabalho.
- V1.23.1
- Novas funcionalidades e melhorias
- v1.21.1
- Correções de bugs
- v1.21.0
- Novas funcionalidades e melhorias
- Correções de bugs
- Linha do tempo de depreciação
- V1.18.0
- Novas funcionalidades e melhorias
- V1.17.1
- Novas funcionalidades e melhorias
- V1.14.0
- Novos recursos e melhorias
- V1.11.0
- Novos recursos e melhorias
- Correções de bugs
- v1.10.1
- Melhorias
- Correções de bugs
- V1.9.1
- Correções de bugs
- V1.9.0
- Novos recursos e melhorias
- V1.6.1
- Novos recursos e melhorias
- V1.4.0
- Novos recursos e melhorias
- V1.3.0
- Novos recursos e melhorias
- V1.2.0
- Novos recursos e melhorias
- V1.1.0
- Novos recursos e melhorias
- V1.0.0
- Novos recursos e melhorias