- Visão geral
- Contratos de Processamento de Documentos
- Sobre os Contratos de Processamento de Documentos
- Classe Box
- Interface IPersistedActivity
- Classe PrettyBoxConverter
- Interface IClassifierActivity
- Interface IClassifierCapabilitiesProvider
- Classe ClassifierDocumentType
- Classe ClassifierResult
- Classe ClassifierCodeActivity
- Classe ClassifierNativeActivity
- Classe ClassifierAsyncCodeActivity
- Classe ClassifierDocumentTypeCapability
- Classe ExtractorAsyncCodeActivity
- Classe ExtractorCodeActivity
- Classe ExtractorDocumentType
- Classe ExtractorDocumentTypeCapabilities
- Classe ExtractorFieldCapability
- Classe ExtractorNativeActivity
- Classe ExtractorResult
- Interface ICapabilitiesProvider
- Interface IExtractorActivity
- Classe ExtractorPayload
- Enumeração DocumentActionPriority
- Classe DocumentActionData
- Enumeração DocumentActionStatus
- Enumeração DocumentActionType
- Classe DocumentClassificationActionData
- Classe DocumentValidationActionData
- Classe UserData
- Classe Document
- Classe DocumentSplittingResult
- Classe DomExtensions
- Classe Page
- Classe PageSection
- Classe Polígono
- Classe PolygonConverter
- Classe de metadados
- Classe WordGroup
- Classe Word
- Enumeração ProcessingSource
- Classe ResultsTableCell
- Classe ResultsTableValue
- Classe ResultsTableColumnInfo
- Classe ResultsTable
- Enumeração Rotation
- Enumeração SectionType
- Enumeração WordGroupType
- Interface IDocumentTextProjection
- Classe ClassificationResult
- Classe ExtractionResult
- Classe ResultsDocument
- Classe ResultsDocumentBounds
- Classe ResultsDataPoint
- Classe ResultsValue
- Classe ResultsContentReference
- Classe ResultsValueTokens
- Classe ResultsDerivedField
- Enumeração ResultsDataSource
- Classe ResultConstants
- Classe SimpleFieldValue
- Classe TableFieldValue
- Classe DocumentGroup
- Classe DocumentTaxonomy
- Classe DocumentType
- Classe Field
- Enumeração FieldType
- Classe LanguageInfo
- Classe MetadataEntry
- Enumeração de tipo de texto
- Classe TypeField
- Interface ITrackingActivity
- Interface ITrainableActivity
- Interface ITrainableClassifierActivity
- Interface ITrainableExtractorActivity
- Classe TrainableClassifierAsyncCodeActivity
- Classe TrainableClassifierCodeActivity
- Classe TrainableClassifierNativeActivity
- Classe TrainableExtractorAsyncCodeActivity
- Classe TrainableExtractorCodeActivity
- Classe TrainableExtractorNativeActivity
- Digitalizador do Document Understanding
- Document Understanding ML
- Document Understanding OCR Local Server
- Processo do Document Understanding - Modelo do Studio
- Atividades de Document Understanding
- Sobre o pacote Document Understanding
- Compatibilidade do Projeto
- Definir Senha do PDF
- Merge PDFs
- Get PDF Page Count
- Extract PDF Text
- Extract PDF Images
- Extract PDF Page Range
- Extract Document Data
- Criar tarefa de validação e aguardar
- Aguarde a tarefa de validação e retome
- Create Validation Task
- Classificar Documento
- Create Classification Validation Task
- Create Classification Validation Task and Wait
- Aguardar a tarefa de Validação de Classificação e retomar
- IntelligentOCR
- Sobre o pacote de atividades IntelligentOCR
- Compatibilidade do Projeto
- Carregar Taxonomia
- Digitize Document
- Classificar Escopo do Documento
- Classificador baseado em palavra-chave
- Intelligent Keyword Classifier
- Present Classification Station
- Create Document Classification Action
- Wait For Document Classification Action And Resume
- Train Classifiers Scope
- Instrutor de Classificador Baseado em Palavra-chave
- Intelligent Keyword Classifier Trainer
- Escopo da Extração de Dados
- Regex Based Extractor
- Form Extractor
- Intelligent Form Extractor
- Present Validation Station
- Create Document Validation Action
- Wait For Document Validation Action And Resume
- Escopo de Extratores de Treinamento
- Exportar Resultados da Extração
- Serviços de ML
- OCR
- Contratos de OCR
- Notas de Versão
- Sobre os Contratos OCR
- Compatibilidade do Projeto
- Interface IOCRActivity
- Classe OCRAsyncCodeActivity
- Classe OCRCodeActivity
- Classe OCRNativeActivity
- Character Class
- Classe OCRResult
- Classe Word
- Enumeração FontStyles
- Enumeração OCRRotation
- Classe OCRCapabilities
- Classe OCRScrapeBase
- Classe OCRScrapeFactory
- Classe ScrapeControlBase
- Enumeração ScrapeEngineUsages
- ScrapeEngineBase
- Classe ScrapeEngineFactory
- Classe ScrapeEngineProvider
- OmniPage
- PDF
- [Não listado] Abbyy
- [Não listado] Abbyy Embedded
Notas de Versão
Data de lançamento: 1º de setembro de 2023
- Atividade Classificador generativo
- Atividade Extrator generativo
- Uma nova propriedade, Pasta de saída, está disponível para a atividade Treinador de classificador de aprendizado de máquina. Essa propriedade permite salvar arquivos localmente.
- O suporte para campos de várias páginas agora está disponível.Esta funcionalidade é útil quando um endereço, por exemplo, tem a rua em uma página e o estado e CEP na página seguinte. Devido a um problema conhecido, as linhas de tabela não estão funcionando atualmente nesse caso. Siga nossas notas de versão para atualizações futuras.
Data de lançamento: 7 de junho de 2023
Estamos trabalhando constantemente para melhorar sua experiência com o UiPath Document Understanding. Embora não haja grandes alterações nesta versão, certificamo-nos de fazer pequenas melhorias e correções de acessibilidade em nosso produto.
Data de lançamento: 26 de abril de 2023
Data de lançamento: 27 de março de 2023
Data de lançamento: 15 de dezembro de 2022
A interface do usuário do Studio agora está disponível em chinês tradicional.
Agora você pode se beneficiar do campo Chave de API pré-preenchido para as seguintes atividades incluídas no pacote UiPath.DocumentUnderstanding.ML.Activities: classificador de aprendizado de máquina e extrator de aprendizado de máquina.
Data de lançamento: 24 de outubro de 2022
A atividade ML Extractor Trainer agora pode suportar campos de vários valores.
A opção UsarOcrNoServidor está agendada para ser descontinuada em dezembro de 2022. Recomendamos utilizar o comportamento padrão. Mais detalhes sobre a descontinuação podem ser encontrados aqui.
O modelo de processo Studio do Document Understanding Process foi atualizado para uma nova versão.O pacote UiPath.DocumentUnderstanding.ML.Activities é uma dependência para este modelo. Aqui você pode conferir as notas de versão.
Corrigido um bug que estava causando erros de extração quando o Digitalizador era usado atualizando a biblioteca PDF e usando recursos híbridos de OCR.
Correção de um bug que fazia com que entradas inconsistentes fossem enviadas para o ML Extractor quando a imagem e o DOM eram necessários.
GetCapabilities
recebida do ML Extractor. O bug foi corrigido e funciona conforme o esperado.
Data de lançamento: 9 de maio de 2022
O pacote UiPath.DocumentUnderstanding.ML.Activities foi atualizado para .NET5 portátil, permitindo que você os execute em robôs Linux.
As atividades Machine Learning Extractor Trainer e Machine Learning Classifier Trainer receberam novos parâmetros agrupados sob o nome de Public Datasets, permitindo que você use conjuntos de dados públicos em vez de privados.
A atividade Machine Learning Extractor foi atualizada e agora o algoritmo de extração também pode ser usado no Forms AI, não apenas na lista de modelos de ML .
A atividade do Machine Learning Extractor agora pode ser usada com um endpoint público em cenários Airgapped.
Data de lançamento: 05 de outubro de 2021
Este lançamento traz como melhoria a atualização do cliente de telemetria para a versão 1.5.3.
O pacote UiPath.DocumentUnderstanding.ML.Activities foi atualizado para .NET5. Embora ambas as versões .NET continuem a ser suportadas, os projetos .NET5 só podem funcionar em arquiteturas de 64 bits.
Adicionados os parâmetros Dataset e Project à atividade Machine Learning Extractor Trainer , que permite selecionar onde carregar seus dados de treinamento em seu locatário do AI Center. Como resultado, os parâmetros Endpoint e MLSkill foram removidos da atividade.
Adicionado o parâmetro Endpoint à atividade do classificador de aprendizado de máquina que fornece a capacidade de usar a atividade com habilidades de ML públicas.
O Machine Learning Extractor agora pode ser integrado ao Forms AI (atualmente em Private Preview). O único requisito para que isso aconteça é certificar-se de que a opção UseServerSideOCR esteja desativada.
Data de lançamento: 29 de março de 2021
Lançadas as atividades Machine Learning Classifier e Machine Learning Classifier Trainer como parte da funcionalidade de classificação de documento de machine learning, o que ajuda você a classificar documentos usando um modelo de ML treinado personalizado. Machine Learning Classifier pode ser muito útil principalmente em cenários com alta diversidade em conjuntos de documentos.Para treinar o classificador e melhorar seus resultados com o tempo com a ajuda de validação humana, você pode usar a atividade irmã, Machine Learning Classifier Trainer.
Processamento aprimorado de arquivos PDF.
Data de lançamento: 11 de novembro de 2020
- Em caso de resposta de falha ao solicitar a lista de habilidades de ML do AI Fabric, a repetição automática agora também está disponível para códigos de status HTTP 5XX.
- Em caso de falha de rede, em vez de a operação de repetição ser bloqueada, o Machine Learning Extractor agora tenta novamente se conectar ao AI Fabric.
Data de lançamento: 20 de outubro de 2020
Data de lançamento: 5 de outubro de 2020
Lançada a nova atividade do Machine Learning Extractor Trainer que pode preparar dados para o novo treinamento do modelo de ML com base nos resultados da validação humana.
Adicionada a funcionalidade Obter ou atualizar recursos do extrator ao Machine Learning Extractor Trainer , que pode ser usado para mapear facilmente seus campos de taxonomia com os campos extratores disponíveis.
Um novo parâmetro foi incluído na atividade do Machine Learning Extractor , denominado Timeout (milisseconds). O parâmetro pode ser usado para especificar o tempo de espera por uma resposta do servidor antes que um erro seja lançado.
Alterado o texto da dica de ferramenta na propriedade UseServerSideOCR para o Machine Learning Extractor para indicar que ele é incompatível com o Machine Learning Extractor Trainer.
Data de lançamento: 24 de agosto de 2020
- Correção de um problema que, em alguns casos, retornava uma mensagem de erro
407ProxyAuthenticationRequired
para solicitações de autenticação Kerberos ou NTLM. Isso se aplica ao Machine Learning Extractor. - Correção de um problema que fazia com que a funcionalidade Get Capabilities do Machine Learning Extractor não funcionasse se um determinado endpoint fosse fornecido.
- Correção de um problema que fazia com que o Extrator de aprendizado de máquina gerasse um erro quando nenhum robô estava conectado.
Data de lançamento: 5 de junho de 2020
Novos recursos e melhorias
Esta versão traz uma nova opção disponível para a atividade do Machine Learning Extractor , chamada MLSkill, que pode ser usada para consumir modelos armazenados no AI Fabric.
Data de lançamento: 4 de maio de 2020
Novos recursos e melhorias
UseServerSideOCR
. Esta opção permite que você use os resultados de OCR recebidos da digitalização.
O Machine Learning Extractor agora declara sua taxonomia interna, permitindo que você mapeie facilmente os campos que ele pode extrair para os campos que você definiu em sua taxonomia, no assistente Configure Extractors do Data Extraction Scope.
- v1.24.0
- Disponibilidade geral de funcionalidades generativas
- Novos recursos e melhorias
- v1.21.2
- v1.21.1
- Linha do tempo de depreciação
- v1.17.1
- Novas funcionalidades e melhorias
- V1.18.0
- Novas funcionalidades e melhorias
- V1.17.0
- Novas funcionalidades e melhorias
- Correções de bugs
- v1.13.2
- Melhorias
- Correções de bugs
- v1.9.2
- Correção de bugs
- V1.9.1
- Novos recursos e melhorias
- V1.7.0
- Novos recursos e melhorias
- V1.5.2
- Correções de bugs
- V1.5.1
- Melhorias
- Correções de bugs
- V1.5.0
- Novos recursos e melhorias
- v1.2.2
- Correções de bugs
- V1.2.1
- V1.1.0
- V1.0.0
- Novos recursos e melhorias