- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Pipelines
- Document Manager
- Serviços de OCR
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Aprendizagem profunda
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guia do usuário do Document Understanding.
Serviços de OCR
Os serviços de OCR são usados para os seguintes propósitos:
- No momento da rotulagem de dados, ao importar documentos para o Document Manager. Os mecanismos disponíveis para esta etapa são UiPath Document OCR, Google Cloud Vision OCR e Microsoft Read OCR.
- Durante a execução, ao chamar modelos de fluxos de trabalho de RPA. Os mecanismos disponíveis para esta etapa são todos os mecanismos integrados à plataforma UiPath RPA, incluindo os acima, além do Abbyy Finereader, Microsoft OCR (legado), Microsoft Project Oxford OCR e Tesseract.
Na produção, recomendamos solicitar o OCR usando a atividade Digitize Document (digitalizar documento) em seu fluxo de trabalho e passar o Modelo de Objeto de Documento como entrada para a atividade que envia a solicitação para o modelo de ML. Para esse efeito, você precisa usar a atividade Machine Learning Extractor (Feed oficial).
Como uma conveniência rápida para fins de teste, você também pode configurar o OCR diretamente no AI Center (janela Configurações), mas isso não é recomendado para implantações de produção.
Configurando o serviço OCR no Document Manager e nos Pacotes de ML do Document Understanding no AI Center
A tabela abaixo mostra como configurar os seis tipos de mecanismo OCR suportados no Document Manager e no AI Center.
ocr.method
corresponde à lista suspensa do mecanismo de OCR na exibição de criação do pacote de ML no AI Center.
Mecanismo OCR |
Método de OCR |
Chave de OCR |
URL de OCR |
---|---|---|---|
UiPath |
UiPath Document OCR |
UiPath Automation Cloud Chave de API do Document Understanding Plano Enterprise |
|
|
Google Cloud Vision OCR |
Chave da API do Console do GCP |
|
Microsoft Read 2.0 On-Prem |
Microsoft Read OCR |
Nenhum |
|
Microsoft Read 2.0 Azure |
Microsoft Read OCR |
Chave de API para seu recurso do Portal do Azure |
|
Microsoft Read 3.2 On-Prem |
Microsoft Read OCR |
Nenhum |
|
Microsoft Read 3.2 Azure |
Microsoft Read OCR |
Chave de API para seu recurso do Portal do Azure |
|