- Visão geral
- Processo do Document Understanding
- Tutoriais de início rápido
- Componentes do framework
- Pacotes de ML
- Pipelines
- Gerenciador de Dados
- Serviços de OCR
- Document Understanding implantado no Automation Suite
- Document Understanding implantado no AI Center autônomo
- Licenciamento
- Referências
- UiPath.Abbyy.Activities
- UiPath.AbbyyEmbedded.Activities
- UiPath.DocumentUnderstanding.ML.Activities
- UiPath.DocumentUnderstanding.OCR.LocalServer.Activities
- UiPath.IntelligentOCR.Activities
- UiPath.OCR.Activities
- UiPath.OCR.Contracts
- UiPath.DocumentProcessing.Contracts
- UiPath.OmniPage.Activities
- UiPath.PDF.Activities
Guia do usuário do Document Understanding.
Sobre o Data Manager
O UiPath Document Manager é um aplicativo web leve, que permite aos usuários preparar, revisar e fazer correções nos conjuntos de dados necessários para treinamento e avaliação de modelos de Machine Learning do Document Understanding.
Aqui estão os métodos de implantação no local (On-Premises):
- Data Manager no AI Center On Premises. O pacote já está disponível (versão GA) e é totalmente suportado para cenários de produção. Não há limitação quanto ao tamanho dos conjuntos de dados que podem ser importados, com exceção de Retreinamento automático, que ainda tem o limite de 2.000 páginas ou 2 GB por importação. Para todos os métodos de implantação do AI Center disponíveis para a versão local (On Premises), consulte esta página.
O Data Manager permite que vários usuários executem uma variedade de operações envolvidas no gerenciamento de lotes de dados, preparação de dados e configuração de modelo:
Defina e configure os campos a serem extraídos por um modelo de ML.
Importe documentos para rotulagem.
Pré-rotule documentos usando um modelo de ML preexistente e pronto para uso, como Extração de Fatura ou Extração de Recibo, fornecido pela UiPath, ou usando um modelo treinado utilizando o AI Center.
Rotule documentos.
Exporte documentos no formato esperado pelos Pipelines de Treinamento do AI Center.
A interface do Data Manager contém os seguintes painéis:
Exibido na parte superior da página no Data Manager.
Permite realizar várias operações: navegar entre documentos, excluir/restaurar um documento, pesquisar/filtrar documentos, executar previsões de modelos de IA, importar e exportar documentos.
Aqui estão as opções disponíveis na barra de gerenciamento:
Opção |
Ícone |
Description |
---|---|---|
Navegação |
|
Navegue entre os documentos que correspondam ao filtro ativo. Entre as duas setas, um contador é exibido. Ele ilustra o número do documento atual do número total de documentos que correspondem à pesquisa/filtro ativo. |
|
Pesquisar ou filtrar documentos. O filtro também é aplicado ao exportar documentos. Você também pode filtrar por palavras em um documento ou por nomes de documentos. | |
Excluir / Restaurar |
/ |
Excluir ou restaurar um documento. Os documentos excluídos podem ser encontrados no filtro excluído. |
Predict |
|
Execute as previsões do modelo de IA e exiba os resultados. Após configurar a Pré-rotulagem, o botão é habilitado na barra de gerenciamento. Clique nele para pré-rotular o documento atual. No momento, usar a opção Prever com Pontos de extremidade públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e uma correção está em andamento. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação. |
|
Abra a caixa de diálogo Importar dados. | |
|
Abra a caixa de diálogo Exportar arquivos. | |
|
Clique no ícone para baixar um arquivo Zip contendo o documento original. | |
|
Defina as configurações de OCR e Pré-rotulagem ou acesse o painel Como fazer.... Veja abaixo. |
Fazer download
.jpeg
também são baixadas.
Nome do documento, tipo e nome da sessão
No lado direito do ícone, você pode visualizar o nome do documento atualmente ativo, seu tipo e o nome da sessão.
Há três tipos de documentos:
- Documento de treinamento
- Documento de validação
- Documento de avaliação
Os documentos de treinamento e validação fazem parte dos conjuntos de dados de treinamento usados pelos Pipelines de treinamento.
Os documentos de avaliação são ignorados pelos pipelines de treinamento e devem ser usados apenas pelos pipelines de avaliação no AI Center. Esses documentos são os que foram marcados como avaliação selecionando a caixa de verificação Faça deste um conjunto de avaliação na caixa de diálogo Importar dados.
Configurações
O botão de configurações tem duas opções disponíveis:
- Configurações, onde você pode configurar o serviço de OCR ou pré-rotulagem
- Como fazer..., cujo propósito é ser um menu de ajuda
OCR
Para importar documentos para o Data Manager, é obrigatório configurar um serviço de OCR.
As seguintes opções estão disponíveis:
Escolher o mecanismo de OCR a ser usado para importar documentos para o Data Manager é uma decisão importante.
Recomenda-se usar o mesmo OCR para importar dados de treinamento (tempo de treinamento), pois será usado quando o modelo for implantado (tempo de execução).
Idealmente, você deve experimentar alguns diferentes para identificar qual funciona melhor em seus documentos e só então decidir.
As opções no locai são:
- Contêiner UiPath OCR que suporta os principais idiomas da Europa Ocidental;
- Contêiner Microsoft Read (disponível como pré-visualização pela Microsoft) também oferece boa cobertura de idioma;
- UiPath OCR ML Skills implantado no AI Center no local v2020.10 ou posterior.
As opções na nuvem são:
- UiPath Document OCR - https://du.uipath.com/ocr;
- Google Cloud Vision OCR, que tem a melhor cobertura de idioma;
- Google Cloud OCR para japonês ideal para leitura de documentos em japonês;
- Microsoft Read OCR.
A configuração do OCR requer que o serviço de OCR tenha um URL. Esses são os URLs possíveis que você pode usar:
- URLs públicos como https://du.uipath.com/ocr ou URLs de terceiros do Google Vision OCR ou Microsoft Read OCR
- URLs do contêiner independente UiPath Document OCR fornecido pela UiPath implantada no local
-
URLs do pacote de ML de OCR implantado como habilidades de ML que foram disponibilizadas publicamente (GA) no AI Center On-Premises v2020.10 ou posterior
Importante:Se estiver executando o OCR na mesma máquina que o Data Manager, não uselocalhost
para se referir à máquina local, mas sim o endereço IP ou o nome de domínio da máquina local.No caso de URLs de OCR implantados como Habilidade de ML pública no AI Center no local, use o URL conforme aparece na tela de detalhes da Habilidade de ML do AI Center.
A chave de API correspondente para o mecanismo de OCR selecionado. Por exemplo, para UiPath Document OCR, você precisa usar a chave de API do Document Understanding. Obrigatório para Data Manager Cloud e Data Manager On-Prem Online. Não é necessário para o Data Manager On-Prem Air-gapped.
Pré-rotulamento
Se você já possui um modelo que pode extrair alguns dos campos que precisam de rotulagem e há apenas alguns campos extras que exigem rotulagem manual, você pode economizar muito tempo usando o recurso de pré-rotulagem do Data Manager.
As seguintes opções estão disponíveis:
A pré-rotulagem exige que o modelo de ML tenha um URL. Esses são os URLs possíveis que você pode usar:
- URLs públicos, como https://du.uipath.com/ie/invoices ou https://du.uipath.com/ie/purchase_orders
- Veja a lista completa de pontos de extremidade aqui
- URLs de habilidades de ML que foram tornados públicos no AI Center no local ou no AI Center Cloud
As habilidades de ML no AI Center On-Premises implantadas em ambientes isolados (air-gapped) não podem ser usadas para pré-rotulagem.
localhost
para se referir à máquina local, mas sim o endereço IP ou o nome de domínio da máquina local.
No caso de URLs de habilidades de ML públicas no AI Center no local, use o URL conforme aparece na tela de detalhes da habilidade de ML do AI Center.
A chave de API do Document Understanding. Obrigatório para Data Manager Cloud e Data Manager On-Prem Online. Não é necessário para o Data Manager On-Prem Air-gapped.
Como...
A opção Como fazer... acessa o menu de ajuda do Data Manager.
Nela, você pode encontrar:
- A versão do Data Manager
- O link Documentação que leva a esta página de documentação.
- A seção Controles de rotulagem que exibe os controles a serem usados ao manipular dados.
- A seção Atalhos do documento que exibe os atalhos usados para executar várias operações, como navegação e dimensionamento da interface do usuário.
- A seção Configuração que exibe detalhes sobre a configuração da instância conforme executada durante a instalação.
Os campos de coluna têm as seguintes opções:
- Criar novo campo de coluna
- Editar campo
- Expande/recolhe valores de campo de coluna
Para obter mais detalhes sobre campos de coluna, visite esta seção.
Os campos regulares têm as seguintes opções:
- Cria um novo campo regular
- Editar campo
Para obter mais detalhes sobre campos regulares, visite esta seção.
Os campos de classificação têm as seguintes opções:
- Cria um novo campo de classificação
- Editar campo
Para obter mais detalhes sobre campos de classificação, visite esta seção.
Ctrl
+ rolagem do mouse.
Você pode rotular documentos selecionando as caixas de palavras e atribuindo-as a um campo pressionando uma tecla. Você também pode clicar com o botão direito do mouse na caixa de palavras e verificar as informações extraídas.
Para obter mais detalhes sobre como rotular documentos, visite esta página.
Quando você abre uma nova sessão do Data Manager ou quando tem um filtro vazio, algumas diretrizes são exibidas na visualização do documento:
Além disso, as falhas de carregamento também são exibidas na visualização do documento: