- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- 1040 - Pacote de ML
- 1040 Schedule C - Pacote de ML
- 1040 Schedule D - Pacote de ML
- 1040 Schedule E - Pacote de ML
- 1040x - Pacote de ML
- 3949a - Pacote de ML
- 4506T - Pacote de ML
- 709 - Pacote de ML
- 941x - Pacote de ML
- 9465 - Pacote de ML
- ACORD125 - Pacote de ML
- ACORD126 - Pacote de ML
- ACORD131 - Pacote de ML
- ACORD140 - Pacote de ML
- ACORD25 - Pacote de ML
- Extratos bancários - Pacote de ML
- ConhecimentoDeEmbarque - Pacote de ML
- Certificado de incorporação - Pacote de ML
- Certificado de origem - Pacote de ML
- Cheques - Pacote de ML
- Certificado de produtos filhos - Pacote de ML
- CMS1500 — Pacote de ML
- Declaração de Conformidade da UE - Pacote de ML
- Demonstrações financeiras - Pacote de ML
- FM1003 - Pacote de ML
- I9 - Pacote de ML
- Cartões de identificação - Pacote de ML
- Faturas - Pacote de ML
- FaturasAustrália - Pacote de ML
- FaturasChina - Pacote de ML
- Faturas em hebraico - Pacote de ML
- FaturasÍndia - Pacote de ML
- FaturasJapão - Pacote de ML
- Envio de faturas - Pacote de ML
- Romaneio de carga - Pacote de ML
- Contracheques — Pacote de ML
- Passaportes - Pacote de ML
- Ordens de compra - Pacote de ML
- Recibos - Pacote de ML
- AvisosDePagamento - Pacote de ML
- UB04 - Pacote de ML
- Contas de serviços - Pacote de ML
- Títulos de veículos - Pacote de ML
- W2 - Pacote de ML
- W9 - Pacote de ML
- Endpoints públicos
- Idiomas suportados
- Painéis de insights
- Dados e segurança
- Lógica de licenciamento e carregamento
- Como fazer
Conceitos-chave
Familiarize yourself with the core concepts around UiPath® Document UnderstandingTM.
Active learning is our modern approach to creating models for Document UnderstandingTM.
O aprendizado ativo fornece uma experiência interativa na qual o algoritmo de aprendizado pode consultar o usuário para rotular dados com as saídas desejadas. Esse processo ajuda a reduzir o tempo e os dados necessários para treinar um modelo de machine learning em até 80%. A IA é usada para orientar o processo, que inclui anotação automática, que normalmente é a tarefa mais demorada. O modelo também fornece recomendações de especialistas para melhorar a precisão usando os conjuntos de dados mais informativos.
Usando o aprendizado ativo, você também pode monitorar suas automações por meio de recursos analíticos.
Um tipo de documento refere-se à classificação ou categorização de um documento com base em seu conteúdo, formato, finalidade ou outros fatores de distinção. Alguns exemplos podem incluir faturas, recibos, contratos, relatórios, prontuários médicos, documentos legais e outros.
- Estruturado: os documentos destinam-se a coletar informações em um formato específico. Por exemplo, pesquisas, declarações de imposto, passaportes ou licenças são todos documentos estruturados.
- Semiestruturado: documentos que não seguem um formato estrito e não estão associados a campos de dados especificados. Os documentos semiestruturados incluem faturas, recibos, contas de serviços públicos, extratos bancários e outros.
- Não estruturado: documentos que não seguem um modelo específico ou organizado. Por exemplo, contratos, locações ou artigos de notícias são todos documentos não estruturados.
Para saber mais sobre os tipos de documento, consulte a seção Tipos de documento.
Os modelos de ML são como assistentes virtuais que foram treinados para aprender com dados e fazer previsões ou tomar decisões. Esses modelos são essencialmente algoritmos que aprendem a reconhecer padrões com base em dados históricos. Quanto mais dados aos quais eles estiverem expostos, mais eles podem aprimorar suas previsões ou decisões ao longo do tempo.
You can find several out of the box ML models in Document UnderstandingTM. These models help you classify and extract any commonly occurring data points from semi-structured or unstructured documents, with no setup required.
Confira a página de modelos prontos para uso para ver a lista completa de modelos pré-treinados e seus campos.
Os modelos de ML podem ser treinados em uma maioria de idiomas, desde que o OCR reconheça o documento e o texto com alta confiança.
O reconhecimento óptico de caracteres (OCR) é uma tecnologia especial usada para converter diferentes tipos de documentos, como documentos de papel digitalizados, arquivos PDF ou imagens obtidas por uma câmera digital, em dados editáveis e pesquisáveis.
A precisão de um mecanismo de OCR depende da qualidade do documento original. Um texto limpo e bem formatado em uma fonte legível normalmente produz a melhor saída.
For more information on the languages supported by the OCR engines options provided by UiPath®, check the OCR Supported Languages page.