- Visão geral
- Introdução
- Criação de modelos
- Consumo de modelos
- Detalhes do modelo
- Endpoints públicos
- 1040 – tipo de documento
- 1040 Agendamento C – tipo de documento
- 1040 Agendamento D – tipo de documento
- 1040 Agendamento E – tipo de documento
- 1040x – tipo de documento
- 3949a – tipo de documento
- 4506T – tipo de documento
- 709 – tipo de documento
- 941x – tipo de documento
- 9465 – tipo de documento
- ACORD125 – tipo de documento
- ACORD126 – tipo de documento
- ACORD131 – tipo de documento
- ACORD140 – tipo de documento
- ACORD25 – tipo de documento
- Extratos bancários – tipo de documento
- Conhecimentos de embarque – tipo de documento
- Certificado de incorporação – tipo de documento
- Certificado de origem – tipo de documento
- Verificações – tipo de documento
- Certificado de produto infantil – tipo de documento
- CMS 1500 – tipo de documento
- Declaração de conformidade UE – tipo de documento
- Demonstrações financeiras – tipo de documento
- FM1003 – tipo de documento
- I9 – tipo de documento
- Cartões de identificação – tipo de documento
- Faturas – tipo de documento
- Faturas2 - tipo de documento
- Faturas Austrália – tipo de documento
- Faturas China – tipo de documento
- Faturas hebraicas – tipo de documento
- Faturas Índia – tipo de documento
- Faturas Japão – tipo de documento
- Faturas de Envio – tipo de documento
- Listas de embalagem – tipo de documento
- Holerites – tipo de documento
- Passaportes – tipo de documento
- Ordens de compra – tipo de documento
- Recibos – tipo de documento.
- Recibos2 - tipo de documento
- Recibos Japão – tipo de documento
- Avisos de Remessa – tipo de documento
- UB04 – tipo de documento
- Divulgações de fechamentos de hipotecas dos EUA - tipo de documento
- Contas de serviços públicos – tipo de documento
- Títulos de veículos – tipo de documento
- W2 – tipo de documento
- W9 – tipo de documento
- Idiomas suportados
- Painéis de insights
- Document Understanding implantado no Automation Suite
- Geração de logs
- Lógica de licenciamento e carregamento
- Como fazer
- Solução de problemas

Document Understanding modern projects user guide
Migração de projetos clássicos
Use as instruções desta página para migrar um projeto baseado no AI Center. Há duas etapas principais na migração de um projeto:
- Exporte o conjunto de dados do projeto baseado no AI Center.
- Importar o conjunto de dados para o projeto moderno.
Limitações atuais
- Atualmente, a importação de conjuntos de dados maiores que 3000 páginas não é compatível. Apenas as 3000 páginas iniciais serão importadas com sucesso, com quaisquer páginas adicionais falhando ao fazê-lo. Por exemplo, se seu conjunto de dados consistir em 2999 páginas e você tentar importar um documento de quatro páginas, o processo não será bem-sucedido.
- Os nomes de lote e os resultados de lote correspondentes não estão disponíveis no momento. Se seus dados forem organizados em lotes, essas informações ainda não serão exibidas, mas serão salvas.
- As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.
Exportar um conjunto de dados de um projeto com base no AI Center
-
Open AI Center and navigate to the Data Labeling page.
-
Select the Data Labeling Session you want to migrate.

-
Once Document Manager is open, from the Filter documents drop-down list, select Training and validation set.
Figure 1. Training and validation set

-
Selecione Exportar.
-
Leave Current search results selected and fill in a name for your export job.
-
Select Download.
Figure 2. Download export

Importação de um conjunto de dados
-
Navegue até e abra o projeto para o qual você deseja importar dados.
-
Select Add document type and create a new custom document type.
Figure 3. Add document type

-
On the new custom document type, select Upload and choose the zip file of the classic project you exported. Wait for the upload to finish.
Observação:As exportações do AI Center não são compatíveis. Apenas exportações do Document Manager são compatíveis.
Figure 4. Upload processing

Depois que o upload for concluído, os documentos estarão disponíveis para treinamento.
Treinamento do modelo
Once the dataset is imported, the model training starts. After the training is complete, the model score is displayed. To check detailed model scores, select the score, and then Detailed model scores.

This action takes you to the Measure page where you can access detailed model metrics.
Quando o mesmo conjunto de dados é usado para treinar um ML duas vezes, você pode observar métricas de modelos ligeiramente diferentes. Isso pode ocorrer devido a alguns motivos:
- Initialization: Machine learning uses optimization methods that need initial guesses to trigger the optimization algorithms. Different initial guesses during each training could lead to various outcomes due to the unpredictable nature of these algorithms.
- Random state: Some algorithms use randomness in their operations. For instance, when training a neural network, procedures like stochastic gradient descent and mini-batch gradient descent introduce randomness. Therefore, even with identical initial model parameters and datasets, the performance of models may vary in different runs.
- Regularization: Certain algorithms include a penalty term that encourages the model to maintain smaller weights. Due to the randomness involved, the model could operate with a different weight set each time.
No entanto, é vital observar que essas diferenças menores não implicam necessariamente que um modelo é superior ou inferior a outro. Mesmo com métricas ligeiramente variadas, a capacidade dos modelos de compreender dados permanece essencialmente a mesma, desde que as diferenças não sejam significativamente grandes. Além disso, repetir esse processo várias vezes e obter uma média deve render métricas de desempenho semelhantes.
Alterar o modelo base no Gerenciador de tipos de Documentos
Se houver uma diferença significativa entre os resultados do modelo de seu projeto clássico e o moderno, isso poderia ser causado por um modelo base diferente. de Para alterar o modelo base, prossiga com as seguintes etapas:
-
Select the three-dot menu from your custom document type and choose Document type manager.

-
Navigate to the Settings tab.
-
Select the desired model from the Base model drop-down list.

-
After making your selection, select Save. To exit, select Back.
Tipos de exportação
For classic projects, there are various methods for exporting data. Not all types of exported data are compatible for importing into modern projects. To compare the model results across both project types,filter documents by Training and validation set and select Choose search results to export the dataset. For more information on each option, check the following table.
| Tipo de exportação | Dados exportados | O que acontece com dados importados |
|---|---|---|
| Resultados da pesquisa atual | Exports the current filtered dataset. Use it together with the Training and validation set filter. | Documents tagged as training are used to train the model. Documents tagged as validation are used to measure the model performance. Tip: To compare model results between two project types, always export and import the dataset as Train and validation . |
| Tudo rotulado | Exporta todos os documentos anotados do conjunto de dados:
|
|
| Esquema | Exporta a lista de campos e suas respectivas configurações. | Um esquema é importado se não houver nenhum. Se um esquema já estiver definido, a importação falhará. |
| Todos | Exporta todos os documentos anotados e não anotados. |
|
Importação de esquemas
Você pode importar esquemas junto com conjuntos de dados para projetos modernos. Siga estas etapas para importar um esquema:
- Create a custom document type in the Build section.
- Importe o arquivo zip que contém o esquema.
- As importações de esquema são limitadas a tipos de documentos personalizados sem esquemas pré-existentes.
- Se você importar um esquema para um tipo de documento que já contém um esquema, a importação falhará.