Document Understanding - outubro de 2021

document-understanding

latest

false

Notas de versão do Document Understanding

Document Understanding para Automation Cloud e Test Cloud
Document Understanding para Automation Cloud e Test Cloud Setor Público
- 2025
- 2024
Document Understanding para Automation Cloud e Test Cloud Dedicated
- 2025
Pacotes de ML e pontos de extremidade públicos
- Pacotes de ML gerais e atualizações de pontos de extremidade públicos
- Pacotes de ML e histórico de versões de pontos de extremidade públicos

Importante :

A localização de um conteúdo recém-publicado pode levar de 1 a 2 semanas para ficar disponível.

Outubro de 2021

General Release Notes - Document Understanding

19 de outubro de 2021

Melhorias

Campos com menos de 10 documentos rotulados podem ser excluídos sem confirmação.

Correções de bugs

Corrigido um bug que afetava arquivos importados com o mesmo nome.
Corrigido um bug no Google OCR que gerava um erro em documentos com páginas vazias.
Corrigido um bug que exibia incorretamente a contagem de arquivos na caixa de diálogo Importar dados para importações de conjuntos de dados do Validation Station ou Data Manager.

Problemas conhecidos

A exportação padrão (nível de documento) só funciona com pacotes de ML versão 21.10 ou posterior no AI Center. A versão aparece na coluna Change Log da visualização dos Pacotes de ML no AI Center. Para versões mais antigas, use a caixa de seleção Exportação compatível com versões anteriores na caixa de diálogo Exportar arquivos.

1.º de outubro de 2021

Suporte a documentos de várias páginas

O Data Manager agora suporta documentos de várias páginas. Esta é uma grande atualização que afeta todos os aspectos de um fluxo de Machine Learning:

Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.

Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.

Labeling: more convenient labeling due to natural scrolling through document pages.

Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.

Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.

Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.

Melhorias

Exportar esquema de suporte usando o botão de opção na caixa de diálogo Exportar arquivos.

O tamanho máximo de importação aumentou para 2 GB ou 2.000 páginas.

Conjunto de teste renomeado para Conjunto de avaliação para consistência com os Pipelines de Avaliação do AI Center.

O botão Prever aparece por padrão na barra de gerenciamento, mas as configurações de pré-rotulagem precisam ser configuradas para que o botão seja habilitado.

Todas as restrições sobre o número de amostras por campo removidas das exportações de conjuntos de avaliação.

Adicionado o nome da sessão Data Manager ao lado do nome do arquivo na barra de gerenciamento para identificar mais facilmente a sessão em que você está trabalhando no caso de várias guias do Data Manager abertas ao mesmo tempo.

Suporte para documentos de idioma chinês.

Melhorias de acessibilidade.

Localização para Português-Portugal, Russo e Turco.

Problemas conhecidos

O modelo Faturas China não formata datas em estilo chinês no formato padrão aaaa-mm-dd. Isso será melhorado nas próximas versões.
A análise de datas do Data Manager é inconsistente com a análise feita por modelos de ML durante a execução. Se você perceber que as datas estão sendo analisadas incorretamente no Data Manager, é provável que sejam analisadas corretamente na previsão do modelo durante a execução. Este é um problema conhecido e será resolvido em um patch futuro.
No momento, usar a opção Prever com Endpoints públicos pré-rotula apenas as primeiras 10 páginas de um documento. Este é um problema conhecido e um aprimoramento será incluído em um próximo patch. Usar a opção Prever com Habilidades de ML no AI Center, no entanto, não impõe essa limitação.

Nesta página

General Release Notes - Document Understanding
19 de outubro de 2021
1.º de outubro de 2021

Esta página foi útil?

AnteriorNovembro de 2021

AvançarAgosto de 2021

General Release Notes - Document Understanding​

19 de outubro de 2021​

Melhorias​

Correções de bugs​

Problemas conhecidos​

1.º de outubro de 2021​

Suporte a documentos de várias páginas​

Melhorias​

Problemas conhecidos​

Esta página foi útil?

General Release Notes - Document Understanding

19 de outubro de 2021

Melhorias

Correções de bugs

Problemas conhecidos

1.º de outubro de 2021

Suporte a documentos de várias páginas

Melhorias

Problemas conhecidos