- Document Understanding for Automation Cloud and Test Cloud
- Document Understanding for Automation Cloud and Test Cloud Public Sector
- Document Understanding for Automation Cloud and Test Cloud Dedicated
- ML packages and public endpoints

Notas de versão do Document Understanding
Outubro de 2021
General Release Notes - Document Understanding
19 de outubro de 2021
Melhorias
Campos com menos de 10 documentos rotulados podem ser excluídos sem confirmação.
Correções de bugs
- Corrigido um bug que afetava arquivos importados com o mesmo nome.
- Corrigido um bug no Google OCR que gerava um erro em documentos com páginas vazias.
- Corrigido um bug que exibia incorretamente a contagem de arquivos na caixa de diálogo Importar dados para importações de conjuntos de dados do Validation Station ou Data Manager.
Problemas conhecidos
- A exportação padrão (nível de documento) só funciona com pacotes de ML versão 21.10 ou posterior no AI Center. A versão aparece na coluna Change Log da visualização dos Pacotes de ML no AI Center. Para versões mais antigas, use a caixa de seleção Exportação compatível com versões anteriores na caixa de diálogo Exportar arquivos.
1.º de outubro de 2021
Suporte a documentos de várias páginas
O Data Manager agora suporta documentos de várias páginas. Esta é uma grande atualização que afeta todos os aspectos de um fluxo de Machine Learning:
Import: you can upload documents up to 150 pages; to bypass this limit, at the risk of an unstable labeling experience, select the Enable large documents checkbox from the Import data dialog box.
Prelabeling: the document is prelabeled as a whole, producing the same results as running in RPA workflow, but it takes more time in case of larger documents. See also Known Issues below.
Labeling: more convenient labeling due to natural scrolling through document pages.
Export: done by default at document level. Should you want to export the documents at page level, select the Backwards-compatible export checkbox from the Export files dialog box; this is also recommended if the model accuracy produced by the default export is below expectations.
Training: on most scenarios, the models trained with the new document level exported datasets should have the same performance with the page level Backwards-compatible export. However, if the models perform below expectations, we recommend that you retry the training using a Backwards-compatible export as well, in case it might produce better results.
Evaluation: this is the main motivation for the multi-page document support feature, since Evaluations scores will more accurately reflect run time performance. Please note that this assumes that each multi-page document contains a single logical document. For instance, if you import 20 page file packets containing 10 invoices of 2 pages each, then this should not be used as part of Evaluation sets. However, they can be used as part of Training sets but only if you export using the Backwards-compatible option enabled.
Melhorias
Exportar esquema de suporte usando o botão de opção na caixa de diálogo Exportar arquivos.
O tamanho máximo de importação aumentou para 2 GB ou 2.000 páginas.
Conjunto de teste renomeado para Conjunto de avaliação para consistência com os Pipelines de Avaliação do AI Center.
O botão Prever aparece por padrão na barra de gerenciamento, mas as configurações de pré-rotulagem precisam ser configuradas para que o botão seja habilitado.
Todas as restrições sobre o número de amostras por campo removidas das exportações de conjuntos de avaliação.
Adicionado o nome da sessão Data Manager ao lado do nome do arquivo na barra de gerenciamento para identificar mais facilmente a sessão em que você está trabalhando no caso de várias guias do Data Manager abertas ao mesmo tempo.
Suporte para documentos de idioma chinês.
Melhorias de acessibilidade.
Localization for Portuguese-Portugal,Russian and Turkish.
Problemas conhecidos
- O modelo Faturas China não formata datas em estilo chinês no formato padrão aaaa-mm-dd. Isso será melhorado nas próximas versões.
- A análise de datas do Data Manager é inconsistente com a análise feita por modelos de ML durante a execução. Se você perceber que as datas estão sendo analisadas incorretamente no Data Manager, é provável que sejam analisadas corretamente na previsão do modelo durante a execução. Este é um problema conhecido e será resolvido em um patch futuro.
- At the moment, using the Predict option with Public Endpoints prelabels only the first 10 pages of a document. This is a known issue and an enhancement will be included in an upcoming patch. Using the Predict option with ML Skills in AI Center, however, does not impose such a limitation.