UiPath Documentation
document-understanding
latest
false
重要 :
このコンテンツの一部は機械翻訳によって処理されており、完全な翻訳を保証するものではありません。 新しいコンテンツの翻訳は、およそ 1 ~ 2 週間で公開されます。

Document Understanding ガイド

既知の制限事項

このページでは、Document UnderstandingTM モダン プロジェクトの現在の仕様と、プロジェクトを最適に利用するためのパラメーターの概要について説明します。

プロジェクトベースの制限事項

説明 上限量
サポートされるファイル形式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
画像サイズの制限
  • 最小: 50 x 50 ピクセル
  • 最大: 10,000 x 10,000 ピクセル
ドキュメントの種類あたりの最大ページ数 5000

特定の時点を過ぎると、データを追加してもモデルのパフォーマンスは向上しません。この制限により、必要以上のドキュメントのアノテーションを行うことがなくなります。

ドキュメントあたりの最大ページ数 前世代モデルでは上限は 500、Helix Extractor モデルでは 100 です。
プロジェクトあたりの最大ページ数 30,000
プロジェクトあたりのドキュメントの種類の最大数 150
事前ラベル付けできる、ドキュメントあたりの最大ページ数 20

ドキュメントが 20 ページを超える場合は、最初の 20 ページでのみ事前アノテーションが行われます。

フィールドの最大数 300
並列処理される要求の最大数 10
すぐに使えるモデルで処理できる最大ページ数 20
デジタル化できる最大ファイル サイズ 160 MB
デジタル化できる、ドキュメントあたりの最大ページ数 500 ページ
分類名の文字数
  • 最小値: 1
  • 最大値: 50
分類の説明の文字数
  • 最小値: 0
  • 最大値: 2000
分類するドキュメント内の文字数
  • 最小値: 0
  • 最大値: 1e10 (事実上無制限)
分類器の数
  • 最小値: 1
  • 最大値: 50
実行時に UiPath Helix Extractor モデルが処理する最大ページ数 100 ページ

アクティビティまたは API ベースの制限事項

説明 上限量
サポートされるファイル形式
  • PNG
  • JPG/JPEG
  • PDF
  • TIF/TIFF
画像サイズの制限
  • 最小: 50 x 50 ピクセル
  • 最大: 10,000 x 10,000 ピクセル
デジタル化できる最大ファイル サイズ 160 MB
並列処理される要求の最大数 (モダン プロジェクトにデプロイされたプロジェクトのバージョン) 10
アクティビティでの生成 AI による抽出
  • ドキュメントの最小文字数: 10
  • ドキュメントの長さ: 500 ページ
  • フィールド: 150
  • プロンプトの長さ: 1000 文字
アクティビティでの生成 AI による分類
  • ドキュメントの長さ: 500 ページ
  • プロンプトの長さ: 1000 文字
すぐに使えるモデルで処理できる最大ページ数 20 ページ

既存のクラシック プロジェクトを移行する際の現在の制限事項

  • 現在、5,000 ページを超えるデータセットのインポートはサポートされていません。最初の 5,000 ページのみが正常にインポートされ、それ以降のページはインポートに失敗します。たとえば、データセットが 4,999 ページで構成されている場合に、4 ページのドキュメントをインポートしようとすると、このプロセスは成功しません。
  • バッチ名および対応するバッチ結果は、現在は利用できません。データがバッチに編成されている場合、バッチ結果の情報はまだ表示されません。ただし、情報は保存されています。
  • AI Center からのエクスポートはサポートされていません。Document Manager からのエクスポートのみがサポートされています。

その他の制限事項

  • プロジェクトのパフォーマンス ダッシュボードには、API または DocumentUnderstanding.Activities パッケージに含まれるアクティビティのいずれかを通じて、各プロジェクトを使用することにより処理されたドキュメントが表示されます。
  • 英国とインドでは、Insights のダッシュボードが利用できないため、[プロジェクトのパフォーマンス] ダッシュボードにアクセスできません。
  • モダン プロジェクトでバージョン 24.4 または 24.10 でカスタム モデルをトレーニングする場合、モデルが単一のドキュメント テンプレートでトレーニングされていると、データ抽出に失敗することがあります。これは、モデルが 1 つのレイアウトに過剰に適合し、視覚的に類似したドキュメントであっても抽出エラーが発生するためです。より多様なデータセットを使用してモデルをトレーニングすることで、精度を向上できます。
  • [Document Understanding プロジェクト抽出器] アクティビティを使用する場合、プロジェクト名には、Document Understanding プロジェクトで元々定義されていた名前とまったく同じ文字種を使用する必要があります。
  • [ドキュメントの種類] 分類器は、ヘブライ語、中国語、日本語など、アルファベット以外の文字で記述されたドキュメントをサポートしていません。このようなドキュメントにドキュメントの種類による分類を使用すると、パイプラインが失敗したり、エンコード関連のエラーなどの予期しない結果が生成されたりする可能性があります。分類を使用しないのであれば、ドキュメントの抽出はアルファベット以外の言語でも動作可能です。

このページは役に立ちましたか?

接続

ヘルプ リソース サポート

学習する UiPath アカデミー

質問する UiPath フォーラム

最新情報を取得