活动
最新
False
横幅背景图像
Integration Service 活动
上次更新日期 2024年4月23日

将简短语音转换为文本

描述

读取时长不到 1 分钟的音频文件并生成文本。

备注:

我们的识别 API 目前可处理时长不超过 1 分钟的音频文件。 此包的未来迭代将包含 longrunningrecognize 功能,预计该功能可支持长度长达 120 分钟的文件。

项目兼容性

Windows | 跨平台

配置

  • 连接 ID - 在 Integration Service 中建立的连接。 访问下拉菜单以选择、添加或管理连接。

  • 音频文件- 需要转换为语音的音频文件。 音频文件的最大长度必须为 1 分钟。 此字段支持IResource类型输入。
  • 语音语言- 以标签表示的语音语言,例如 en-US 。 从可用下拉列表中选择一个选项。 此字段支持String类型输入。
  • 音频编码” - 音频文件的编码。 此字段支持String类型输入。
  • 以赫兹为单位的采样率 - 所有RecognitionAudio消息中发送的音频数据的采样率(以赫兹为单位)。 有效值为: 8000-48000。 默认值设置为16000 ,即最佳值。
管理属性

使用“管理属性”向导配置或使用对象的任何标准或自定义字段。 您可以选择字段以将其添加到活动画布中。 添加的标准或自定义字段可在“属性”面板(在 Studio Desktop 中)或“显示其他选项”下(在 Studio Web 中)下找到。

其他选项
  • “启用词时间偏移量” - 如果设置为“True”,则结果包括词列表以及这些词的开始时间偏移量和结束时间偏移量(时间戳)。 默认值为 False。
输出
  • 文本- 转换后的文本。 自动生成的输出变量。
  • 描述
  • 项目兼容性
  • 配置

此页面是否有帮助?

获取您需要的帮助
了解 RPA - 自动化课程
UiPath Community 论坛
Uipath 白色徽标
信任与安全
© 2005-2024 UiPath. All rights reserved.