国外实时翻译软件-国外实时翻译软件文档介绍内容-移动阿里云

语音翻译

语音翻译是阿里云的实时翻译服务，支持多语言语音的实时互译。本文深度解析其核心功能、技术优势与集成指南，赋能您的应用打破语言壁垒，实现全球化沟通。

基础使用类

本文汇总了您在使用通义听悟服务时的基础使用问题。为什么我开通了智能语音交互，却无法使用通义听...通义听悟的实时记录功能支持实时翻译，中、英、日、韩语间的双向实时互译；识别语音为中英自由说，可实时翻译为中文、英文、中文+英文。

计费说明

6.6 3000～4999小时 4.7 5000小时及以上 3.4 实时翻译 8元/小时 0～299小时 8 300～999小时 7.5 1000～2999小时 7 3000～4999小时 6.5 5000小时及以上 6 离线翻译 1.2元/小时 0～299小时 0.9 300～999小时 0.8 1000～2999小时 0.7 3000～...

计费概述

多模态多模态按时长计费包含视频PPT提取及PPT摘要功能翻译 实时翻译 按翻译音频的时长计费根据实际翻译音频的时长计费。费用与实时会议记录叠加统计。使用中英自由说翻译目标语言为中文+英文时，计费时长翻倍。离线翻译

SDK变更公告

列举出SDK版本演进所做的重大变更。SDK版本3.0起，底层架构发生变动，SDK 3....支持实时翻译和字幕。支持对视频进行标注。更多特性，请见功能发布记录（3.0）。由于采用了全新设计，早期版本有些功能还没有在3.0提供，这些包括：耳返，美声。

产品概述

0.064 元/小时多模态多模态（视频 PPT 提取+PPT摘要）可选 0.64 元/小时翻译 实时翻译 离线翻译可选 4 元/小时 0.5 元/小时纯文本处理 0.95 元/千次说明根据输入文本量统计，输入内容每150个tokens计为1次，不满150个也计为1次。...

Java SDK

transcriptionEnabled(true)/设置是否开启实时识别.translationEnabled(true)/设置是否开启实时翻译.translationLanguages(new String[]{"en"})/设置翻译目标语言.build();try { translator.call(param,new ResultCallback ...

Java SDK

transcriptionEnabled(true)/设置是否开启实时识别.translationEnabled(true)/设置是否开启实时翻译.translationLanguages(new String[]{"en"})/设置翻译目标语言.build();try { translator.call(param,new ResultCallback ...

通义听悟实时流

通过通义听悟集成的停止实时任务操作停止实时任务功能介绍魔笔平台的通义听悟实时流功能支持以下特点：实时转写：语音输入可以实时转换为文字，并在集成操作中配置了翻译功能的情况下支持实时翻译。集成操作联动：与其他魔笔平台功能...

Python SDK

用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译。在线体验：模型体验说明一句话识别/翻译能够直接对一分钟内的音频流（无论是从外部设备如麦克风获取的音频流，还是从本地文件读取的...

Python SDK

用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验说明一句话识别/翻译能够直接对一分钟内的音频流（无论是从外部设备如麦克风获取的音频流，还是从本地文件...

实时音视频翻译-通义千问

qwen3-livetranslate-flash-realtime 是视觉增强型实时翻译模型，支持 18 种语言（中、英、俄、法等）互译，可同时处理音频与图像输入，适用于实时视频流或本地视频文件，利用视觉上下文信息提升翻译准确性，并实时输出高质量的翻译文本与...

功能发布记录

自定义Prompt支持句子ID 自定义Prompt支持句子ID的内容处理，方便原文内容定位各类问题修复修复身份识别错误的问题修复敏感词不生效的问题 2025年4月30日功能名称功能说明 实时翻译中间结果增加时间戳信息 实时翻译的中间结果增加时间...

功能特性

融合实时媒体处理能力、纯幕和实景抠像合成、ASR语音转文本及实时翻译、视频AI及实时图文特效等多种直播、互动能力，可满足标准直播、广电级专业直播、轮播台、虚拟演播厅等各种直播场景，即开即用简单便捷。云导播台直播审核支持视频...

通用型导播台指南

实时翻译进一步降低了跨国多语言用户对直播流内容理解的门槛，在跨境电商直播、跨国活动直播中都有很好实践应用。单击实时字幕，弹出字幕组件窗口。设置组件名称、字体样式、尺寸、位置、视频源、源语言、翻译语言，可在左侧区域进行效果...

object list languagePairs 模型支持的语向 object list 文本实时翻译 GET/aitranslation/predict.json 参数：sourceLanguage={{sourceLanguageCode,如zh-CN}} targetLanguage={{targetLanguageCode,如 en-US}} accessKey={{accessKey}} ...

虚拟演播厅指南

实时翻译进一步降低了跨国多语言用户对直播流内容理解的门槛，在跨境电商直播、跨国活动直播中都有很好实践应用。单击实时字幕，弹出字幕组件窗口。设置组件名称、字体样式、尺寸、位置、视频源、源语言、翻译语言，可在左侧区域进行效果...

图片翻译产品介绍

传统模式下，商家需要耗费极大的时间和人力成本进行图片的翻译，使用PS抠图&做图，第三方翻译软件等，整体操作繁琐，经调研，编辑一个商品的一种外语图片耗时30分钟以上。本产品提供了针对商品图片的图片智能翻译，有效提升跨境电商商家的...

产品简介

提升高并发下的调用效率，适用于跨境电商、本地化运营等场景网页翻译SDK 网页翻译插件，支持网页全文内容实时翻译 暂时不提供模型选项实现质量&耗时平衡：通过网页智能解析、内容动态适应、可视区域智能加载、智能段落划分等策略，让上...

实时语音翻译-Gummy

transcriptionEnabled(true)/设置是否开启实时识别.sourceLanguage("auto")/设置源语言（待识别/翻译语言）代码.translationEnabled(true)/设置是否开启实时翻译.translationLanguages(new String[]{targetLanguage})/设置翻译目标语言....

产品简介

智能纪要-翻译实时：4（元/小时）离线：0.5（元/小时）可选功能，包括：实时翻译 离线翻译工业生产指令转写 1.8（元/千次）根据实际使用次数计费。纯文本输入功能价格（元/千次）备注服务洞察 1.9 每次轻应用运行“服务洞察”或“客户...

调用官方Agent

提供类似同传翻译的实时翻译能力，在持续收音的同时输出翻译结果，适用于演讲，会议等大段语音场景。目前支持对部分语言的翻译结果进行实时语音播报：翻译语言为中文或英文：使用用户指定的音色播报翻译语言为日文或韩文：使用系统默认的...

Java SDK

transcriptionEnabled(true)/设置是否开启实时识别.sourceLanguage("auto")/设置源语言（待识别/翻译语言）代码.translationEnabled(true)/设置是否开启实时翻译.translationLanguages(new String[]{targetLanguage})/设置翻译目标语言....

Java SDK

transcriptionEnabled(true)/设置是否开启实时识别.sourceLanguage("auto")/设置源语言（待识别/翻译语言）代码.translationEnabled(true)/设置是否开启实时翻译.translationLanguages(new String[]{targetLanguage})/设置翻译目标语言....

移动端Harmony推流

本文介绍如何使用移动端Harmony SDK来支持实时记录场景下的音频识别流程。前提条件创建实时记录并成功获得推流地址安装移动端Harmony推流SDK SDK关键接口 initialize：初始化SDK。初始化SDK，SDK可多实例，请先释放后再次进行初始化。...

功能特性

点此测试通义听悟翻译（前置功能：语音转写）服务文件类型音频采样率翻译支持翻译实时语音翻译音频流 8k 实时中、英、日、韩、德、法、俄语间的双向互译；中英自由说翻译成中、英或中&英音频流 16K 实时音视频文件翻译音频文件 ...

产品优势

文本翻译实时语音翻译：实时记录支持中、英、日、韩语间的实时双向互译；中英自由说翻译成中、英或中&英。离线文件翻译：音视频文件语音转文字，支持中、英、日、韩语间的双向互译；中英自由说翻译成中、英或中&英。口语书面化口语书面化...

模型上架与更新

通义千问Max 音视频翻译 2025-09-23 qwen3-livetranslate-flash-realtime-2025-09-22 qwen3-livetranslate-flash-realtime 是一款多语言音视频实时翻译模型，可识别 18 种语言，并实时翻译为 10 种语言的音频。实时音视频翻译-通义千问 ...

实时语音识别-Fun-ASR/Gummy/Paraformer

实时语音识别服务可将音频流实时转换为带标点的文本，实现“边说边出文字”的效果。无论是麦克风语音、会议录音还是本地音频文件，都能轻松转录。服务广泛应用于会议实时记录、直播字幕、语音聊天、智能客服等场景。核心功能支持多语种...

API概览

DescribeLiveRealtimeDeliveryAcc 查询实时日志投递次数调用DescribeLiveRealtimeDeliveryAcc查询实时日志投递次数。DescribeLiveDomainTimeShiftData 查询直播时移用量数据查询直播时移用量数据。DescribeLiveDomainStreamTranscodeData...

用户服务协议

价格，财务及营销规划，业务战略，客户信息，客户数据，研发，软件，硬件，API应用数据接口，技术说明，设计，特殊公式，特殊算法等），无论上述信息和资料以何种形式或载于何种载体，无论披露方在披露时是否以口头、图像或书面等方式表明...

服务端API参考

获取旁路转推任务状态事件回调创建订阅房间消息回调查询订阅房间消息列表查询回调记录更新订阅房间消息回调删除订阅房间消息回调质量数据查询实时音视频指标数据实时语音转文字/翻译创建实时语音转文字或翻译查询实时语音转文字...

文本翻译

文本翻译是将语音转文字的内容进行不同语种的转换，可支持中、英、日、韩、德、法、俄语间的双向实时互译和音视频文件翻译。打破沟通屏障，降低跨国交流与资料学习的门槛。实时语音翻译价格优惠、延迟低，是极具性价比的服务。请求参数 ...

Python SDK

本文介绍Gummy实时语音识别和翻译Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取API ...

Python SDK

本文介绍Gummy实时语音识别和翻译Python SDK的参数和接口细节。用户指南：关于模型介绍和选型建议请参见实时语音识别-Fun-ASR/Gummy/Paraformer 和实时语音翻译-Gummy。在线体验：模型体验前提条件已开通服务并获得API-KEY：获取与配置...

CreateTask-创建听悟任务

创建听悟任务，包括创建离线转写任务和实时会议任务。调试您可以在OpenAPI Explorer中直接运行该接口，免去您计算签名的困扰。运行成功后，OpenAPI Explorer可以自动生成SDK代码示例。调试授权信息下表是API对应的授权信息，可以在RAM...

Android SDK

本文档提供了Gummy实时语音识别/翻译Android SDK的详细使用指南，帮助您将语音转换为文本。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验快速开始获取API ...

Android SDK

本文档提供了Gummy实时语音识别/翻译Android SDK的详细使用指南，帮助您将语音转换为文本。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译。在线体验：模型体验快速开始获取API Key：...

iOS SDK

本文档提供了Gummy实时语音识别/翻译iOS SDK的详细使用指南，帮助您将语音转换为文本。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译-Gummy。在线体验：模型体验快速开始获取API Key：...

iOS SDK

本文档提供了Gummy实时语音识别/翻译iOS SDK的详细使用指南，帮助您将语音转换为文本。用户指南：关于模型介绍和选型建议请参见实时语音识别-Paraformer/Fun-ASR/Gummy 和实时语音翻译。在线体验：模型体验快速开始获取API Key：获取...