Azure AI Speech

One Studio. Eight Products.

面向客户演示的 Azure AI 工作台 —— 8 大 Speech / Realtime / Translation 产品在同一个页面里逐项跑通,所有调用都跑在 Microsoft 自有 Azure 租户。

① Realtime Voice Chat gpt-realtime-2 · WebRTC

点击麦克风开始对话。说英文或中文都可以,模型用 Microsoft 颜色亲和的 Teams 伙伴口吻回复。可以随时打断。

角色 Prompt 音色

点击麦克风开始

对话字幕会实时出现在这里…

③ Live Interpret Suite Speech Translation · TTS · OpenAI Summary

数据流 · 全程在 Microsoft Azure 租户内

🎙️

麦克风

浏览器 / iOS

📡

Speech SDK

PCM 流 · WebSocket

☁️

Azure Speech

Translator · East US 2

💬

UI 字幕

partial→final

🔊

Neural TTS

DragonHD · 译文朗读

🧠

Azure OpenAI

gpt-5.4 · 摘要+术语

— ms 端到端延迟 0 段已识别 0:00 累计时长 EN→ZH

讲者语言听者语言译文音色 🔊 朗读译文(同传耳机模式)

使用建议:讲者带麦克风,听者带蓝牙耳机听译文。低延迟模式下译文会在讲者每个停顿处自动播报。

原文(讲者)

点击麦克风开始说话…

翻译(听者)

Translation will stream here…

⑤ Transcript Lab Fast Transcription

上传 WAV 文件 → Azure Speech 转写 → Azure OpenAI 双语摘要 + 术语提取。

语言翻译输出

idle

Transcript

等待上传…

Translation + Summary

等待转写后生成…

⑦ Custom Voice · 品牌音色克隆 Personal & Pro Voice

录制 30 秒 ~ 5 分钟样本,克隆品牌代言人/CEO/IVR 主持人的专属音色。生产部署走 Azure Speech Studio + 法务声纹授权流程。

第一步 · 采集声纹样本

朗读以下提示句(英文 10 秒即可):
"Welcome to Microsoft Azure AI Speech. With just a short sample, you can craft a brand voice that sounds uniquely yours."

点击话筒开始录音(也可下方上传)

0.0s / 5min

或

第二步 · 训练你的专属音色

等待样本…

上传样本

声纹提取

微调神经声码器

部署上线

第三步 · 用克隆音色合成任意文本

演示阶段使用占位音色 yunqi 模拟克隆输出;生产部署接入用户专属 endpoint 后,输出即为 1:1 克隆品牌嗓音。