Sayd
公测中

说得越多,
Agent 越强。

好的 Prompt 往往很长,打字太慢太累。语音输入比打字快 5 倍——用嘴给 Agent 下达复杂指令,才是最自然的方式。

$5 免费额度 | 无需信用卡 | pip install sayd-ai

main.py
from sayd import Sayd

sayd = Sayd(api_key="your-key")

# Voice → Clean, agent-ready text
def on_message(clean_text):
    print(clean_text)
    # "Book a meeting room for tomorrow at 3 PM."
    # Fillers, repetitions, false starts — all gone.

    # Push to your agent
    my_agent.send(clean_text)

ws = sayd.talk(on_message=on_message)

原始 STT vs Talk —— 看看区别

同样的语音输入。Talk 去掉噪音,保留意图。

原始 STT

Talk 输出

语音 vs 打字,差距有多大?

好的 Prompt 需要说很多话。语音天然就是更快的输入方式。

🎙️ 语音输入

~150

字/分钟

vs

⌨️ 键盘打字

~40

字/分钟

📈 语音比打字快 3-5 倍,你的 Agent 能收到更丰富的指令

数据来源:语言学与人机交互研究 (Ruan et al., 2018; Brysbaert, 2019)

Talk 是入口,但 Sayd 的能力远不止于此。

一套 API,让你的硬件拥有真正的语音理解力。

Talk

语音 → 干净文本

可用

Listen

24/7实时语音转写

可用

Summary

自动总结对话内容

即将推出

To-Do

从语音中提取待办事项

即将推出

Memory

跨会话上下文记忆

即将推出

Emotion

实时语音情感检测

即将推出

正在开发 AI 设备?和我们聊聊完整套件。 联系销售

谁在用 Sayd

从 SaaS 产品到 AI 硬件,Sayd 为每个阶段提供语音层。

🖥️ 软件产品

为现有产品添加语音能力

  • AI 生成类平台(Midjourney、Cursor 等 prompt 输入场景)
  • SaaS Agent / Chatbot
  • 企业 SaaS(CRM / ERP / 协作工具)
  • 客服 / 呼叫中心
  • 垂直行业应用(医疗记录、法律口述、教育)
使用 Talk API
🛠️ 开发者

从零构建语音优先应用

  • AI 助手 / Copilot
  • 语音笔记 / 日记
  • 无障碍 / 辅助工具
  • 内容创作工具(播客转文字、字幕、口述写作)
使用 Talk / Listen API
🔧 AI 硬件

出货带完整语音智能的设备

  • AI 可穿戴(耳机、挂坠、眼镜)
  • 智能家居 / 音箱
  • 会议 / 协作硬件
  • 车载 / 机器人
  • 第二大脑设备
使用完整套件

Talk 的工作原理

三步从原始语音到 Agent 可用的干净文本,无需复杂配置。

1

流式语音输入

通过 WebSocket 或 Python SDK 推送音频流。任意麦克风都行——手机、电脑、IoT 设备。

2

Talk 智能清洗

AI 实时去除口头禅('嗯'、'那个')、重复、口误,并修正语法。

3

Agent 收到干净文本

你的 on_message 回调收到干净、结构化的文本,可直接输入任何 Agent。

为什么选择 Sayd

超低延迟

< 200ms

针对实时语音对话深度优化。流式输出让 Agent 边思考边回答,用户几乎感觉不到等待。

开发者友好的定价

从 $0 起

与 LLM 生态统一的 Token 计费逻辑。免费额度够你验证 idea,付费后按量弹性伸缩。

智能清洗

Talk API

自动去除口头禅、重复和口误。你的 Agent 每次都能收到干净、意图清晰的文本。

99.9% 可用性

99.95%

多可用区部署,自动故障切换。你的 Agent 不会因为语音层掉链子而沉默。

准备好让你的 Agent 拥有真正的听觉了吗?

免费额度,简洁 SDK,无需信用卡。