为什么语音改变一切
打字时,你会进行自我编辑。你简化复杂的想法,跳过上下文,丢失细微差别。说话时,你会分享脑海中的所有内容——完整的问题、限制条件,以及你担心的边缘情况。 在计划模式中持续使用听写功能,进行快速的来回讨论。不再需要输入精心构造的提示词,只需思考问题。Cline会提出澄清问题,你立即回应,并迭代直到形成一个可靠的计划。 打字带来的摩擦阻碍了真正的协作。语音消除了这种摩擦。入门
启用听写功能- 前往设置 → 功能 → 听写
- 打开“启用听写”开关
- 根据提示登录你的Cline账户
- 如果尚未安装FFmpeg,请安装(Cline会引导你)
- 点击麦克风按钮开始录音
- 自然说话
- 再次点击停止录音
- 等待转录文本出现在聊天中
系统要求
听写功能目前在Windows上不可用。计划在未来版本中支持Windows。
- macOS: FFmpeg(通过Homebrew:
brew install ffmpeg) - Linux: FFmpeg(通过apt:
sudo apt-get install ffmpeg)
听写功能大放异彩之处
计划模式对话
听写功能非常适合计划模式讨论。你可以不必精心制作提示词,而是- 一次性口述你的整个问题背景
- 立即回应Cline的问题
- 在没有打字摩擦的情况下迭代想法
- 边思考边说,Cline聆听
复杂问题解释
有些问题很难打出来。当你处理以下情况时- 具有边缘情况的多步骤工作流
- 跨多个系统的集成挑战
- 具有特定重现步骤的性能问题
- 需要详细上下文的UI/UX问题
代码审查与调试
在审查代码或解释bug时,语音让你能够完整地叙述你的思维过程- “这个函数看起来没问题,但我担心当…发生时会怎样”
- “问题可能出在这个部分,或者可能是另一个区域…”
- “我试了X和Y,但都没奏效,因为…”
技术要求
系统要求- 系统上安装了FFmpeg
- 活跃的互联网连接
- 拥有转录积分的Cline账户
- 以WebM格式和Opus编解码器录制
- 单声道音频,采样率为16kHz
- 为语音识别优化
- 音频在本地机器上录制
- 仅发送音频文件进行转录
- 转录后不存储音频
- 临时文件自动清理
成本与积分
通过你的Cline账户进行语音转录的费用为每分钟0.006美元。对于大多数用户来说,这相当于每次会话只需几美分。 一个典型的5分钟计划对话费用约为3美分。即使是重度语音用户,每月花费也很少超过几美元。定价是实验性的,可能会随着我们完善服务而发生变化。
最佳实践
自然说话 不要试图像打字一样说话。使用你正常的交谈语气,不必担心完美的语法。 先给出上下文 从大局开始,然后深入细节。“我正在构建一个需要处理实时数据的React应用,但我在WebSocket连接上遇到了性能问题…” 将语音用于探索 听写功能非常适合你尚不确定具体需求时的探索性对话。开始谈论问题,让对话自然发展。 与文本结合使用 你不必所有事情都使用语音。将语音用于复杂的解释和上下文,然后切换到文本进行快速跟进或发送代码片段。故障排除
麦克风不工作- 检查IDE的麦克风访问权限
- 确保FFmpeg已正确安装
- 尝试刷新VSCode/你的编辑器
- 清晰、正常音量说话
- 尽可能减少背景噪音
- 检查你的麦克风设置
- 验证互联网连接
- 检查防火墙是否阻止了Cline的服务器
- 尝试退出并重新登录你的Cline账户
- 如果看到身份验证错误,请退出并重新登录你的Cline账户
- 检查你的账户是否有足够的转录积分
- 验证你的互联网连接是否稳定
- 确保FFmpeg已正确安装且可访问
- 检查你的浏览器/IDE是否有麦克风权限
- 如果音频捕获失败,尝试重启编辑器

