该软件主要为 Whispers from the Stars 游戏开发。
wfts-chinese-tool 是一个为中文玩家准备的工具软件。用户可以通过该软件获取系统音频的实时中文翻译,用户还可以将中文语音转换为英语并输入到 VB Cable 虚拟音频设备中。
- 识别记录和日志导出
- 将英语内容合成为音频
- 获取实时英语音频的原文和翻译
- 将中文输入用大模型翻译成英语
- 将合成的音频进行播放并注入 VB Cable 虚拟设备
软件共有六个按钮代表不同的功能。
- 第一个按钮:启动和关闭服务。
- 第二个按钮:监听系统音频输出,并翻译为中文并将内容显示到聊天区。
- 第三个按钮:用户英语输入,监听用户的语音输入(建议用中文)并翻译成英语,显示到两个输入框中。输入框中的内容可以修改。
- 第四个按钮:调用大语言模型将输入框左边的内容翻译成英语,这个翻译会比语音模型自带的翻译更准确。
- 第五个按钮:将输入框右边的英语内容合成为音频。
- 第六个按钮:将合成的音频同时进行播放和注入到 VB Cable 虚拟音频设备中。
除此之外,将鼠标悬浮到图中红色位置还有额外选项:
- ①:导出聊天记录、清空聊天记录
- ②:导出日志记录、清空日志记录
- ③:选择翻译模型(阿里云大语言模型、本地Ollama模型),选择是否在翻译后立即合成对应音频
软件的功能比较灵活,可以用于游戏之外。
该项目仅支持 Windows 系统。
本项目使用了阿里云的云端模型(语音识别模型、语音合成模型)。要使用这些模型首先需要获取阿里云百炼平台的 API KEY,然后将 API KEY 添加到软件设置中或者配置到环境变量中。相关教程:
如果没有将阿里云的 API KEY 配置到环境变量,该项目将无法正常工作!
关于环境变量的配置,如果您不想污染自己的环境变量或者觉得阿里云提供的方式有些麻烦,可以鼠标悬浮到“开始/停止”(第一个按钮)按钮上,点击出现的“打开API KEY文件”按钮,即可打开一个文本文件,将你的 DASHSCOPE API KEY 粘贴到该文件中保存即可,注意不要添加额外的内容。
除此之外,还需要安装 VB Cable 虚拟音频设备软件。软件将使用该音频设备将合成的英语音频注入到游戏的虚拟麦克风中。
完成上述操作后建议重启计算机以使得操作生效。
之后每次启动游戏时,打开系统的“音量合成器”选项,首先设置游戏的输入设备为默认,待游戏启动后再改为 CABLE Output。
该软件可能用到的模型列表如下
| 模型 | 类型 | 链接 | 备注 |
|---|---|---|---|
gummy-realtime-v1 |
阿里云模型 | Gummy | 实时语音识别模型 |
cosyvoice-v2 |
阿里云模型 | Cosyvoice | 语音合成模型 |
qwen-max |
阿里云模型 | Qwen-Max | 通用大语言模型,用于将识别的中文内容翻译成英语 |
| 自定义 | Ollama本地模型 | Ollama | 本地大语言模型,用于将识别的中文内容翻译成英语 |
克隆仓库:
# HTTPS
git clone https://github.com/HiMeditator/wfts-chinese-tool.git
# SSH
git clone git@github.com:HiMeditator/wfts-chinese-tool.git安装依赖:
npm install构建 python 运行环境:
cd chat
# 在 /chat 目录
python -m venv .venv
.venv/Scripts/activate
pip install -r requirements.txt打包 Python 程序:
# 在 /chat 目录,激活 Python 虚拟环境运行
pyinstaller main.spec运行项目:
npm run dev构建项目:
npm run build:win

