安装asrproxy
根据安装包的安装手册完成asrproxy的安装,安装目录为 /ddt/asrproxy,如果安装到了其他目录,需要创建一个软链接到 /ddt/asrproxy,ln -s 安装目录 /ddt/asrproxy
。 配置文件为 asrproxy.json。
下载FunASR模型
流识别(websocket实时传输音频流识别),比如对接mod_cti(新一代电话机器人和实时质检)
普通话模型
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large paraformer-large-online
热词模型(需要更多的CPU,支持定义热词)
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual paraformer-large-online
粤语、普通话、英文混合模型
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-zh-yue-en paraformer-large-zh-yue-en-online
一句话识别(http接口提交录音文件识别),比如对接mod_vad(老电话机器人接口),
普通话模型
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large
热词模型(需要更多的CPU,支持定义热词)
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-contextual
8K模型(普通话)
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-8k
粤语、普通话、英文混合模型
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s paraformer-large-zh-yue-en
SenseVoice-Small 模型 支持 中文、粤语、英语、日语、韩语,和情感辨识(情绪识别)
curl -s http://down.ddrj.com/getasrmodel.sh | bash -s SenseVoice-Small
模型下载成功后会输出对应的配置信息,把配置信息保存下来,参考配置说明,加入到asrproxy.josn,后续可以再次执行下载脚本,得到配置信息。
下载PaddleSpeech TTS模型
下载模型
下载 tts 模型 http://down.ddrj.com/paddlespeech_tts.zip
wget http://down.ddrj.com/paddlespeech_tts.zip
解压到 /ddt/asrproxy/paddlespeech_tts
unzip -d /ddt/asrproxy paddlespeech_tts.zip
解压后paddlespeech_tts的目录里面有2个文件夹和一个文件。
dict
weights
front.conf
参考下面的配置信息,修改asrproxy.json
{ |
asrproxy.json配置说明
/*asrproxy启动不了,一般都是JSON格式不对,可以用 http://tools.jb51.net/code/jsonformat 这个工具检查JOSN是否存在错误。*/ |
FunASR配置
- type asr类型必须是funasr
- engine 引擎类型
- 一句话识别 设置为 sentence
- 实时识别
- offline:关闭实时识别
- online:开启实时识别
- 2pass:混合2种模式,需要更多CPU。
- enable_itn 是否启用数字转换成阿拉伯数字
- itn-dir 数字模型目录
- model-dir ASR一句话识别模型目录
- online-model-dir ASR实时识别模型目录
- punc-dir 标点模型目录
- vad-dir vad模型目录
- lm-dir 语言模型目录用于热词识别
- chunk-size 实时识别多少数据提交一次
- hotword 热词文件路径
阿里云ASR配置
/*阿里云实时语音识别配置例子 ,参数说明看 https://help.aliyun.com/document_detail/148847.html */ |
阿里云TTS配置
"aliyun":{ |
讯飞ASR配置
//讯飞语音听写接口,开通地址 https://www.xfyun.cn/services/voicedictation ,如果需要启用抢话功能,需要开通 "动态修正" |
讯飞TTS配置
*/ |
腾讯ASR配置
//实时语音识别(websocket)https://cloud.tencent.com/document/product/1093/48982 |
华为ASR配置
//获取取帐号名、帐号ID、用户名、用户ID、项目名称、项目ID 方法看这里 https://support.huaweicloud.com/api-iam/iam_17_0002.html |
华为TTS配置
//华为语音合成 https://support.huaweicloud.com/api-sis/sis_03_0111.html |