声纹复刻录音指导
# 录音指导
# 音频规范
需要保证复刻音频的质量,我们推荐您上传的音频文件符合以下规范:
| 类别 | 建议 |
|---|---|
| 音频时长 | 单个音频文件建议为5s~60s的音频。 |
| 音频格式 | 目前支持mp3、wav |
| 音频大小 | 单个音频文件建议不超过500k |
| 录制内容 | 文案: 句1: 随着五一假期开始,整个经济基本面进入一个相对正常和良好的状态。随着经济社会全面恢复常态化运行,前期受到压抑的生产需求出现了反弹。 句2: 最近天气变化无常,大家要多注意保暖!不要像我一样感冒了才知道后悔。多喝热水,多穿衣服,身体健康才是最重要的。 句3: 我个人觉得AI绝对是未来的重头戏,咱们还是要不断学习新技能,这样才能跟AI默契配合,一块儿向前冲。 句4: 我最近还迷上了瑜伽,每天都会抽出一点时间来练习。所以我最近生活很充实,感觉烦恼都没有了。 句5: 二公主的丈夫用眼泪变成的钻石作为成本,生意越做越大。小公主自从那天跟着牧羊人离开国王的城堡,就开始周游世界。 建议: 1.在录音前熟悉文案。 2.提交的声音与文案内容将进行强校验,请确保没有漏字、读错音。若识别不通过,请再次录制。 3.发起训练时,请按照文案顺序上传对应文件 |
| 录制环境 | 录音环境的选择主要考虑降低噪音和混响,建议使用10平方米以内的小房间进行录音,有吸音装置的房间是理想环境。可使用价格低廉的吸音棉对房间进行改造,目的是为了改变声波的平面反射为漫反射,降低混响。 1.尽量在同一声学环境下录制,避免过于喧哗的背景音和噪音,音频非拼接而成。 2.避免远场环境下录制,建议离麦克风50cm之内,并需要保持位置、距离稳定,防止音量大小不一致。不要让讲话的气流正对麦克风,防止喷麦造成的噪音。 3.尽量在自然对话状态下录制,对比刻意压低声线/呢喃获得的音色会更贴合本人。 |
| 音频质量 | 1.必须仅含有一个人在说话,避免多个人同时说话。 2.说话人发音及音质越清晰、复刻质量越高。如说话人喉音/声音底噪严重,则复刻音频喉音和底噪将会较为严重。 3.录音时需要保持音量大小、语速稳定、注意断句、避免口腔噪音(如口水声)、杂音、混响等情况。结合最终使用场景与人设加入适当演绎,避免朗读风格过于严重,并保持整体风格一致。 4.录音时尽量保持姿态稳定,减少不必要的肢体动作,椅子的响声、衣物的摩擦音、鼠标键盘的敲击声都是常见的人为噪声,需要格外注意细节。 |
上次更新: 2024/08/05, 20:28:19