一手TTS-2语音合成模型安装教程及实际使用
wptr33 2025-10-19 13:56 40 浏览
语音合成正从云端调用走向本地部署,TTS-2 模型作为开源语音生成方案之一,正在被越来越多开发者尝试落地。本篇文章从环境配置到推理调用,详尽拆解 TTS-2 的安装流程与使用技巧,为语音产品开发者提供一份可复用的实操指南。
最近一个月,在网上被鬼畜的同音替换视频洗脑了,相信不少人已经看过:(取自bilibili官方视频):
https://index-tts.github.io/index-tts2.github.io/
简单说就是:让视频中的对话用相同的语气、情绪,但是说出一段自定义的话。
这就是最近bilibili发布的TTS2 模型。
那我天马行空一下,是不是各种语言,各种语气都是可以替换的?作为动手能力极强的我,马上就开干,准备亲手部署TTS2模型并合成一段语音。接下来是我搭配chatPGPT耗时不到2小时的实现。本文分为两大模块,第一块是各种依赖安装,第二模块是模型效果实操。
一、基础准备
首先准备一台电脑(RAM>8G即可)官方说要8G显卡,但实测下来并不需要,我用的是8G RAM,显卡128MB的低配电脑。
然后,按照官方说明,先安装好git和git-lfs。
嗯,不出意外的话,果然要出意外了:
碰到的第一个问题:在克隆远端仓库时爆出了第一个问题:
别急,先问一下GPT。我把完整的报错信息丢给了GPT,并让它帮我分析问题及给出解决方案:
紧接着它又给了我两种解决方案,按照它的建议,我选择了方案1:
再回到git bash里面执行,回车;
GIT_LFS_SKIP_SMUDGE=1 git clone https://github.com/index-tts/index-tts.gitcd index-tts
# 以后也避免自动拉 LFSgit lfs install –skip-smudgegit config lfs.fetchexclude “examples/**”
完美,错误不见了。
接着按照官方的文档继续执行第三步:
官方这里说道建议使用uv安装而不要用pip安装,因为uv安装的速度比pip能快到150倍….
那就信你,所以我要先安装uv,再用uv安装模型。果断执行uv的安装命令:
pip install -U uv
果然,不出意外地又出意外了:
碰到的第二个问题:pip命令找不到
嗯,问题我看懂了,说是这个命令找不到。本着能动嘴坚决不动手,能懒绝不积极的原则,直接把问题抛给GPT:
好吧,就是没有安装python。对于我一个变成小白来说,这实属超纲了。然后在GPT的指引下,我来到了Python官网,下载了对应的版本,安装。
注意:记得勾选“AddPythontoPATH”
安装完Python之后,要手动关掉git bash窗口,再重新打开:输入命令可以看到已正确安装Python。
然后再继续第四步:这里官方说到 “DeepSpeed 库可能难以安装 一些 Windows 用户。您可以通过删除标志来跳过它。如果你 想要上述任何其他额外功能,您可以手动添加它们特定的 功能标志。”
起初我并没有在意到下边这个提示,而是直接执行了命令:
uv sync –all-extras
然后就又双报错了:碰到的第三个问题:路径不对
这一步一个报错,我有点难绷。但想到之后可以随心所欲地替换视频语音,我便又把问题抛给了GPT:
有点被GPT鄙视了…
按照它的说明,我重新进入到项目里,再执行命令:正常了,一切都在有序进行:
事实证明,半场开香槟是大忌!正在我稍有成就感的时候直接又来一个大报错:
碰到的第四个问题:deepspeed构建报错
一种无力感油然而生….
但是很快稳住心态,把问题再抛给GPT,看看什么情况:
它快速定位了问题,原来就是deepspeed的构建问题。原来我就是TTS2官方口中的“那些windows用户”…..
此时我才关注到忽略了官方这里的特别提示,建议不要加 –all-extras。
所以命令换成新的,执行一遍:
# 在项目根目录(有 pyproject.toml 的目录
uv sync # 不加 –all-extras
完美,看起来是把之前的不需要的文件移除了:
终于通过了前期的各项准备之后,要来到重头戏了,通过uv tool 安装模型:官方提供了两个下载源,一个是huggingface(抱抱脸),一个是modelscope。我选了后者。(因为抱抱脸会让我想起来抱脸虫…)
无脑执行命令即可:
uv tool install “modelscope”
modelscope download –model IndexTeam/IndexTTS-2 –local_dir checkpoints
会看到顺利执行:
但有了上次半场开香槟的尴尬经历后,我谨慎了许多,以防止再有报错。果然,又没让我失望:
碰到的第五个问题:路径不对
<imgclass=“aligncenter”src=“https://image.woshipm.com/2025/10/05/9755bbf6-a1d1-11f0-af85-00163e09d72f.png”width=”750″>
同样,再抛给AI:
按照AI的说法执行了一遍,最后试一下看看modelscope是否ok:
uvx modelscope –help
顺利出现:
至此,模型的安装已经顺利完成~
二、效果实操
完成安装之后,执行下述命令启动:
uv run webui.py
然后系统就开始启动,过程有点慢,直到看到出现:
Running on local URL: http://0.0.0.0:7860
去浏览器打开对应地址:
nice!
复杂的功能网上有很多,我就不赘述了,试个简单的吧:
我说了一段话: 你好呀,我是白羊武士,很高兴见到你
然后选择用这个语气说:tell me baby,tell me,why?
然后合成,搞定~
怎么样,很完美!至此,我从0到1跑通了TTS2的本地部署及使用。
我有了一个新思路: 把(小)电影中的音频提取出来—>用GPT转成中文—>再把中文上传回TTS2—->生成合成语音—->用剪映剪辑视频和语音。这么一来,看电影再也不会听不懂了。
本文由 @白羊武士弗拉明戈 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务
相关推荐
- oracle数据导入导出_oracle数据导入导出工具
-
关于oracle的数据导入导出,这个功能的使用场景,一般是换服务环境,把原先的oracle数据导入到另外一台oracle数据库,或者导出备份使用。只不过oracle的导入导出命令不好记忆,稍稍有点复杂...
- 继续学习Python中的while true/break语句
-
上次讲到if语句的用法,大家在微信公众号问了小编很多问题,那么小编在这几种解决一下,1.else和elif是子模块,不能单独使用2.一个if语句中可以包括很多个elif语句,但结尾只能有一个else解...
- python continue和break的区别_python中break语句和continue语句的区别
-
python中循环语句经常会使用continue和break,那么这2者的区别是?continue是跳出本次循环,进行下一次循环;break是跳出整个循环;例如:...
- 简单学Python——关键字6——break和continue
-
Python退出循环,有break语句和continue语句两种实现方式。break语句和continue语句的区别:break语句作用是终止循环。continue语句作用是跳出本轮循环,继续下一次循...
- 2-1,0基础学Python之 break退出循环、 continue继续循环 多重循
-
用for循环或者while循环时,如果要在循环体内直接退出循环,可以使用break语句。比如计算1至100的整数和,我们用while来实现:sum=0x=1whileTrue...
- Python 中 break 和 continue 傻傻分不清
-
大家好啊,我是大田。今天分享一下break和continue在代码中的执行效果是什么,进一步区分出二者的区别。一、continue例1:当小明3岁时不打印年龄,其余年龄正常循环打印。可以看...
- python中的流程控制语句:continue、break 和 return使用方法
-
Python中,continue、break和return是控制流程的关键语句,用于在循环或函数中提前退出或跳过某些操作。它们的用途和区别如下:1.continue(跳过当前循环的剩余部分,进...
- L017:continue和break - 教程文案
-
continue和break在Python中,continue和break是用于控制循环(如for和while)执行流程的关键字,它们的作用如下:1.continue:跳过当前迭代,...
- 作为前端开发者,你都经历过怎样的面试?
-
已经裸辞1个月了,最近开始投简历找工作,遇到各种各样的面试,今天分享一下。其实在职的时候也做过面试官,面试官时,感觉自己问的问题很难区分候选人的能力,最好的办法就是看看候选人的github上的代码仓库...
- 面试被问 const 是否不可变?这样回答才显功底
-
作为前端开发者,我在学习ES6特性时,总被const的"善变"搞得一头雾水——为什么用const声明的数组还能push元素?为什么基本类型赋值就会报错?直到翻遍MDN文档、对着内存图反...
- 2023金九银十必看前端面试题!2w字精品!
-
导文2023金九银十必看前端面试题!金九银十黄金期来了想要跳槽的小伙伴快来看啊CSS1.请解释CSS的盒模型是什么,并描述其组成部分。答案:CSS的盒模型是用于布局和定位元素的概念。它由内容区域...
- 前端面试总结_前端面试题整理
-
记得当时大二的时候,看到实验室的学长学姐忙于各种春招,有些收获了大厂offer,有些还在苦苦面试,其实那时候的心里还蛮忐忑的,不知道自己大三的时候会是什么样的一个水平,所以从19年的寒假放完,大二下学...
- 由浅入深,66条JavaScript面试知识点(七)
-
作者:JakeZhang转发链接:https://juejin.im/post/5ef8377f6fb9a07e693a6061目录由浅入深,66条JavaScript面试知识点(一)由浅入深,66...
- 2024前端面试真题之—VUE篇_前端面试题vue2020及答案
-
添加图片注释,不超过140字(可选)1.vue的生命周期有哪些及每个生命周期做了什么?beforeCreate是newVue()之后触发的第一个钩子,在当前阶段data、methods、com...
- 今年最常见的前端面试题,你会做几道?
-
在面试或招聘前端开发人员时,期望、现实和需求之间总是存在着巨大差距。面试其实是一个交流想法的地方,挑战人们的思考方式,并客观地分析给定的问题。可以通过面试了解人们如何做出决策,了解一个人对技术和解决问...
- 一周热门
- 最近发表
- 标签列表
-
- git pull (33)
- git fetch (35)
- mysql insert (35)
- mysql distinct (37)
- concat_ws (36)
- java continue (36)
- jenkins官网 (37)
- mysql 子查询 (37)
- python元组 (33)
- mybatis 分页 (35)
- vba split (37)
- redis watch (34)
- python list sort (37)
- nvarchar2 (34)
- mysql not null (36)
- hmset (35)
- python telnet (35)
- python readlines() 方法 (36)
- munmap (35)
- docker network create (35)
- redis 集合 (37)
- python sftp (37)
- setpriority (34)
- c语言 switch (34)
- git commit (34)
