我快分不清谁是真人了 试了爆火全网的语音AI

世超

咳咳,在开始讲之前,先跟差友们宣布个事儿:

这自然的语气,隐约还能听到些换气声,是不是已经有差友快上钩了。

但大伙可别真以为世超要暴露真声,其实这段音频,是我用AI做出来的,从打开网址到做好整段音频,统共用了都 没两分钟

可能已经有朋友猜到世超用的是啥AI工具,就是最近刚火出圈的那位,。

刚开源没几天,它的 GitHub 就有一万多颗标星,而且还在继续噌噌猛涨,就在世超在写稿的时候,亲眼看到它突破 2 万大关。。。

网上的热度也贼高,光是 b 站,随便一搜 ChatTTS ,就能弹出一大堆视频来,不是在教大伙怎么安装,就是在夸它有多逼真。

甚至连热度都传到国外了。

其实像 ChatTTS 这类文本转语音的工具,市面上一抓一大把,各家做 AI 应用的企业,基本上都有文本转语音的功能。

但和它们不一样的是,ChatTTS主打的是,最 自然地还原人声

它网页版上的 参数调节按钮 ,有一大半都是为了让生成的音频,更像咱们真人说话。

就比如,精调文本按钮打开之后,最后生成的音频里,会自动加一些 口语化的连词 ,或者 换气、笑声啥的 ,还有信噪比,就是为了还原说话时的背景音。

世超随便输了段话给 ChatTTS ,没动它的默认设置,生成的效果的是下面这个样子。

乍一听,还以为是办公室哪位同事遛火锅回来的吐槽。看下输出的文本,它是在最后一句的中间和结尾,自动加了两个气口。

不过要多听几遍,还是能在里面找到些 AI 味儿。

如果嫌生成的效果一般,我们也可以自个儿去手动设置,在输入文本里加[ uv _ break ]或者[ laugh ],就能直接控制气口和笑声。

还是上面那句话,世超直接在结尾加上个[ laugh ],整句话都会更自然一点,结尾那个笑声,还能咂摸出一点无奈的味儿。

ChatTTS

光靠这一句话,咱还看不太出 ChatTTS 的实力,接下来上点难度,扔两段绕口令给它。

自然

要是给咱们没练过的人来,指不定得口胡几次,没想到 ChatTTS ,模仿这个挺有一手。

讲到后面,它是直接一口气说完的,跟咱快忘词儿的语调相比,不能说十分像吧,起码也有个七八分了。

甚至为了让最后那句“你看我说的还行吧”更自然点,它还自己手动加了个词儿。

除了会说中文外, ChatTTS 也能整上两句英文。

世超输句肖申克的经典台词“ Hope is a good thing and maybe the best of things.And no good thing ever dies.”进去,它能顺溜生成语音。

至于效果嘛,世超觉得, 没说中文自然。。。

当然,作为在咱们这儿土生土长的 AI ,说中文比说英文自然也情有可原。

不过让世超意外的是,虽然英语一般,但 在学 ABC 中英夹杂, ChatTTS 是真有点天赋。

世超随便在台词里加了一些网上很火的英文梗,它直接把里面的精髓给模仿出来了。

不仅能准确切换中英文,口气啥的也都像模像样,而且该补充的连词也都补充了。硬要挑刺的话,就是最后那句有点卡壳,但平时咱说话,谁没有秃噜嘴的时候。

语音

肖申克

试到这儿,世超已经稍稍被 ChatTTS 给折服了。。。然鹅,就在咱准备再深度探索探索时,它 一连给咱来了好几次大翻车

就比如我想试试不精调文本,看看 ChatTTS 会生成怎样的音频,结果倒好,它直接罢工,输入的一大段话,它只读第一个字。

试了好几次都是这效果。。。

( 因为输出的问题,iOS系统可能会打不开这段音频。)

而且如果整段文字里有阿拉伯数字, ChatTTS 也识别不了,得我们手动切换成中文数字。

更离谱的是,只要字数一多起来,它就开始浑水摸鱼,支支吾吾只从大段文字里挑着念,甚至有时候都能把它们的 GPU 给干宕机了。

像是世超想让 ChatTTS 帮差友们读下这篇文章的开头,它就已经撑不住了。。。

这都还不算啥, ChatTTS 有个最大的缺点,就是咱们不能事先知道选择了啥音色,只能在“音频种子”里输入数字 盲选 ,或者掷骰子 抽卡

合着就是碰运气呗。。。

我快分不清谁是真人了

不过关于这些“ BUG ”,研究团队也有它们的说辞。一句话概括就是, 为了防止 ChatTTS 被有心之人利用,他们没放出最好的模型。

据他们的说法,目前开源的和网站上用的,都是用 4万个小时 数据训练出来的模型,还没经过监督微调。

并且为了防止 AI 诈骗,他们还在这些训练数据里,加了少量的高频噪声,数据用的也都是音频质量不太高的 MP3 格式。

团队手里呢,其实还有个更大杯、性能更好的模型,用 10万小时数据

ChatTTS 真实的实力,应该是官方视频里展示的那样。像咱们上面展示的那几个例子,它都能做得更好,比如中英文夹杂的句子,视频的示例比咱试的要丝滑得多,而且整个人声的清晰度,也比世超在线生成的强。

按照设想,它之后还能接入语言大模型,能直接和 AI 来个面对面交谈。

甚至光是凭几分钟的音频,它能直接把乔布斯、泰勒·斯威夫特的声音给克隆出来。

之后再进化进化,结合 ChatGPT 和对口型的 AI ,让它帮忙 直播带货 估计都没人能看得出来了。

当然有好处是一方面,但世超想说的是,说到底这 AI 还是模仿人说话的,要是被有心之人给利用了,带来的后果可不是一点好处就能抵消的。

像去年,就发生了好几起关于 AI 诈骗的案例,被骗好几百万的都有。而现在 AI 音频越来越逼真,等于说诈骗的门槛是越来越低了。

还有版权风险,也算是这类音频 AI 的一堵墙。前段时间,寡姐还因为声音版权的问题,公开撕了 OpenAI ,以 OpenAI 下架相关音色告终。

甚至在今年早些时候,美国田纳西州还立了个法,不让用 AI 模仿人声。

总之, 在音频 AI 这块儿,还有很多窟窿要被补上。。。

但说句心里话,世超还真挺希望这模仿人说话的 AI 能尽快落地的,要能接到公众号上就更好了。

毕竟这“听一听”功能里的机械音,听着是真叫人难受。。。


要塞货栈着火怎么灭了

建立 水井 或 水缸要有空闲的农民、一定要造几个水缸或水井,以防火灾,等着火了再造就晚了。 1、城墙应该至少建两层。 2、可以适当挖护城河。 3、一定要建几个方塔或圆塔,并放上投石机。 4、可以在塔上加盾,对墙上弓箭手防御力大大提高。 (是用工程师造,而且可以上城墙)5、要在墙或塔上造火篝。 (只有弓箭手能用,弩兵不能用)6、可以在敌人兵临城下应急时,在塔上放几个火焰兵。 (敌人弓箭手少的时候)7、一定要造几个水缸或水井,以防火灾,等着火了再造就晚了。 8、可以让工程师倒油,可以烧死一大片。 (方法:先造一个油锅,再造两个工程师,切记,必须是两个工程师。 然后用工程师点油锅即可。 不过炼油是要耗费沥青的,所以一定要有几个沥青才行。 )9、要在城外造火沟,可以点火烧死敌人。 10、可以在关键的地方造些陷阱(如:城门口、靠近主城的地方等)要塞:十字军东征》是一款历史题材的游戏,这么一款有50关战役却没有剧情的游戏如果要和《帝国时代2》之类的游戏比,自然会因为历史底蕴黯然的缺乏而失色。 但这毕竟是一款时至今日尚有一定玩家基础的经典游戏,它的经典不是没有理由的:毋庸置疑地说,真正以攻城守城为题材的制作较好的游戏也就是要塞了(如果还有其他请恕我浅薄,如全战之流并非以攻城守城为题材)。 攻城方面,要塞有很多的攻城武器,不仅仅有一般游戏里以破坏城墙为目的的投石车、投石机以及近战的冲车,还有可架于城墙上的攻城塔使士兵登城,以及巨火弩可远程点燃建筑物以及射杀敌军,还有中世纪经常出现的掩体巨型盾可挡箭(在这里笔者也非常诚实地承认,巨盾因为它低廉的造价以及他那竟然比攻城塔还能挨射的耐力已然成为BUG般的存在)。 守城方面,如果你只要求胜利的话,只要两道墙加上很多很多的兵就可以了——但如果你热衷于城堡攻防,你可以借助射石机、巨弩等器械,辅之以陷阱火沟巨盾等东西挑战以二、三十人的兵力力敌对方四五百人(这是完完全全有可能的)。 真人一般的AI——我所说AI如真人一般并非指AI的智商,因为萤火虫工作室暂时没有学习“深蓝”相关技术的计划,而是指AI具有鲜明的个性。 如果你想挑战自己,与AI来一场殊死搏斗,那恐怕你就要失望了,要塞的AI并不高明。 而且制作商把最强的防御力赋予了野狼,最强的攻击却给了狮心王,很可惜地,他们都没有掌握最强的经济,最强的经济属于萨拉丁。 这样做,很多竞技玩家要骂娘了,但我说,这样也有好处,如此一来,制作者想要表现不同AI的个性可见一斑。 如果你是一个单机党,要塞的AI能够让你不那么寂寞的。 他们有自己鲜明的个性,会说一些个性鲜明的话,做一些个性鲜明的事。 就拿萨拉丁来说吧,萨拉丁的经济是最强的,当之无愧的最强——但他做了一件貌似不是那么符合经济至上的事,他在城内建满美化设施,且让我说明一下,美化设施会加强军队战斗力而降低农民生产效率。 再说萨拉丁挨打时会说:“我不能让我的人民失望。 ”失败时会说:“在战斗中你很强大,但你是正义的吗?我个人可以原谅你。 ”我想懂一点历史的人都知道,萨拉丁是仁慈的君主,哪怕制作者想要给他最强的经济,依然用美化设施表现他的仁慈。 另外,值得一提的是,要塞十字军采用外挂翻译,很容易修改,(至2013年7月)AI的对话已出现两个修改版本,包括笔者的要塞变态版。 要塞十字军的分类通常是即时战略和模拟经营,模拟经营也是要塞十字军的一个特色,怎么讲?譬如说吧,你想要你的城堡工作下去,你要建好建筑,如伐木屋,农民会自动去工作,而非其他游戏里面的手动操作;最重要的是,不是你要他工作他就工作的,你要给人民食物,或者发赏金,或者给他们灌啤酒灌得他们认你做干妈……总之,你要满足他们的一些需求,把声望维持在一定数值,否则人民会走。 再比如说,我想要做一些面包给人民吃,不是说做就做的,我要首先种一些小麦,然后磨成面粉,最后,做成香浓可口的面包,然后把这些面包带到子民们面前,让他们看一下。 再再再比如说吧,要塞十字军有很多种经营模式,如果你想要尝试一些欠抽的方法也是可以的,如果你想进行宗教统治,让你的子民们不吃不喝,就是天天听教士开讲座,听完了听教士开讲座,听完了听教士开讲座,终于听完了一天的讲座拖着疲惫的身躯听教士开讲座……那也是可以的,宗教也能给你带来可观的声望,能抵消掉没有食物的减成,让人们生活在神圣之中,没准死了还能以他坚强地精神力回光返照继续为你工作……要塞十字军的操作是非常简单容易上手的,虽然一开始可能被一大堆经济搞晕了,不过只要挺过了这里还是很好操作的。 更重要的是,要塞十字军的操作非常轻松(只要你不走竞技路线),你可以边吃冰棒边玩,而不用像玩魔兽一样左手按着快捷键,右手点着敌人,眼睛扫视小地图,耳朵贴着音响观察动静,两只脚快速地打字,嘴里叼着个鼠标狂咬加快APM……好吧有点夸大了。 但要塞的操作轻松确实不假的,如果你只是个平时想要休闲的普通玩家,不妨尝试一下要塞吧。

比亚迪f3刚启动时怠速不稳息火是什么原因几分钟后又正常了

比亚迪车主您好~这个很多是由于节气门处积碳太多~导致进气量不够~怠速马达卡滞~清洗一下就可以啦~但清洗时一定要把怠速马达拆下来清洗干净~同时避免清洗剂冲进节气门位置传感器导致短路~~希望我的回答可以帮到你~祝用车愉快【汽车有问题,问汽车大师。 4S店专业技师,10分钟解决。 】

养鹦鹉鱼的水怎么不清,过不了几天就会变红

这是因为血鹦鹉鱼的品种不好,颜色不红,所以商家将色素注射进血鹦鹉鱼的身体,时间长了以后色素逐渐从血鹦鹉鱼体内排出,导致鱼缸里的水发红。 血鹦鹉俗称红财神、财神鱼。 其全身鲜艳通红,有着胖嘟嘟的体形和柔柔的鳍条,颜色红彤彤,十分讨喜,成年体长15-20厘米,体副宽厚,体呈椭圆形。 幼鱼期体色灰白,成年鱼体体态臃肿,粉红或血红色。 血鹦鹉强健壮硕,几乎什么都吃,像人工饵料、薄片、颗粒、红虫、丰年虾、水虱等等。 因其食性广且总是吃个不停,加之它们对水质的适应力极强,要养活它们很容易。 血鹦鹉需要弱性且硬度较低的水质。 血鹦鹉是对温度相当敏感的鱼种,在低水温和水温变动剧烈的情况下,容易因为生理的反应而失去鲜艳的体色,更甚者会出现黑色的条纹或是斑纹。 使用加温器提升水温在25~28℃的范围内,便可使鱼只呈现亮丽的体色和充满活力。 而在低水温中生活久的鱼只不但健康状况差得可怜,且容易生病、死亡。

  • 声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
  • 本文地址:https://www.srwj168.com.cn/keji312/27325.html
VS 托克 铜价跌破趋势线 对冲基金 谁最终能赢
暂无