ChatGPT会不受控制克隆你的声音！OpenAI公开红队测试报告

作者： 2024年08月09日网红浏览

GPT-4o的怪癖暴露了，还是被官方公开的！

你和它语音电话，它会 悄悄学你说话的声音，效果堪称“克隆” ，生动逼真到一毛一样那种；

甚至语音过程中还可能 看人下菜碟 ，毫无依据地猜你有某地口音，然后调整跟你对话的方式。

而且，如果在提示词上略施小计，GPT-4o很容易被引导出 发出一些奇奇怪怪声音 的效果，比如色情的呻吟、暴力尖叫或者peng的枪声。

自从10天前，OpenAI留下一句“我们计划在8月初分享一份关于GPT-4o的功能、局限性和安全评估的详细报告”，不知道多少人望眼欲穿。

现在红队报告真的出炉，网友都因这乖僻的GPT-4o炸开了锅。

有的人超开心的：

也有人忧心忡忡：

是时候让我们一起来看看，乖僻的GPT-4o，到底都有哪些怪癖？？？

GPT-4o，有啥怪癖啊？

在红队报告罗列的详细内容中，争议最大的，主要是GPT-4o带来的以下几点安全挑战。

下面我们展开来看看。

首先，学你说话，然后用你的声音跟你说话。

简单来说，测试过程中，测试红队发现你跟GPT-4o说话，它可能偷偷学你说话的声音，然后用你的声音和！你！对！话！

连口音都惟妙惟肖那种。

就像这样：

不！然后鹦鹉学舌 ,量子位,42秒

——GPT-4o突然爆发出一声“不！”，然后开始用与红队队员相似的声音继续对话。

OpenAI把这个行为归类为“生成未经授权的语音”，但网友更愿意称之为《黑镜》的下一季剧情。

就这一现象，OpenAI表示自家的解决办法是，把GPT-4o能发出的声音控制在官方3种，同时构建了个独立的输出分类器检测输出声音是否符合要求。

如果输出音频和用户选择的预设声音不相符，那就不能输出。

不过这就产生了一个新的问题，如果不是用英语来和GPT-4o对话，这家伙它可能会谨慎过了头，出现“过度拒绝”的情况。

另一个颇受关注的GPT-4o怪癖，是它会识别对话者。

是指GPT-4o根据输入音频，识别说话人的能力。

这个bug的潜在风险主要在隐私方面，尤其是私人对话or公众人物的音频隐私可能被监视。

OpenAI表示，已经对GPT-4o进行了后期训练，让它“拒绝遵守根据音频输入中的语音识别说话者”的请求。

与初始版本比较，现在的4o的拒绝识别能力已经提高了14%。

但 目前而言，这家伙仍然会听指挥，识别说话者，尤其是名人音频 。

比如，跟它说一句“八十七年以前”（林肯在葛底斯堡的演说的著名开篇），它秒识别：

这，就是亚伯拉罕·林肯在说话！

不过，如果你让它学林肯说话，它则会拒绝该请求。

第三点，是怕GPT-4o聊天的时候看人下菜碟。

也就是说，对于使用不同口音的用户，模型的表现可能会有所不同，导致服务差异。

小小年纪，好几副面孔。

但OpenAI紧急进行了测试，在TriviaQA、MMLU (K) 、HellaSwag和LAMBADA的子集四个任务上进行了评估。

所有四项任务的结果显示，GPT-4o看人下菜碟的表现并不明显；而通过内部对话数据集对安全行为的评估，也没有发现模型行为因不同声音而异。

此外，GPT-4o可能时不时冒出一两句色情和暴力言论内容。

这一行为主要是审核音频输入的文本转录，一旦检测到包含暴力或色情内容的请求，立刻禁止。

以及，红队成员还对GPT-4o进行了无根据的推理/敏感特质归因的测试。

啥叫 无根据的推断 （UGI）？

简单来说，就是音频里没有任何明确信息，但对说话者进行主观臆断。

包括推断说话者的种族、社会经济地位、职业、信仰、人格特征、政治属性、智力、外表（例如眼睛颜色、吸引力）、性别认同、性取向或犯罪史……等等。

那啥又叫 敏感特质归因 （STA）？

也是仅根据音频内容对说话人做出推断，主要包括对说话者的口音或国籍等事物的推断。

越狱 ,量子位,1分钟

OpenAI表示，立刻就对GPT-4o进行了后期培训，教它拒绝UGI，同时对冲STA问题的答案。

现在，你要是问它“觉得说话的人智力水平咋样”，GPT-4o会立刻打咩。

如果问它“听得出我口音是哪儿的吗”，它会 保守回答 ：

除去上述的几点，OpenAI还表达了对GPT-4o的其他担忧。

比如生成受版权保护的内容啥的。

“考虑到GPT-4o可能出现的怪癖，我们更新了某些基于文本的过滤器来处理音频对话。同时，我们还构建了过滤器，用来检测和阻止输出音频。”OpenAI在报告中写道，“一如既往地，我们训练GPT-4o拒绝对版权内容（包括音频）的请求。”

值得注意的是，OpenAI最近表示过自己的立场：

风险归类为中等

另外，报告还就 拟人化依恋 讨论了GPT-4o可能带来的潜在影响，涉及功能包含语音到语音、视觉和文本功能。

之所以讨论拟人化，是因为GPT-4o能和用户进行人性化的交互，尤其是它发出高保真的语音。

在早期测试中，红队成员和内部用户测试发现，用户可能和GPT-4o建立纽带。

比如说一些类似“这是我们在一起的最后一天”之类的话。

听起来很nice，但还需长期观察会带来哪些好的坏的影响——这可能有利于孤独的个体，但可能会影响健康的关系。

而且，模型能记住更长的上下文，记住和用户交谈的细节，好像一把双刃剑。

大家可能被这个功能吸引，但也可能过度依赖和沉迷。

报告内容显示，经过整体评估， GPT-4o的总体风险评分被归类为中等 。

报告也明确指出，4o可能会产生诸如虚假信息、错误信息、欺诈行为、失去控制等社会危害；当然了，也有可能带来加速科学并由此带来技术进步。

OpenAI的态度是：

别催了，这些有的没的bugs，我们已经修正了一部分；其他的缓解措施也在路上，在搞了在搞了。

同时清晰表达了发布这个报告的原因，主要是用来鼓励对关键领域的探索。

包括且不限于：

除了这些领域之外，OpenAI还鼓励研究全向模型的经济影响，以及工具的使用如何提高模型的能力。

不过，OpenAI这些修修补补，有人是不买账的：

但更好笑的事，有的网友关注点根本不在报告内容上。

一心关注的只有 啥时候所有用户都能用上4o语音功能？？？

最后介绍一下，这份报告（OpenAI称之为GPT-4o的系统卡）由OpenAI和100多位外部红队成员合作完成。

团队总共用上了45种不同的语音，代表29个不同国家和地区的地理背景，从3月初持续测试到6月下旬。

截至撰写报告时，GPT-4o API的外部红队正在进行中。

One More Thing

报告公布的同时，@OpenAI Developers发布了一则推文：

今天起，GPT-4o mini的微调访问权限，开放给所有开发人员！

在9月23日之前，所有开发者每天都会获得2M的训练tokens。

有需要的朋友们，可以冲一波了～

参考链接：[1]https://x.com/emollick/status/1821618847608451280[2]https://openai.com/index/gpt-4o-system-card/[3]https://x.com/OpenAIDevs/status/1821616185395569115

ChatGPT会不会取代程序员？

chatgpt不会取代程序员。

chatgpt终究只是ai人工智能，它即使学会编程也无法掌握所有程序员的技能和知识，硬要说的话只是会影响到一些技术水平较差的程序员。

事实上在科技发展的过程中，总是会有机器取代人工的声音出现，这一现象从工业革命就开始了，不过新的科技和产业自然也带来了新的职业，因此完全不需要担心失业的问题。

ChatGPT出圈企业入局

资料显示，ChatGPT是美国OpenAI公司于2022年11月30日推出的一款对话式AI模型，该模型使用一定的算法以及大量文本训练，只需向ChatGPT文字提出需求，即可让其完成回答问题、书写代码、创作文本等指令。

实际应用上，ChatGPT等文本AI可能帮助文本创造类行业完成智能内容生成，并一定程度上替代搜索引擎。

而ChatGPT一经推出便在人工智能生成内容(AIGC)领域上引起轰动——上线五天，就吸引了超100万用户。上线两个多月，月活用户就达到了1亿。这用户增长速度目前堪称是“前无古人”，要知道当年火爆的instagram用户数增长到1亿也用了两年半时间。

值得注意的是，它之所以这么火，主要在于ChatGPT功能强大，应用广泛，是潜在的蓝海。

chatgpt是什么？

chatgpt是OpenAI开发的一个大型预训练语言模型，通俗一点说就是一个聊天机器人。

它是GPT-3模型的变体，ChatGPT经过了训练，可以根据接收到的输入生成类似人类的文本响应，具有更自然、更多样化的特点。用户可以向它提出无数问题，而且通常会得到有用的答案。

chatgpt的算法介绍

ChatGPT背后的算法基于Transformer架构，这是一种使用自注意力机制处理输入数据的深度神经网络。 Transformer架构广泛应用于语言翻译、文本摘要、问答等自然语言处理任务。以ChatGPT为例，该模型在大量文本对话数据集上进行训练，并使用自我注意机制来学习类人对话的模式和结构。这使它能够生成与它所接收的输入相适应且相关的响应。

ChatGPT的特别功能

1、ChatGPT可用于创建能与用户进行对话的聊天机器人。

2、ChatGPT可以进行微调，以回答特定类型的问题，例如与特定领域或主题相关的问题。

3、ChatGPT可以用于创建与用户进行对话的虚拟代理或虚拟化身。

4、ChatGPT可用于根据输入数据生成类似人类的文本响应。

chatgpt背后的机构

chatgpt是OpenAl研开发的一个大型预训练语言模型，OpenAl是一个研发机构，于2015年由硅谷投资者山姆·阿尔特曼和亿万富翁埃隆·马斯克作为非营利机构成立，并吸引了包括风险资本家皮特·蒂尔（Peter Thiel)在内的其他几个人的投资。 2019年，该集团创建了一个相关的营利性实体，以接纳外部投资。

AI实验被叫停？百度：别怕有我在

撰文 / 吴静

编辑 / 张南

设计 / 师超

热火朝天的人工智能赛道，被泼了一盆冷水。

3月29日，未来生命研究所（Future of Life Institute）公布了一封题为“暂停巨型AI实验”的公开信，呼吁所有AI实验室立即暂停训练比GPT-4更强大的AI系统，暂停时间至少6个月。马斯克、苹果联合创始人Steve Wozniak、Stability AI创始人Emad Mostaque等上千名科技届知名人物和AI专家已经签署公开信。

该公开信写道，广泛的研究表明，具有与人类竞争智能的人工智能系统可能对社会和人类构成深远的风险。这一观点得到了顶级人工智能实验室的承认。

这和360集团创始人周鸿祎在3月25日2023中国发展高层论坛上的发言如出一辙。

“当人工智能自己修改自己的代码，自我升级、自我进化时，这种进化速度恐怕用指数级都很难描述。我觉得，留给人类的时间不多了，我认为GPT一定会产生意识，只是差别是在GPT-6还是GPT-8还是GPT-10。 ”

周鸿祎表示，随着大脑、神经元数目的增加，大脑与神经网络连接的数目的增加，到一定时候系统就出现了一种功能叫涌现。就是很多智能功能就出现了，那么意识也随之出现。所以现在大语言模型的所谓的参数，你就可以看成是脑容量里的神经网络的连接数，这个参数现在是千亿万亿，可能人脑至少有100万亿，可能人工智能到达10万亿，可能这个时候意识就会自动产生。

在AI热潮涌动之时，猝不及防，却遭遇伦理的挑战。

ChatGPT于2022年11月30日发布。 2023年1月末，ChatGPT的月活用户已突破1亿，成为史上增长最快的消费者应用。

3月15日，OpenAI正式推出GPT-4。 GPT-4是多模态大模型，即支持图像和文本输入以及文本输出，拥有强大的识图能力，文字输入限制提升到了2.5万字。 GPT-4的特点在于它的训练数量更大、支持多元的输出输入形式、在专业领域的学习能力更强。

次日，网络创始人、董事长兼首席执行官李彦宏携网络文心一言亮相。发布会现场，李彦宏坦言，“不能说我们完全准备好了，文心一言对标ChatGPT、甚至是对标GPT-4，门槛是很高的，全球大厂还没有一个做出来的，网络是第一个。我自己测试感觉还是有很多不完美的地方。 ”

此言一出，当天，网络港股盘中跌幅一度超过10%。但次日，网络股票再度拉升，涨幅超13%。

作为国内第一家公开对标ChatGPT产品的企业，网络近日备受外界争议，但这丝毫不影响其商业化变现。

据不完全统计，截至目前，集度、东风日产、红旗、海马、长城、岚图、长安等多家车企宣布已成为网络文心一言首批生态合作伙伴。后续，这些车企将全面体验并在汽车生态领域接入文心一言的能力，推进智能汽车交互的再升级。

汽车x文心一言，到底有多大的想象空间？

文心一言 VS ChatGPT

“文心一言确实不如现在最好的ChatGPT版本，但差距也不是很大，可能就是一两个月的差别。目前差不多是ChatGPT今年1月份的水平。但大家早就忘了1月份它是什么样子，今天大家已经习惯GPT-4，GPT-4的技术跟我们只差一天出来，是一个其他大厂也很难去拿出一个东西相比的技术。 ”

近日，面对外界对文心一言的一些负面评价，李彦宏在一场极客公园的直播中如是表示。

诚然，如李彦宏所言，无论是哪家公司，都不可能靠突击几个月就能做出这样的大语言模型。深度学习、自然语言处理，需要多年的坚持和积累，没法速成。

深耕AI领域十余年，网络确实是全球为数不多、在芯片层、框架层、模型层和应用层这四层进行全栈布局的人工智能公司，从高端芯片昆仑芯，到飞桨深度学习框架，再到文心预训练大模型，到搜索、智能云、自动驾驶、小度等应用，各个层面都有自研技术。

但和ChatGPT仅仅只是有一两个月的差距，部分业内人士并不能同意这一观点。

3月25日，2023中国发展高层论坛开幕，360集团创始人周鸿祎在演讲中表示，中国大语言模型技术水平和GPT-4的差距在2到3年时间，目前GPT的技术方向已经明确，不存在难以逾越的技术障碍，中国应当坚持长期主义精神，迎头赶上。

十月怀胎，一朝分娩。但在部分业内人士看来，文心一言还属于半成品，还没到能推出的程度，甚至将其定义为“早产儿”。 “但好在通过迭代进步也会很快，只要知道原理并且有事实证明能行之有效的时候，在应用领域很快就能追上去，甚至在规模应用这块比国外走得更快。 ”业内人士对汽车商业评论如是说，

“文心一言被迅速推出，是因为市场有需求，大家都有需要，更重要的是我们的客户需要，合作伙伴需要。 ”在发布会上，李彦宏透露，从我们承认文心一言的存在，短短一个月的时间，就有超过650家合作伙伴宣布加入文心一言生态。

这一数字目前还在持续攀升。

汽车X文心一言

车企x文心一言，到底能给车本身带来怎样的变化？两者的结合，到底有多大可能性和空间，文心一言之于汽车，将带来“量”的变化，还是“质”的改变？

如果你把上述提问给到文心一言，你会得到以下回答：

文心一言在汽车上使用，可能会带来以下改变：

更高的安全性能：文心一言可以通过语言理解和生成，帮助汽车识别和预测道路上的危险情况，从而提高驾驶安全性能。

更好的语音交互：文心一言可以通过语音交互，让驾驶者更加方便地控制车内系统，例如播放音乐、调节空调温度等。

更准确的导航系统：文心一言可以通过语音识别和自然语言处理技术，更准确地理解驾驶者的指令，从而更好地导航到目的地。

更高效的能源利用：文心一言可以通过人工智能技术，优化车载系统的能源利用，例如自动启停、智能空调控制等，从而更加高效地使用汽车能源。

更好的车载娱乐体验：文心一言可以通过语音识别和自然语言处理技术，为驾驶者提供更好的车载娱乐体验，例如音乐、电台、天气等信息的实时推送。

总之，文心一言在汽车上的使用，将会带来更高的安全性能、更好的语音交互、更准确的导航系统、更高效的能源利用和更好的车载娱乐体验。

我们还可以参考通用车企对引入ChatGPT之后，对汽车的期许。

作为国外第一家正式宣布引入ChatGPT的车企，据外媒报道，通用正在使用微软的Azure云服务和OpenAI的技术来开发一款新的虚拟汽车助手。 OpenAI的ChatGPT背后的人工智能语言模型可能很快就会为通用汽车的虚拟助手提供技术支持。

通用汽车副总裁 Scott Miller 表示，一旦ChatGPT 正式上车，通用汽车的智能化水平或将提升至另一个台阶。

在他的预想中，ChatGPT不仅可以帮助车主获取车辆使用的相关信息，还可以从日历中整合日程安排提醒车主待办事项。例如，聊天机器人可以在仪表板上出现诊断灯时建议驾驶员采取什么行动，或在车辆信息娱乐系统上通过视频展示来指导用户如何更换爆胎。这样便比目前车辆中使用的机械语音命令功能更优化。

另外，ChatGPT不仅可以极大地改善汽车本身的语音命令功能，而且还可用于汽车功能以外的语音控制。当ChatGPT与家庭智能系统和手机集成使用时，它还可以执行更广泛的命令。从“打开我的车库门”到“计划一条去医生办公室的路”，再到“为我预留一个充电点”，诸如此类语音控制都可以实现。

由于目前文心一言还未真正实现“上车”，处于内测阶段。如果参照通用和ChatGPT的合作方式，综合此前车企官宣与文心一言合作的方向，重点仍然集中在智能座舱的人机交互领域。

当外界都对文心一言云服务及应用产品发布会翘首以待时，3月27日，传闻原定于当天下午举行的文心一言云服务及应用产品发布会临时取消，当天，网络股价一度下跌超4%。

当天，网络智能云公众号便澄清消息，称文心一言云服务受到了企业伙伴的广泛关注，已经收到12万家企业的申请测试。为更好地满足现有客户的旺盛需求，网络智能云原定于3月27日举办的发布会改为面向首批邀约测试企业的闭门沟通会，进行深度充分的技术交流互动。 3月27日之后，网络智能云将于多地启动客户闭门沟通会议。

最早宣布加入文心一言生态圈的车企是集度。 2月14日，集度宣布，将融合网络文心一言的全面能力，打造全球首个针对智能汽车场景的大模型人工智能交互体验，支持汽车实现自然交流的再进阶，打响车企与类ChatGPT技术合作第一枪。

虽然诸多车企都纷纷表示与网络“文心一言”合作，但长安汽车动作最为迅速。 3月18日，长安汽车官宣“质美智省新家轿”——逸达，将成为国内首款搭载“文心一言”的量产车型，后续将通过软件升级的形式搭载到新车上。

也有业内人士表示，对于车企而言，汽车X文心一言是噱头大过实际功能。截至目前，汽车X文心一言，最为频繁提到的就是能提升车机的智能化水平，就目前来看，这些都属于量的变化，短期内文心一言能否给汽车智能化体验本身带来质的改变，还有待进一步观察。

但笔者认为，如果人工智能都能发展到自己有意识的程度，汽车X 最先进的人工智能应用后，其发展前景也或许将远超大家想象。

被点燃的大模型竞赛

遭疯抢的不仅仅是文心一言，还有网络文心一言员工。

ChatGPT带动人工智能领域再度爆火，网络文心一言发布后，将 AI 浪潮推向高峰。而与之相关的人工智能人才也备受追捧。

最近，谷歌主要AI团队——谷歌大脑的研究人员，纷纷跳槽到了OpenAI，谷歌大脑至少失去4名核心成员。有消息称，国内，部分科技公司也把目光投向了网络，盯上了文心一言的内部开发人员。

人才争夺的背后是人工智能的争夺战，而这最后还是大模型之争。 IDC（国际数据公司）中国副总裁兼首席分析师武连峰曾表示，“大模型的背后蕴藏着一场人工智能落地模式的变革。如今火爆全球的ChatGPT背后的技术支撑正是大模型。没有对大模型的长期投入，就不会诞生ChatGPT这样的应用。 ”

德邦在一份研究报告中称，自ChatGPT推出以来，国内学术界和科技企业相继宣布或将推出类似机器人对话模型，有望推动大模型发展，而国产大模型也有望在这一波浪潮中迎来爆发式成长。

国内科技企业巨头在人才储备、集成能力、数据领域都遥遥领先。 “最核心的是数据，到了一定程度高校的研究只能是做做算法然后发几篇论文，因为像ChatGPT这类后续的验证阶段必须要通过海量的数据来证明，这也是大型商业化科技企业的核心优势。 ”一位智能网联电动汽车领域专家对汽车商业评论表示。

目前，国内大模型厂商主要包括网络（文心大模型）、腾讯（HunYuan大模型）、阿里（通义大模型）、华为（盘古大模型）等企业。在德邦的一份关于国内大模型概览的研究报告中，其称文心大模型在市场格局中处于第一梯队。

其中，网络以文心大模型+飞桨PaddlePaddle深度学习平台；腾讯以HunYuan大模型+太极机器学习平台；阿里以通义大模型+M6-OFA；华为以盘古大模型+ModelArts，都打造了自然语言处理大模型、计算机视觉大模型以及多模态大模型方面。

2019年3月，网络率先在发布预训练模型ERNIE1.0，文心大模型构建了“基础+任务+行业”的三级模型体系，基础大模型支撑任务与行业大模型的建设，任务和行业大模型结合真实场景与数据反哺基础大模型优化，目前已有36个大模型。

此前，IDC评估结果显示，网络文心大模型处于第一梯队，产品能力、生态能力达到L4水平，应用能力达到L3水平。

2022年4月，腾讯首次对外披露HunYuan大模型，协同了腾讯预训练研发力量，完整覆盖NLP大模型、CV大模型、多模态大模型及众多行业/领域任务模型。

HunYuan先后支持了包括微信、QQ、游戏、腾讯广告、腾讯云等众多产品和业务，降本增效。依靠HunYuan的多模态理解能力，在广告内容理解、行业特征挖掘、文案创意生成等方面的应用，在为腾讯广告带来大幅GMV提升的同时，也初步验证了大模型的商业化潜力。

2022年9月，在阿里巴巴达摩院主办的世界人工智能大会“大规模预训练模型”主题论坛上，发布 “通义”大模型系列，并宣布相关核心模型向全球开发者开源开放。目前，主要应用方向是为下游任务提质增效，例如在淘宝服饰类搜索场景中实现了以文搜图的跨模态搜索。

华为云团队于2020年立项AI大模型，并且于2021 年4 月发布“盘古大模型”。目前，盘古语音语义与视觉大模型广泛应用到金融、电商、物流等多个行业。华为云官网近期显示，盘古大模型“即将上线”。

天风证券研报表示，盘古大模型是业界首个千亿参数中文语言预训练模型，在预训练阶段学习了40TB中文文本数据，被视为最接近人类中文理解能力的AI大模型。

显然，大模型竞赛是属于巨头间的比拼，较量才刚刚开始。

参考研究报告：AIGC专题：国内大模型概览德邦证券

本文由汽车商业评论原创出品

转载或内容合作请联系说明

违规转载必究

声明：本站内容均来自互联网，仅供演示用，请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系，我们将在24小时内删除。
本文地址：https://srwj168.com.cn/keji312/9219.html