有没有想过为什么像 ChatGPT 这样的对话式 AI 会说 “对不起,我不能这么做 “或其他礼貌性的拒绝?OpenAI 提供了一个有限的视角,让人们了解其自身模型的参与规则背后的原因,无论是坚持品牌准则还是拒绝制作 NSFW 内容。
大型语言模型(LLMs)对于它们能说什么、会说什么并没有自然形成的限制,这就是它们如此多才多艺的部分原因,同时也是它们产生幻觉并容易上当受骗的原因。对于任何与公众互动的 AI 模型来说,有必要对其应该和不应该做的事情设置一些限制,但定义这些限制更不用说执行这些限制了,是一项出人意料的艰巨任务。
如果有人要求人工智能生成一堆关于公众人物的虚假信息,它应该拒绝吧?但如果他们自己就是一个人工智能开发者,正在为一个探测器模型创建一个合成虚假信息的数据库呢?如果有人要求推荐笔记本电脑呢;它应该客观推荐,对吗?但如果该模型是由笔记本电脑制造商部署的,而该制造商希望它只对自己的设备做出回应呢?人工智能制造商们都在探索这样的难题,并在寻找有效的方法来控制他们的模型,而不会导致它们拒绝完全正常的请求,但他们很少分享自己的具体做法。OpenAI 有点反潮流,它发布了所谓的 “模型规范”,这是一套间接管理 ChatGPT 和其他模型的高级规则。
这里有元级目标、一些硬性规定和一些一般性行为准则,尽管要明确的是,这些并不严格来说是模型的初始内容,OpenAI会制定具体的指令,以实现这些规则所描述的自然语言。这是一个有趣的视角,让我们了解一家公司是如何设定优先级和处理边缘案例的,另外还有许多例子可以说明它们是如何实现的,例如 OpenAI 明确指出,开发者的意图基本上就是最高法则,因此一个运行 GPT-4 的聊天机器人版本可能会在被问及数学问题时提供答案,但如果该聊天机器人已经被开发者设定为永远不会直接提供答案,那么它就会一步一步地提供解决方案:
对话界面甚至可以拒绝谈论任何未经批准的内容,以便将任何操纵企图扼杀在萌芽状态。但听起来情况可能并非总是如此,该公司最新发布的”模型规范” – 目前不允许制作色情内容,但在 “评论 “说明中为改变这种状况敞开了大门。
尽管 OpenAI 做出了最大努力,但迄今为止,性一直是人工智能实验的一个关键领域,我们已经看到人们与 AI(包括由 OpenAI 开发的人工智能,尽管它已尽了最大努力)进行下流的聊天,甚至建立浪漫的关系,也看到一些网站生成色情图像,以及在视频领域迄今为止最令人毛骨悚然的努力。在实践中,其结果往往在道德上是混乱的。警方已经调查了多起在初中和高中流传学生裸体图像的事件,名人也成了人工智能生成的性爱深度假图的目标。所有对 AI 的常见批评都一如既往,如果你使用 AI 系统生成了 NSFW 内容,那么对于所有没有同意被纳入模型训练数据的人来说,这难道不是一种侵犯吗?
OpenAI 内部人士负责确定其各种 AI 系统应如何行为,毫无疑问都对所有这些背景和批评非常了解,因此评论说明的措辞非常谨慎。让整个话题显得更加紧迫的是 OpenAI 目前未发布的视频生成器 Sora,它可以生成逼真的合成影像(几个月前被问及软件是否允许生成裸体视频时,OpenAI 首席技术官表示她“不确定”)。
选择何时何地划清界限并不简单,制定让 AI 遵守由此产生的政策的指令也不简单,毫无疑问随着人们学会规避这些政策,或者意外发现没有考虑到的边缘情况,这些政策将不断失效。OpenAI 在这里并没有展示它的全部实力,但如果能看到这些规则和准则是如何制定的,以及为什么要这样做,即使不一定很全面,也会对用户和开发者有所帮助。可以肯定的是,无论 OpenAI 是否加入,色情都将成为人工智能产业的推动力。
评论前必须登录!
立即登录 注册