当地时间 6 月 27 日,OpenAI 官方公布训练了一个基于 GPT-4 的新模型——CriticGPT,用来捕捉 ChatGPT 代码输入中的错误。OpenAI 正在应用该模型于基于人类反馈的强化学习(RLHF)对齐管道中,以帮助人类监督 AI 完成复杂任务。
-=||=-收藏赞 (0)
当地时间 6 月 27 日,OpenAI 官方公布训练了一个基于 GPT-4 的新模型——CriticGPT,用来捕捉 ChatGPT 代码输入中的错误。OpenAI 正在应用该模型于基于人类反馈的强化学习(RLHF)对齐管道中,以帮助人类监督 AI 完成复杂任务。
评论前必须登录!
立即登录 注册