·OpenAI对抗AI“幻觉”的新策略是:奖励大模型每个正确的推理步骤,而不是简单地奖励正确的最终答案。研究人员表示,这种方法被称为“过程监督”,而不是“结果监督”。
OpenAI在官方博客发布新论文《通过过程监督改进数学推理》。
当地时间5月31日,OpenAI宣布正在承担起对抗人工智能“幻觉”的重任,并采用了一种训练人工智能模型的新方法。
(资料图)
当OpenAI开发的ChatGPT或谷歌开发的Bard等模型完全捏造信息时,就被称为出现了AI“幻觉(hallucination)”,表现得好像它们在滔滔不绝地讲述事实。其中一个例子是:在谷歌2月为Bard发布的宣传视频中,聊天机器人对詹姆斯·韦伯太空望远镜做出了不实的描述。最近,ChatGPT在纽约联邦法院的一份文件中引用了虚假案件,涉案的纽约律师可能面临惩罚。
现在,OpenAI在一项最新研究中提出了减轻ChatGPT“幻觉”、实现更好对齐的新方法——通过“过程监督”来提高AI大模型的数学推理能力。
OpenAI研究人员在报告中写道:“即使是最先进的模型也容易产生虚假信息——它们表现出在不确定的时刻编造事实的倾向。”“这些幻觉在需要多步推理的领域尤其成问题,因为一个逻辑错误就足以破坏更大的解决方案。”
OpenAI对抗AI“幻觉”的新策略是:奖励每个正确的推理步骤,而不是简单地奖励正确的最终答案。研究人员表示,这种方法被称为“过程监督”,而不是“结果监督”。
这种策略可能还会导致更具解释性的AI,因为它鼓励模型更多地遵循类似人类的“思维”方法链。除了得到高于“结果监督”的性能表现外,“过程监督”或许也有助于解决对齐难题。
目前,OpenAI的研究人员尚不清楚这些结果能否应用在数学领域之外,但他们认为,探索“过程监督”在其他领域中的影响将至关重要。
OpenAI的研究员卡尔·科布(Karl Cobbe)告诉CNBC:“检测和减轻模型的逻辑错误或幻觉是构建一致的AGI(通用人工智能)的关键一步。”他指出,OpenAI虽然并未发明“过程监督”方法,但正在帮助推动它向前发展。“这项研究背后的动机是解决幻觉问题,以使模型更有能力解决具有挑战性的推理问题。”
科布说,OpenAI已经发布了一个附带的数据集,其中包含80万个人类标签,用于训练研究论文中提到的模型。
美国电子隐私信息中心(Electronic Privacy Information Center)高级顾问兼人工智能和人权项目负责人本·温特斯(Ben Winters)表示怀疑,他告诉CNBC,希望能检查完整的数据集和随附的示例。“我认为仅此一项并不能显著减轻对错误信息和不正确结果的担忧。”温特斯说。
由于不清楚OpenAI论文是否经过同行评审或以其他格式进行评审,布朗大学技术责任中心主任苏雷什·文卡塔苏巴拉马尼安(Suresh Venkatasubramanian)告诉CNBC,他认为这项研究只是初步观察。“在我们可以对此发表任何肯定之前,这需要在研究界得到证实。”“由于大型语言模型的工作方式总体上不稳定,在一种设置、模型和上下文中可能有效的东西,在另一种设置、模型和上下文中可能不起作用。”
文卡塔苏巴拉马尼安补充说:“人们一直担心的一些幻觉是(模型)编造引用和参考。本文中没有证据表明这会起作用。”
科布表示,OpenAI“可能会将(论文)提交给未来的会议进行同行评审。”OpenAI没有回应该公司计划何时将新策略实施到ChatGPT及其其他产品中。
(原标题:《对付AI虚假信息!OpenAI称找到新方法减轻大模型“幻觉”》)
标签:
上一篇 : 中信建投:公司总经理、执行董事李格平辞职 世界速递
下一篇 : 最后一页
最新推荐
·OpenAI对抗AI“幻觉”的新策略是:奖励大模型每个正确的推理步骤,而
【中信建投:公司总经理、执行董事李格平辞职】中信建投6月1日晚间公告
1、一般情况下,如果是正常妊娠,宫内胚胎发育正常,孕酮值在25ng ml以
打造“无烟”健康城市,让每个市民都能自由呼吸
泰和新材(002254)06月01日在投资者关系平台上答复了投资者关心的问题。
收评:创业板指涨0 59%传媒板块涨幅居前
6月1日尾盘科创板股新致软件涨停,截至14:33,股价报20 68元,成交6 06
中新网6月1日电(陈彩霞何路曼)当地时间5月31日,美国众议院投票通过最
1、台式电脑的摄像头都是后配的,有的需要装驱动,如果你买的摄像头送
信用卡停息挂账什么意思?信用卡停息挂账其实就是指信用卡出现逾期情况
5月30日,福州市房地产中介行业协会发布了《关于合理调整二手房产交易
霍格沃茨之遗任务飞蛾扑了个框是很多人想要知道怎么做的,霍格沃茨遗产
作为夏季最基础的单品,T恤是每个人衣橱中的必备,简单的T恤搭配一条牛
张馨予赵露思等为虐动物事件发声,个人信息被人肉“开盒”
退役不褪色退役军人车队报名送考“南充晚报吗?我们有20辆车想加入送考
面对全球通胀压力及部分国家银行业衰退,新开发银行将如何联合各方力量
你去抢演唱会的门票了吗?自五月天开始巡演每场都是一票难求的状态杭州
在游戏《滞困:异星黎明(Stranded:AlienDawn)》中,炮塔建议连手动开
中新网黑龙江新闻6月1日电(谢文艳田菁芳)6月1日,记者看到,在大庆石化
连日厮杀之下,沪指回调至3200点关口徘徊不前。根据公募基金统计,截至
协议在众议院表决通过,下一步将由民主党控制的参议院进行审议。
1、当然不一样啦,学校学的很多都是理论的,现实还有很多你没有接触到
金源发展国际实业(00677)发布公告,于2023年5月31日,买方Honorwo
小编在十来岁的年纪第一次听说黑客时,就被他们的神秘和技术所吸引到了
在获得欧联杯亚军后,罗马主帅穆里尼奥将自己的亚军奖牌扔给了看台上的
5月31日北向资金减持234 83万股久其软件。近5个交易日中,获北向资金减
1、仙逆是神,求魔是魔,封天是妖,永恒是仙。2、仙逆深刻地描绘了修真
1、1 成都大熊猫繁育研究基地。2、成都大熊猫基地中的熊猫数量最多,有
聊聊一篇新多媒体电脑选购、组装与维护大全,对于最新多媒体电脑选购、
屯昌县人民检察院开展“检爱同行共护花开”检察开放日活动新海南客户端
北京日报客户端|记者安然在学校踢球时,小贾用一个明显违反足球规则的
QQ好友分组相信大家都知道,但是你们知道群聊也可以分组吗?当只加了几
中原网讯(记者于露刘梦琳通讯员于翠翠)为夯实基层妇幼健康服务队伍建设
每日小编都会为大家带来一些知识类的文章,那么为大家带来的是清网行动
➤➤2023天津北辰区小升初招生划片范围汇总如下图所示:常见疑问解答一
点亮精神火炬——全国科技工作者日主场活动将于5月30日上午9点,通过央
虽然奇瑞汽车的品控一直被众多消费者吐槽,但不可否认的是,奇瑞汽车已
2023年5月30日,2023“中国制造隐形冠军”榜单于上海CTIS(消费者科技
5月31日,《深圳市加快推动人工智能高质量发展高水平应用行动方案(202
“我们可以交换这本书吗?”“这个铅笔盒多少钱?”在跳蚤市场,孩子们
一个月之后的4月24日,恒大汽车再发公告称,由于资金不足,天津工厂暂
秦安县气象台2023年05月31日09时30分发布大风蓝色预警信号:预计未来24
巴特勒距离兑现承诺还差4场胜利,此前他接受采访的时候称自己会以NBA总
A股指数早盘低开低走,截至午盘,沪指跌0 74%,深成指跌0 95%,北证50
根据县公开招聘工作实施方案,2023年5月20日进行了公开招聘事业单位工
中国网讯 沐浴着党的二十大精神,即将迎来第73个“六一”国际儿童节。
等额本金和等额本息其实就是利息计算公式不同,再结合不同的贷款本金、
来自西班牙媒体《RAC1》的最新消息,巴萨已经向梅西提出了一份非正式报
手电头灯夜光漂,帐篷软座修为高。除非断流滩涂现,风雨无阻四时钓
1、南沙参与北沙参的区别概述:据古代文献记载,前人所用沙参,系南沙
成都抗疫的外籍志愿者:愿为城市“康复”贡献力量
环球简讯:新疆交建:5月30日公司高管林强减持公司股份合计28.12万股
世界资讯:沪深股通|凤凰光学5月30日获外资买入0.02%股份
【天天聚看点】章子怡在飞机上被偶遇,毫无明星架子接地气,身穿的裤子成亮点
WhatsApp的新更新阻止任何人破坏您的民意调查结果 世界快讯
全球短讯!华原股份员工为客户贡献专利 标的并入后以原控股股东子公司自居
环球要闻:今日时讯:吴谢宇弑母案二审维持死刑 二审维持死刑原判吴谢宇用生命终结作为反面教材
热点评!新浪博客注册功能维护中_如何注册新浪博客具体方法简介介绍
【环球新要闻】中国信通院《纸鸢开放人工智能模型开源许可证》发布
重点聚焦!六一关爱特殊儿童,襄阳华侨城奇幻度假区举行公益活动
当前聚焦:叶上初阳干宿雨水面清圆一一风荷举妙在何处(叶上初阳干宿雨水面清圆一一风荷举)
一文详解湖人休赛期引援:5类目标共计20人 谁能辅佐詹姆斯冲冠?
【环球新要闻】天合光能跌1.46% 拟87亿参建单晶拉棒及配套项目
全球最新:Franke弗兰卡咖啡系统于HOTELEX呈现领先技术和创新咖啡解决方案
Copyright © 2015-2022 欧洲律师网版权所有 备案号:沪ICP备2022005074号-23 联系邮箱: 58 55 97 3@qq.com