天博科技 天博MIT最新研究:多个AI协作有助提高大模型推理能力和准确性—新闻—科学网 来源:天博企业 发表时间: 2024-08-09

麻省理工学院计较机科学与人工智能试验室(CSAIL)研究团队发明,多个言语模子协同事情赛过单一模子,多个AI协作有助在提高峻型言语模子的推理威力以及事实正确性。

每一个言语模子都天生对于给定问题的回覆,然后整合来自其他代办署理的反馈,以更新本身的回应。终极,多个模子的解决方案经由过程投票告竣一致的终极输出。这一历程有点像小组会商。

一种新奇的要领答应多种言语模子举行协作,颠末多轮辩说,终极患上出同一且切确的相应。图片来历:Alex Shipps/MIT CSAIL,来自Midjourney

本地时间9月18日,麻省理工学院计较机科学与人工智能试验室(CSAIL)的团队于其官网更新了一项研究:发明多个言语模子协同事情赛过单一模子,多个AI协作有助在提高峻型言语模子的推理威力以及事实正确性。

俗语说“三个臭皮匠,顶个诸葛亮”。简朴而言,这项研究哄骗多个AI体系互相协作,以协商、辩说的体式格局以告竣对于给定问题的最好谜底。这类要领提高了年夜言语模子对于事实数据的允从性以及革新决议计划的威力。

年夜型言语模子(LLM)持久存于的问题之一是,其天生的回覆纷歧致,可能有禁绝确以及过错的推理。而新要领答应每一个智能体(agent)踊跃评估其他智能体的回覆,并哄骗这些团体反馈来完美本身的回覆。

这一历程包孕多轮的回应天生以及批判,每一个言语模子都天生对于给定问题的回覆,然后整合来自其他代办署理的反�첩馈,以更新本身的回应。终极,多个模子的解决方案经由过程投票告竣一致的终极输出。这一历程有点像小组会商,个别一路起劲告竣一致以及合理的结论。

这一技能的一个显著长处于在,它可以无缝运用在现有的“黑匣子”模子(指难以通晓其内部运转历程),由于这个要领基在天生出的文本,而无需了了其内部事情道理。CSAIL团队暗示,这类简化可以帮忙研究职员以及开发者革新各类言语模子输出的一致性以及事实正确性。

“咱们不单单依靠在单一的AI模子来提供谜底,相反,咱们让浩繁的AI模子介入,每一个模子都带来怪异的见解以解决问题。只管它们的初始回应可能显患上简朴或者包罗过错,但这些模子可以经由过程审查其偕行提供的回应来革新以及提高本身的回覆。”麻省理工学院电气项目以及计较机科学玻士生、CSAIL从属成员和论文的首席作者之一Yilun Du说道。

按照Yilun Du的小我私家主页,他今朝正于攻读玻士,此前已经得到麻省理工学院学士学位,曾经于ChatGPT的开发机构OpenAI担当研究员,于Facebook人工智能研究所(FAIR)以及Google Deepmind担当实习生以及拜候研究员,并于国际生物奥林匹克竞赛中得到金牌。有趣的是,他曾经于TED揭晓题为《为何呆板人需要胡想》的演讲。

“当这些AI模子介入对于话以及思索时,它们更可以或许辨认以及改正问题,加强解决问题的威力,并更好地验证其回应的正确性。基本上,咱们正于创举一种迫使它们深切问题焦点的情况。这与单一的伶仃的AI模子造成对于比,后者常常复制互联网上找到的内容。然而,咱们的要领踊跃刺激了AI模子制订更正确以及周全解决方案的威力。”Yilun Du说。

此项研究触及数学问题的解决,包孕小学以及初高中的数学问题,并经由过程多智能体辩说显著提高了机能。该要领还可以帮忙解决常常困扰年夜言语模子的“幻觉”问题。经由过程设计如许的情况,智能体之间可以批判对于方的回应,更有动力防止随机天生信息并优先思量事实正确性。

除了了运用在言语模子,该要领还可以用在整合具备专门威力的差别模子。经由过程成立一个多智能体彼此交互以及辩说的去中央化体系,它们可以潜于地于语音、视频或者文本等各类模式下提高问题解决威力。不外研究职员暗示,当处置惩罚很是长的上下文时,现有的言语模子可能面对应战,批判威力可能体现患上不如预期。

此外,多智能体辩说情势还没有包孕有助在智能团体决议计划的更繁杂情势的会商。据研究团队吐露,这正将是将来摸索的要害范畴。推进这项技能可能需要更深切地相识人类辩说以及会商暗地里的计较根蒂根基,并使用这些模子来加强或者增补现有的年夜言语模子。

Yilun Du以为,跟着研究职员继承完美以及摸索这类要领,人们可以更靠近一个将来,于这个将来,言语模子不只模拟人类言语,还体现出更体系化以及靠得住的思维,开创言语理解以及运用的新时代。

“哄骗审议历程来改良模子的总体输出很是有原理,这是从思维链的提醒中迈出的一年夜步。”加利福尼亚年夜学伯克利分校电气项目与计较机科学系副传授、未介入该项事情的安卡 德拉甘说,“我对于接下来的成长感应高兴。当人们看到辩说时,他们是否能更好地判定年夜言语模子的谜底?人们是否经由过程本身与年夜言语模子辩说来患上出更好的谜底?是否可使用近似的思惟来帮忙用户审查年夜言语模子给出的谜底,以患上出更好的谜底?”

出格声明:本文转载仅仅是出在流传信息的需要,其实不象征着代表本消息网不雅点或者证明其内容的真实性;如其他媒体、消息网或者小我私家从本消息网转载使用,须保留本消息网注明的“来历”,并自大版权等法令义务;作者假如不但愿被转载或者者接洽转载稿费等事宜,请与咱们联系。/天博

上一篇:天博共68项!卫星导航定位科学技术奖评审结果公示—新闻—科学网 下一篇:天博兰大获校友捐资1000万,设立“有治教学奖”—新闻—科学网