天博科技 天博百度CTO王海峰:文心大模型的底色和成色—新闻—科学网 来源:天博企业 发表时间: 2024-04-04

10月17日,“baidu世界2023”于北京进行。

baidu公司董事长兼首席履行官(CEO)李彦宏用一个多小时发布了“根蒂根基模子周全进级”的文心年夜模子4.0,展示其于理解、天生、逻辑以及影象等威力上的显著晋升,并先容了新搜刮、新舆图等10余款被年夜模子重构的营业运用。他对于这次进级年夜加奖饰,称其综合威力“与GPT-4比拟绝不减色”,并断言“年夜模子将开启一个繁荣的人工智能(AI)原生运用生态”。

文心年夜模子从3.5进级到4.0,仅用4个多月。这时期,文心年夜模子是如何变强的?

于紧凑的发布环节,baidu首席技能官(CTO)王海峰仅用20分钟就解读了文心年夜模子4.0暗地里的“助推剂”。一终场,他就用一句话解答了各人的迷惑:“团队基在更年夜的算力、更多的数据以及更强的算法,练习出来范围更年夜、效果更好的文心年夜模子4.0。”

王海峰于baidu世界2023解读文心年夜模子4.0暗地里的技能立异。baidu供图

进级:算力更年夜、数据更多、算法更强

王海峰坦言,文心年夜模子4.0的基本技能架构与文心年夜模子3.0以及3.5版本一脉相承,进级是基在于多个要害技能标的目的长进一步的立异冲破。

起首是练习情况更优了。文心年夜模子的根蒂根基模子练习离不开飞桨深度进修平台。王海峰吐露,baidu技能团队将飞桨平台运转于万卡算力上,并经由过程集群根蒂根基举措措施以及调理体系、飞桨框架的软硬协同优化,撑持文心年夜模子的不变高效练习。

其次是数据品质更好了。没有好的数据做“养料”,年夜模子难为无米之炊。王海峰说,技能团队设置装备摆设了多维数据系统,造成了从数据挖掘、阐发、合成到标注以及评估的闭环,以充实开释数据价值,年夜幅晋升模子效果。

然后是练习算法更强了。baidu技能团队经由过程打磨练习算法,“包管模子更好地与人类的判定以及选择对于齐”。于既往技能立异的根蒂根基上,技能团队基在有监视精调、偏勤学习、强化进修等技能举行多阶段对于齐,包管模子更切合人类价值不雅。同时,技能团队还使用可再生练习技能,经由过程增量式的参数调优,进一步节约练习资源以及时间,加速模子迭代速率。

价值对于齐,多多益善。为晋升年夜模子的正确性,文心年夜模子4.0于输入、输出两个阶段都应用了常识点加强,详细做法为于输入端对于用户输入的问题举行理解,并拆解所需的常识点,然后于搜刮引擎、常识图谱、数据库中获取正确常识,末了把获得的常识拆卸进prompt送入年夜模子;输出端会对于年夜模子的输出举行“反思”,从天生成果中拆解出常识点,然后哄骗搜刮引擎、常识图谱、数据库及年夜模子自己举行确认,批改误差。

王海峰先容,自�첩创《思索,快与慢》一书论述的智能体系,baidu研制了智能体机制。于根蒂根基年夜模子的根蒂根基上,baidu又进一步研制了反映慢但更理性、更正确的“体系2”,让年夜模子像人同样理解、计划、反思,必然水平大将思索历程白盒化,于完成繁杂使命的同时,还可以于情况中连续进修、自立进化。

成色几何?用户“用脚”投票

8月31日,常识加强年夜言语模子“文心一言”面向全社会开放。仅40多天时间,文心一言的用户范围就已经到达4500万,开发者5.4万,场景4300个,实现运用825个、“插件”跨越500个。

插件是一种非凡的AI原生运用,其门坎最低,也最轻易上手,能闪开发者、创业者倏地插手到生态中。小我私家及企业的数据、威力或者运用,都能倏地酿成AI插件,加强年夜模子的威力,让年夜模子更实用易用。好比,年夜模子接入权势巨子法令数据的“智能法令助手”能为用户提供法令征询的相干提议,简历助手插件则能帮用户一键天生简历模板。

一个月前,baidu上线了“灵境”插件平台,今朝已经有2.7万开发者申请入驻,笼罩法令、职场、进修等多个范畴。

“可以看到,用户使用文心一言的场景很是广泛,从接待词、演讲稿到企划书、仿单,再到流程图、思维导图等,涵盖了事情以及糊口的各个方面。”王海峰说。

使用文心一言的不只有企业、小我私家用户,另有国度队。

于baidu世界2023现场,中国游泳协会授予baidu“中国国度跳水队人工智能互助伙伴”称呼,感激baidu基在文心一言对于跳水队员于练习中的“技能引导”。中国国度跳水队锻练、奥运“五金王”陈若琳,奥运冠军全红婵、陈芋汐、王宗源来到年夜会现场,分享了文心一言等baidu年夜模子技能于智能练习上的作用。例如,进级后的中国国度跳水队AI辅助练习体系可以及时打分、拆解动作、阐发过往成就数据等,以开发个性化、专业化的练习方案。

王海峰解读,本年,baidu基在文心一言等AI技能对于中国国度跳水队AI辅助练习体系举行了周全进级,经由过程从海量数据以及常识中进修,把握了富厚的跳水常识,不只能理解以及履行锻练与运带动的繁杂指令,实时提供正确信息,还可以对于动作及时打分、精准量化阐发,提供有价值的引导信息,帮忙运带动精雕每一招每一式。

中国国度跳水队与baidu的渊源由来已经久。陈若琳于现场暗示,两边从2019年就开展深切的技能互助,联袂走过了东京奥运会、福冈世锦赛、杭州亚运会等多个年夜赛赛程,今朝正于备战来岁的巴黎奥运会。

于枚举文心年夜模子的运用场景时,不克不及纰漏一个非凡的运用场景——华人寻根。

很多华人于寻根之旅中受限在只言片语的家族记录以及艰涩难明之处志,寻根梦难圆。经由过程与国度藏书楼互助,baidu文心年夜模子年夜量进修古代方志以及家谱数据,并举行文字辨认以及理解,同时综合运用所在、职业、饮食、主要业绩等信息的常识图谱,于文心一言上线了“古文今问”办事。用户只需输入寻根信息,就能获得响应的线索反馈。于国度藏书楼处所志以及文心年夜模子的帮忙下,很多人可以找到本身的“根”。

据相识,文心一言“古文今问”办事首批已经上线福建福州、厦门、泉州、漳州等区域的数据,将来仍将连续更新。王海峰暗示,文心一言助力国度藏书楼馆藏文化资源活化,无望让更多人受益在常识以及科技的气力。

“银河规划”:再造就500万年夜模子人材

AI技能加快前进,于千行百业的运用愈来愈深切。于这个历程中,AI人材不成或者缺。王海峰说,2020年,baidu提出“5年为全社会造就500万人工智强人才”的方针,截至今朝,造就的人材数目已经完成方针的84%。

他说,当下年夜模子成为AI成长的热门标的目的,会进一步加快财产厘革,AI人材造就也需与时俱进。现场,王海峰发布了baidu人材造就新举措——“银河规划”。

“咱们将与产学研各界紧密亲密互助,深化产教交融,为社会再造就500万年夜模子人材。”王海峰暗示,之以是这么做,是为了让AI科技的“立异之花”结出更多“财产之果”,办事国度战略、办事社会成长、办事人平易近福祉。

版权声明:凡本网注明“来历:中国科学报、科学网、科学新闻杂志”的所有作品,消息网转载,请于正文上方注明来历以及作者,且不患上对于内容作本色性改动;微信公家号、头条号等新媒体平台,转载请接洽授权。邮箱:shouquan@stimes.cn。/天博

上一篇:天博警惕骨质疏松!专家建议四类人群定期测骨密度—新闻—科学网 下一篇:天博《华南国家植物园建设方案》国际咨询会举行—新闻—科学网