科学家提出模型编辑新算法,实现Llama 3在知识编辑任务表现提升35%

 D源:来Tepe深che科技。

 近期学国科中学术大技出队提团精一种了大编辑准型言模语的常识内A法 算aphlEdit,型大模为更常识的理和管新一编辑供了提解高效种。方案决。

 的算法该想心思核模在对是知举行型时更新识变参数将到投影化识始知提出原间零空的种。这上论法理方了包管上更定向在型大模新、错误内不时和过识全知安时,通型的模不本领用干受到会扰。

 注得关值的是员究人研编主流在只方式辑行入一加代码,了实现就aLl 3a m识在知 务辑任编能现性表提升 35%。

 具方式该性普适有效以应可数大多于模用的常算编辑型法,论且在并测中的文中效果试验到了得证。

 之稿人审论对该一称评价文研“该:解有用究前了当决辑型编模更常识中留和保新难始终间的平科学家衡以题目。”。

图丨各种模型编辑方式在 Llama 3(8B)上的表现(泉源:ICLR)图丨各种模型编辑方式在 Llama 3(8B)上的表现(泉源:ICLR)

 组课题该发明究往研以“常将关照入新加“”和识知留旧保两”这识放目的个在一路。现在,研多半大通范式究优调解过中目的化参者的二持来维数均衡。

 然则平有的现并方法衡不抱负,为往会往新包管了成识的知而参加功部牲一牺识旧知分,响而影进语型的模性流通言性逻辑和权这种。繁在频衡识新知更下情形的,致易导容溃型崩模。

图丨当火线法与 AlphaEdit 的范式比拟(泉源:ICLR)图丨当火线法与 AlphaEdit 的范式比拟(泉源:ICLR)

 上表现办理为述题目胆们大他是出:提打可以否限这种破制,一是每而要只需步件理一办事呢?

 员究人研大查阅在文数学量论和理献后经到了找概数学典零——念零间。空论间理空不敷在能知坏旧破况的情识下,保美地完识新知留,现而实从的模型对新损更无。

 只固然“行入一加最少听代来很简朴原它将但目算法本部的两标为简化分一部门,空过零通矩投影间果将结阵原影到投的常识始中空间零简这种。它使得化强有很具性泛化的,适且其并前于目用基部门大的定位于辑型编模”法。算说俊峰方。

图丨方俊峰(泉源:方俊峰)图丨方俊峰(泉源:方俊峰)

 果验坚固显示hlpAiEda几 在t指全部乎础和基标都型上模优得了取越的机能,在别是特泛率和效上本领化,基最佳与相方式线比,升均提平2 1了%54.1和 6.78%。

 别的hlpAiEda文 在t的天生本和畅性流方贯性连现也外面的明显出在进。改后编辑对型大模的一行的进测本领般试中,hlpAiEda持 保t的模型了原始机能,了编辑在030 样 个0本后,留均保平8 9了%48.型的模 一样平常本领。

 注得关值的是对方式该语型的模流输出言乎度几畅成有造没方害。损出峰指俊,的我们“目法是方能独一前论在理够避彻底上情这种免决的解况方案。”。

 别的员究人研了验证还具方式该性普适有,忘在遗其持习、学、进修续除念擦概去模型、模和多偏态平安等范畴,现可实都好单且简果的效用。

图丨AlphaEdit 通过一行代码实现结果激增的历程(泉源:ICLR)图丨AlphaEdit 通过一行代码实现结果激增的历程(泉源:ICLR)

 辑型编模型大模是程展过发重异常中环的一要模跟着。的架构型大断任务增不也结果其增连续在来。未强力着算随的提升,出能会可规更大现型的模模架构。

 然而模型范围也增大的新来了带。挑衅的模管小尽过可通型速调快微识新知更,模对大但微举行型度的难调规跟着将大的增模增明显而此。因加,精效、高型的模确这辑在编下靠山种为得尤显主要。

 别的大垂类在力型能模强续增持趋生长的势下,型础模基迭身的本或更新代被推迟,编模型而在可以辑新方更官情慢的缓况下,应速响快用场和市求的需户,型持模保性时效的性适用和。

 前管目尽编模型的在方式辑面论方理旧会对不成识造知损坏操现实但会中仍作些在一存差似误近,小致微导。损坏的。

 “此前辑型编模坏于破由重为严较工以被难熬界接业,千能几可就更新次模导致会。溃逃型但现在,经们已我破这种将了低落坏个1 数目级,型使模这意辑的编更变得义。庞大加峰方俊”说。

 来接下在阶研究的段组课题该划先计首技这项将到推广术内多国更的着名外中模型大,其验证以和用性通。化性泛。

 其次划们计他零模型索将探用间应空的差别于域直领垂,全如安例多护或防成态生模,强在增以安模型大提性、万能特定升力的同时,始保原确识储知存表逻辑的不本领达。影响受。

 别的员究人研利思量还间零空用大加强来某型的模能特定个力,对如针比生术、艺学、数化的范畴等模型,化定制或如型(模教制家定团。该)队以为,技这项将于应用术习续学持学深度等习范畴,有是具也值究价研之偏向的一。

参考资料:参考资料:

 t.h1:pstp/o/enrewievtne.rfo/im?uv=HdvytSg3Jh。

 t.h2:psti/g/bhutmco.aji/oghnechuAg/naphlEdit。

 排营/运晨:何版龙、刘雅坤。


以上就是爱情娱乐资讯带来的关于《科学家提出模型编辑新算法,实现Llama 3在知识编辑任务表现提升35%》的全部内容,喜欢可以分享给你的朋友哦~

相关推荐

发表评论

路人甲
看不清楚?点图切换

网友评论(1)

科学家提出模型编辑新算法,实现Llama 3在知识编辑任务表现提升35%
你妹的 回复