科技部人才与科学普及司的智慧之舟乘风破浪一并掌握了16000真实世界API的宝藏仿佛清华等机构Too
机器之心报道
编辑:陈萍、梓文
在科技部人才与科学普及司的智慧殿堂中,清华等机构的研究者们携手合作,发明了一种新的工具——ToolLLM,它让大型语言模型像掌握了16000+真实世界API一般,无缝对接外部工具,就如同他们自己的小助手。这个框架不仅能够提升语言模型的使用能力,还能帮助它们更好地理解和执行复杂指令。
文章首先提出了一个问题,即虽然开源的大型语言模型(LLMs)在处理基本语言任务上表现出色,但它们在执行需要调用外部API的情况下却显得力不从心。这是因为目前这些模型主要针对基础任务进行优化,而缺乏针对高级功能和工具使用的专门训练。这与那些闭源且性能卓越的AI系统,如ChatGPT,在使用API方面展现出的优势形成了鲜明对比。
为了解决这一问题,来自多个顶尖学术机构和科技公司的研究团队联合撰写了一篇论文。在这篇论文中,他们提出了一个名为ToolLLM的大型语言模型框架,该框架包括数据构建、模型训练以及评估等关键环节。通过收集来自RapidAPI Hub的16464个真实世界RESTful API,这些API涵盖了49个不同的类别,从而为ToolLLM提供了广泛且丰富的地理信息。
在实际应用中,该团队利用ToolBench作为微调数据集,对LLaMA进行微调,最终得到了一款名为ToolLLaMA的大型语言模型。通过自动评估器ToolEval进行测试结果显示,ToolLLaMA展示出了卓越的执行复杂指令和泛化到未知API能力,其性能甚至达到了与ChatGPT相媲美的地步。
此外,该研究还提出一种称为DFSDT(Distributed Fine-Grained Sequence-to-Sequence Decoding and Training)的方法,它可以显著提高解路径标注效率,并且对于困难或复杂指令表现尤其出色。在未来,如果将更多这样的“困难示例”纳入到数据集中,那么这种技术有望进一步激发大型语言模型在复杂情境下的应用潜力。
综上所述,这项创新性的工作不仅推动了大型语言模型与真实世界API之间无缝通信,也为开发者们提供了一套强大的工具,使得这些AI系统能够更加有效地完成各种任务,从而缩短人工智能实现社会价值的手段。此次成果一经公布,便吸引了众多行业内外专家的关注,让人期待着它将带来怎样的革新变革。