清华等机构的ToolLLM如同一位精通百家技艺的大师已经掌握了16000真实世界API的奥秘而在前沿

  • 手机
  • 2025年03月21日
  • 机器之心报道 编辑:陈萍、梓文 在科技的前沿领域,2023年的舞台上,一场关于大型语言模型(LLMs)与真实世界API的对决正在热烈展开。清华等机构的研究者们,如同一群探险家,用ToolLLM框架深入未知的数字森林,他们不仅掌握了16000多个真实世界API的奥秘,而且还提出了一个全新的工具使用框架,让这些原本只能完成基本语言任务的大型语言模型,能够像人类一样灵活地使用外部工具。 在这个过程中

清华等机构的ToolLLM如同一位精通百家技艺的大师已经掌握了16000真实世界API的奥秘而在前沿

机器之心报道

编辑:陈萍、梓文

在科技的前沿领域,2023年的舞台上,一场关于大型语言模型(LLMs)与真实世界API的对决正在热烈展开。清华等机构的研究者们,如同一群探险家,用ToolLLM框架深入未知的数字森林,他们不仅掌握了16000多个真实世界API的奥秘,而且还提出了一个全新的工具使用框架,让这些原本只能完成基本语言任务的大型语言模型,能够像人类一样灵活地使用外部工具。

在这个过程中,他们利用了RapidAPI Hub这座宝库,收集了16464个来自49个类别的RESTful API,这些数据是他们训练和测试ToolLLaMA——基于LLaMA微调后的新工具版本所必需的一把钥匙。通过ToolEval这一自动评估器,我们得以见证ToolLLaMA如何在执行复杂指令和泛化到未知API方面表现出色,其性能甚至与ChatGPT相媲美。

此次研究揭示了一种名为DFSDT(Directed Few-Shot Data Transfer)的方法,它不仅提高了效率,还能处理那些难以被普通ReACT解答的问题。这意味着,在面对那些看似无解的问题时,大型语言模型现在有能力进行深度挖掘,从而激发它们在复杂情况下的潜力。

总结来说,这项工作为开源大型语言模型注入了新的生命力,使其能够更好地适应现实世界中的各种挑战。随着技术的不断进步,我们或许会看到更多令人瞩目的成就,而这些都离不开科学家们不断探索、创新和推动边界向前的精神。

猜你喜欢