月之暗面推出k0-math新一代数学推理模型挑战OpenAI的o1系列
【ITBEAR】月之暗面Kimi,这家通用人工智能创业公司,在今日正式推出了其新一代数学推理模型——k0-math。这款模型标志着Kimi在推理能力强化方面的首次尝试。
据Kimi方面介绍,k0-math在多项基准测试中表现出色,其数学能力足以与全球领先的OpenAI的o1系列模型相媲美,具体对标o1-mini和o1-preview两个可公开使用的模型。
在中考、高考、考研以及MATH等四个不同级别的数学基准测试中,k0-math初代模型的成绩均超越了o1-mini和o1-preview。而在更具挑战性的OMNI-MATH和AIME竞赛级数学题库中,k0-math也分别达到了o1-mini最高成绩的90%和83%。
Kimi创始人杨植麟博士表示,当前AI领域正经历技术范式的转变,新技术如强化学习、合成数据及思维链的应用,正逐步解决高质量数据缺乏的问题,从而推动AI在多个领域和场景中的推理能力及智能水平上限的提升。
k0-math模型采用了这些先进技术,特别是强化学习和思维链推理技术,显著增强了其数学推理能力。通过模拟人类的思考和反思过程,该模型能够更有效地解决复杂的数学问题,帮助用户应对更具挑战性的数学任务。
在做题过程中,与常规模型追求快速给出答案不同,k0-math愿意花更多时间进行推理,包括深入思考和规划解题思路,甚至在必要时进行自我反思和改进,以提高答题的成功率。
Kimi还将这种强化学习技术带来的推理能力提升应用到了日常任务上。其近期上线的Kimi探索版,在搜索任务中展现了出色的推理能力,包括意图增强、信源分析和链式思考等三大方面。
这些推理能力使得Kimi探索版在处理复杂搜索调研任务时更加高效,能够更准确地理解和拓展用户的搜索意图,从海量信息中筛选出权威可靠的信源,并通过思维链推理处理复杂的研究问题。
据悉,Kimi智能助手自全面开放以来,已吸引超过3600万的月度活跃用户。随着k0-math数学模型和更强大的Kimi探索版的陆续上线,Kimi有望帮助用户解决更多具有挑战性的数学和搜索调研类任务。