MathGPT来了！专攻数学大模型，解题讲题两手抓

允中发自凹非寺

量子位 | 大众号 QbitAI

大模型范畴又来新玩家。

据了解，学而思正在进行自研数学大模型的研制，命名为MathGPT。

面向全球数学爱好者和科研机构，以数学范畴的解题和讲题算法为中心。

现在现已获得阶段性作用，并将于年内推出根据该自研大模型的产等第使用。

据悉，学而思已将MathGPT作为公司中心项目，由CTO田密担任。

本年春节前，该项目现已发动相应的团队建造、数据、算力准备和技能研制。

此外，学而思现已发动在美国硅谷的团队建造，将成立一支海外算法和工程团队，在全球范围内招募优异的人工智能专家参加。

MathGPT与大言语模型（LLM）的差异

OpenAI在本年三月份发布了大言语模型GPT-4，国内百度、阿里也发布了各自的大模型产品，但通用言语模型更像一个“文科生”，在言语翻译、摘要、了解和生成等使命上有超卓体现，在数学问题的处理、解说、问答和引荐方面则存在显着缺乏：

回答数学问题常常出错，有些数学问题虽然能够处理，但办法更偏成年人，无法针对适龄孩子的常识结构和认知水平做适配。

“这种缺乏是由LLM模型的自身特色决定的。”

学而思AI团队担任人介绍，LLM大模型来自对海量言语文本的练习，因此最拿手言语处理。

职业内倾向根据LLM大模型做阅览、写作类使用，但如果想要在数学能力上有打破，就需要研制新的大模型。

因此，学而思决计组成团队专研MathGPT——数学范畴大模型，用自己在数学和AI上的多年堆集，面向全球范围内的数学爱好者和科研机构，做好AI大模型时代的数学根底工作。

学而思期望经过MathGPT补偿和霸占大言语模型的三个问题：

第一，标题要解对，现在GPT结果常常出现过错；
第二，解题步骤要安稳、明晰，现在GPT的解题步骤每次都不相同，并且生成内容常常很冗余；
第三，解题要讲的风趣、个性化，现在GPT的解释过于“学术”和机械，对孩子的学习体会很不友好。

为了完成这些目标，MathGPT将结合大言语模型和核算引擎两者的能力，大言语模型担任了解标题、分步解析，并在适宜的步骤自行调用核算引擎，这样能进步标题回答正确率。

根据海量名师解题进程的数据进行模型练习，模型的解题步骤可以更加明晰。

再引入优异教师的教学理念和办法，模型在解题趣味性上也能进一步进步。

据透露，MathGPT将先从中小学数学做起，逐步掩盖全年龄学段和解题种类。

做MathGPT，学而思凭什么

学而思作为获国家科技部批准的“才智教育国家新一代人工智能敞开立异渠道”建造单位，也是教育职业首批唯一一家人工智能“国家队”成员，在人工智能范畴有着多年的深入研究。

早在2017年，学而思便成立了AI lab 人工智能实验室。

据公开信息显示，根据才智教育人工智能敞开立异渠道助力，学而思AI lab获得各类尖端学术会议比赛冠军16项，亚军6项；

宣布世界期刊和会议高水平学术论文31篇，包括光学字符识别、图像、自然言语处理、语音以及多模态等多范畴的学术研究，在核算机视觉顶会以及自然言语顶会中均有多篇论文宣布；

申请专利220余项，授权专利150余项，软件著作权60余项。

△学而思AI lab在各类尖端学术会议比赛获奖情况

“以数学发家”的学而思至今已有20年的数学教学经验，堆集了庞大的数学相关数据，这些数据是进行MathGPT练习的必备物料。

别的，学而思的海外业务Think Academy在全球若干国家和地区深受数学爱好者喜欢，学而思的学生在每年的IMO和AMC等世界数学比赛中体现优异，每年都有多位学生在世界奥林匹克数学比赛中拿到金牌。

所以，学而思挑选在MathGPT方向发力也顺理成章。

本年2月，学而思学习机上线AI讲题机器人小。

据了解，小研制已有数年堆集，研制方向首要为数学等范畴的AI智能讲题能力，中心优势在于数理逻辑和运算。

在实测中，当学而思学习机用户配套的AR镜识别到一道手写或许印刷的数学核算题时，小机器人会对标题进行智能AI拆解分析，同时生成逻辑流畅、表达明晰的言语，将标题的解题办法解说出来。

该功能已掩盖的标题包括分数、小数等复杂核算，乃至一些“凑数、组合”的巧妙算法，已十分接近真人教师的解题作用。

△同一道数学标题在ChatGPT(上)和小（下）的回答对比

小相关技能于2020年发动研制，以学而思超3亿的专业题库数据作为根底，经过了3年的数据练习和打磨迭代。

另据了解，学而思学习机近期将会上线一款“AI帮手”，包括作文帮手、白话帮手、阅览帮手、数学帮手等相关功能，该AI产品将于5月11日敞开内测。

MathGPT的挑战和技能难题

如何利用大言语模型服务各行各业是当下社会的焦点问题。

大模型的出现是对生产力和生产关系的改动，各行各业都会受到影响，并会在大模型的助力下完成转型晋级。

教育职业和大模型有着天然的符合点。教育也是经过交流，把常识和信息传递给学生，大模型会让教育职业的数字化、智能化速度更快。

比方在教育范畴，Duolingo、Quizlet、可汗学院等产品首要和OpenAI协作，在GPT大模型上做微调和接口调用，增强原有的产品体会。

但也有一些范畴如数学、医学等，对AI的需求是准确、明晰、具有强壮的逻辑推理能力，且容错率低，通用LLM现在的功能体现还无法在上述范畴获得打破，未来是否可能获得打破尚不明晰。

以数学范畴为例，现在市场上有几个首要流派。

比方Google收买的Photomath、微软数学、Mathway、专注数学核算的WolframAlpha等产品，首要利用非LLM的传统AI技能加上数据库的方法处理数学问题。

走AGI道路的公司则测验让通用LLM“更懂数学”，比方GPT4在数学使命上比之前的3.5版别功能更好，谷歌旗下的Minerva模型也专门针对数学问题进行调优。

学而思挑选了另一条少有人走的路，不根据现有LLM做微调和接口调用、不做通用LLM，而是自研根据专业范畴的“数学大模型”MathGPT，致力于打造自主、安稳、可持续、高质量的学习处理方案。

学而思表明，乔布斯对电脑的定义是“思想的自行车”，MathGPT面向全球的数学爱好者，期望能成为学习数学、考虑数学的“自行车” ，帮助人们更好的处理学习数学、考虑数学的问题。

长远看来，数学思想代表着理性逻辑，是“思想的体操”，是一种根底能力，能够与许多职业产生相关。

未来，或许每个人都是程序员，用自然言语就可以编程，立异主意，与人协作，发明新事物，但是用自然言语编程的好坏很大程度取决于是否经过数学思想的练习。咱们期望经过MathGPT，帮助每个人更好地树立理性逻辑，从而终身成长，推进社会进步。

在大言语模型不断进化的浪潮下，不同的技能道路挑选孰优孰劣，仍有待评论和验证。

学而思自研独立的MathGPT大模型是否能够逾越通用模型在数学使命上的体现，是否更匹配不同人群的数学学习场景，这个问题还需要在立异实践中寻觅答案。

随着整个职业的深化开展和越来越多人才参与到这个范畴，相信不久的将来就能看到更为成熟的处理方案。

本文系量子位获授权刊载，观念仅为作者所有。

—完—

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。