480亿好未来, 攻坚大模型

  • 2025-08-06 06:29:47
  • 821

作者/何己派编辑/谭璐

2023年春,清晨的斯坦福大学校园,很安静,好未来创始人张邦鑫,约上CTO田密,一起散步。

二人心事重重,气氛有点严肃。张邦鑫一开口,直入主题:“能不能请你放下别的所有工作,只做大模型?”

那时,ChatGPT发布已有数月,张邦鑫第一时间关注,部署了非正式预研,没拿定主意要不要跟进。

他带着团队专程赴美,考察大模型的进展。

一周多时间,团队连轴转,英伟达、谷歌等巨头以及Figure这样的初创公司,一口气走了个遍。白天出门,夜里复盘讨论。

地陪司机忍不住嘀咕:“别人都是去哪儿玩,去哪儿看show,你们公司一天安排六七个访问行程,也太拼了。”

“走完一圈,挺受震撼,我们意识到,AI将给教育带来巨大颠覆。”田密接受《21CBR》记者专访时表示。

田密

那场清晨对话的最后,田密立下军令状——如果大模型做失败了,就离开公司。

他带着几十人的队伍,埋头攻坚,半年时间,自研发布数学大模型MathGPT,后取名为“九章”。

“九章”在数学科目尤其出众,2024年权威的MathEval数学能力测评中,位列国内外数十个大模型榜首,且深度应用到学习机等核心产品。

据刚披露的财报,3-5月,好未来净收入同比增长39%,AI驱动的智能硬件业务,成为重要主力。到7月末,好未来市值约480亿元人民币。

今年,田密团队开始推动大模型走进公立学校,第一版产品“九章爱学大小屏”,已在全国四个省市试点。

“AI老师,是好未来坚定要做的方向。”田密希望,真人老师能干的事,未来AI老师都能干,且干得更好。

以下为田密自述,经编辑整理:

押注“九章”

2022年11月底,ChatGPT问世,我们第一时间开通账号,用完以后,大家很惊叹。

过完春节就发现,身边讨论的人越来越多,产品已经破圈。邦鑫和我们几个人,一直在讨论,要不要跟进。

当时还没买新卡,就用手头一批英伟达V100卡,做了些预研测试。

大家觉得,还得去发源地看看,去美国一考察,感受很深刻,技术革命来了,好未来必须allin,全力投入大模型。

带着几十人的团队,我重新回到一线攻坚状态。

大模型要顺利起步,三要素的投入不能少,算力、算法人员、数据,都以亿为单位,很烧钱,成本投入是首要问题。

幸运的是,老板的决心很大。

起初我想过,租一批大厂的卡训练。邦鑫建议,自己买卡比较可控,在教育公司里,好未来的算力投入可能最大。

算法的关键在于人。当时,集团算法人员大约有100多个,几乎全部抽调来做大模型。

好未来已积累大量教育数据,而做模型的强化和微调,光有教育垂类数据不够。我们又专门建了一个基地,雇人做数据标注。

最初,团队打算从零开始,训练一个自己的大模型。后来,优秀的开源模型不断涌现,自己做预训练,不划算。

我们果断切换方向,基于DeepSeek、LLaMA等开源模型,结合学而思独有的教育数据,进行二次训练,再用多个模型进行交叉验证和投票,得到专业的教育大模型。

站在巨人肩膀上,模型能力大幅提升。

数学是大模型应用最具挑战的领域之一。做大模型的厂商很多,从数学切入的,只有好未来。

好未来做数学培训起家,积累很多,2017年就成立AILab,有传统AI打下的地基,过渡下来,过程很顺。

我们花了半年,做出了MathGPT第一版,2023年11月,MathGPT成为首批通过备案的教育大模型。

“九章”这个名字,源自《九章算术》,是世界上最早的印刷本数学书。“九章”好听好记且有故事,大家取名没有纠结,一致通过。

传统AI时代,针对多个应用场景,我们要用到上百个小模型,好未来就开发了大量AI助手,协助老师备课、批改作业等,功能较为零散、简单。

现在,一个大模型能搞定很多事。

更重要的变化在于,AI能力正逐步强大,能实现教、学、练的闭环,从过去以老师为中心,真正转向以学生为中心。

软硬结合

做大模型不是炫技,帮用户解决现实问题,才是第一位的。

九章大模型以数学起家,已将能力延伸到全学段、全学科。

比如,语文学科,提供作文辅导写作、作文批改等功能;英语学科,提供英语作文批改、口语对话练习等功能。

最早,团队从AI解题这项能力做起,我们很快意识到,这不是实际痛点。家长要的是AI能给孩子批改作业,把错题讲明白,减少他们辅导作业的工作量,降低请家教的成本。

九章就选择聚焦三个方向——批改、讲题、精准练。

传统AI,只能批改选择题、判断题等简单题型;一有大模型,不光支持所有题型,且在批改过程中,能指出答题错在哪步,具体关联哪个知识点。

至于讲题,好未来会实打实训练AI老师,划分6个维度的指标,由真人老师打分,评价其讲题的逻辑性、过程的连贯性等。

所谓精准练,基于知识图谱,从孩子做对或做错一道题,AI可判断其是否掌握知识点,精准推送孩子需要的题目。

这些技术能力,正以多种应用方式落地,既嵌入好未来现有的APP、智能硬件和学习服务,也有独立的APP和小程序“九章爱学”,并提供API和智能体接口。

我们也逐渐认清一个现实:纯AI软件很难单独落地,软硬结合可能是现在唯一的出路。

在教育硬件,学习机的复杂程度又最高。

2023年2月,好未来推出第一代学而思学习机,定价4000多元,锚定“好内容”,当时有人估算,仅内置的课程资源,至少等于30万元的培训费。

到第二代产品,大模型能力接入,升级为“好内容+好AI”,“好AI”即九章与DeepSeek形成的双核大模型,强化学习机的智能交互与精准分析能力。

今年5月,我们又发布旗舰产品T系列,搭载小思智慧岛Pro,这是个软硬一体化的摄像头体系。学生伏在桌上写作业,摄像头能直接拍到纸上题目,可智能提供作业辅导。

我们正在努力,往多模态AI老师的方向进化,省去每次主动唤醒AI的动作,这样,桌面放上教科书或试卷,学生手写时,摄像头实时查看,实时按步骤讲解,如同真人老师面对面辅导。

配合学习机等硬件的更新,九章大模型的AI能力,也保持以月为单位的迭代节奏。

提速进化

我们已开启AI产品进校业务,2024年底立项,今年3月推出第一版ToG的学习机。

第一批试点,已有三个月时间。

据学校反馈,两个班级对比,有AI工具赋能的班级,数学成绩的均分,较另一个班高出7分,预测学期末将拉开十几分的差距。

AI进校,有个逐渐接受的过程,关键在于信任和效果,我们有耐心,也有信心。

我们内部,也在锻造AI化组织。

一是转变思路,业务遇到问题,先问大模型,能不能做、怎么做;二是工作内容的“AI率”提升。

内部明确要求,未来数月,至少有某项工作由AI替代,如法务、财务的合同审核,基本交给大模型,大幅提效。

核心技术路线上,好未来会坚定走向“AI老师”。如同无人驾驶等级的L0到L5,教育行业的AI老师,大体也是如此进阶。

L1级别,AI只能打辅助,做些简单重复的工作。

当前所处的L2,AI能胜任某个模块,比如作业批改,属于“辅助驾驶”阶段,老师可以“脱手”“脱脚”,不能“脱眼”。

L3级别,进入“有条件的无人驾驶”,可部分“脱眼”,不能“脱脑”。我们希望,未来两三年能实现L3。

比如,家庭场景下,学习平板里的AI老师,可自主帮忙完成学业规划,也能实现做题-批改-讲题-练题的完整闭环。

一旦到L4级别,AI老师可跨场景切换,家长能放心把孩子的学习交给AI,除非出现个别极端情况,基本不用接管。

那时,教育业将迎来彻底变革。

我入局大模型两年,感到压力最大的,是刚接下任务时,一切未知,不知从何着手。

现在心里踏实多了,应对挑战的方法论,也很明确:从用户使用过程和经验中发现不足,思考技术改进的路径,探讨更丰富的交互形态。

就个人而言,之前十几年,待在腾讯、阿里,花名一直是“老师”。或许,冥冥之中就已确定我的角色。