刚刚,国产大模型明星选手孟子 GPT 上新!

400 亿参数通用大模型正式发布,已敞开邀测。

数据显示,孟子 GPT-40B 版本全面抢先 7B 版本,大约提高 10-15 个百分点

并超越部分国内大模型,在多言语任务等方面接近 ChatGPT-3.5。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

孟子 GPT 来自澜舟科技,其开创人为 NLP 范畴大牛周明

自 21 年成立以来,澜舟科技先后发布孟子系列模型、MChat 以及多个笔直范畴模型,并拿下数亿元融资。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

这次发布是孟子 GPT 上新。除了根底大模型以外,澜舟科技还同步上线了行业大模型,以及根据大模型的产品应用。

分别是:

  • 根据孟子 GPT 打造的金融大模型

  • 根据孟子 GPT 打造的会议内容分析渠道 “澜舟智会”

根据这三方面上新,澜舟科技也表示,未来将全面拥抱 MaaS 服务,供给根底模型、大模型练习结构 / 工具包等服务。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

运用更老练预练习技能

据发布会介绍,孟子 GPT-40B 主要在中文及多言语能力、写作、多轮对话等方面做了提高。

经过网页、百科、社交媒体、新闻以及高质量开源数据集,孟子 GPT-40 中文能力更加突出。

而且根据万亿 tokens 多言语语料联合练习,更进一步提高了英语等言语能力。

在底层算法上,澜舟表示运用了更老练的预练习技能,使用 50 万指令数据精调,根据 70 亿参数量的奖惩函数进行强化学习。

根据 FlashAttention 的高效注意力核算,练习速度提高 8.5 倍。根据 TGI 等加快结构,推理速度提高 4.6 倍

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

在孟子 GPT-40B 根底上,还能更进一步练习出行业大模型。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

同步发布的澜舟智会,能提取出会议录音 / 视频的核心内容,生成总结和摘要,而且能对关键进行问答。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

就在最近,孟子大模型还登顶中文大言语模型测评榜单 C-Eval。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

澜舟已拿下数亿元融资

澜舟科技是以 NLP 技能为根底的认知智能公司,由 AI 大牛周明兴办,成立于 2021 年 6 月。

周明,当今 NLP 范畴成果最高的华人之一,他不仅是我国第一个中英翻译系统的研制者,还在 2019 年成为 AI 言语范畴第一流顶会 ACL(国际核算言语协会)主席。

1991 年在 NLP 重镇哈工大拿到博士学位后,周明进入清华任教;1999 年被微软亚洲研究院开创院长李开复挖走,后来不久成为 NLP 研究组负责人。

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

2020 年离开 MSRA 加盟创新工场担任首席科学家时,周明已担任 MSRA 副院长多年。

澜舟科技成立以来,主打加快 AI 落地,在轻量化大模型、笔直范畴大模型上都做了颇多探索。

据介绍,除了孟子大模型外,现在澜舟科技现已开源了 20 个左右大模型。

今年 3 月,澜舟科技最新拿下 Pre-A 轮融资,由北京中关村科学城公司领投,斯道资本和创新工场跟投。这是澜舟科技收获的第 2 轮融资,2 轮累计总额数亿元。

「量子位智库 仿生机器人沙龙」招募中

9 月 6 日,「量子位智库 仿生机器人沙龙」将在北京中关村举办,欢迎全行业仿生机器人玩家参与 ~

点击图片了解概况,企业报名可联系活动负责人王琳玉(微信:iris_wang17,请补白企业 + 名字)。沙龙观众通道后续开放,敬请期待 ~

国产百亿大模型再增一员!400 亿参数孟子 GPT 发布,各项任务平均提升 10-15%

点这里重视我,记得标星哦~

一键三连「分享」、「点赞」和「在看」

科技前沿发展日日相见 ~