【新智元导读】 在3月份GPT-4正式发布的时分,陶哲轩作为数学范畴的专家获得了提早体会的机会。当他运用了一段时间之后写下了一篇文章,以为AI技能将彻底改动学术界。

3个月前,OpenAI的GPT-4在万众瞩目中登场,多模态功能震惊了人类,在各大考试中取得高分,号称史上最先进AI系统。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

直至今日,在各大测评榜单中,GPT-4依旧时常位居第一。

今日陶哲轩忽然发文称,其实今年早在GPT-4发布前,微软首席科学家Eric Horvitz就曾邀请自己试用过GPT-4模型。

试用完后,陶哲轩将自己的体会和考虑写成了一篇文章。

陶哲轩表示,还不到半年,再从头看这篇文章,就会发现AI技能的开展有多快。而这个回望的过程,也是很风趣的。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

陶哲轩的GPT-4初体会

在曩昔的几十年里,人类一直在被信息技能规训,渐渐习惯了一些状况。比方:

  • 硬件和软件将以摩尔定律的速度改进(在功能、用户体会和可靠性等指标上),然后再过渡到更多的渐进式改进。
    • 陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼
  • 个别软件东西能够可靠地产生高质量的输出,但输入数据有必要是最高质量的,并且格式上需求按照东西要求的特定办法来仔细预备。
  • 东西越先进,标准和特殊状况就越杂乱。除非有精心设计的标准,否则东西之间(特别是不同供货商之间)的可交互性就会成为严重的技能应战。
  • 人类将做出所有关键的执行决议计划;软件东西则通过它执行人类指令的成功或失利的成果来影响人类的决议计划过程。

跟着 GPT-4 等生成式人工智能东西的呈现,所有这些习惯即使不能被完全放弃,也需求从头调整。

这些东西在处理遣词含糊(且略有过错)的自然语言提示,或处理从网页或 PDF 中抓取的喧闹数据时表现非常超卓。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

我向 GPT-4 供给最近一份数学预印本的前几页 PDF,它能够生成几个质量还不错的学术问题。

我运用类似提示词的变体来预备我今后的讲演或阅览技能层面比较杂乱的论文。

起初,我根据编程或脚本语言的经历,努力使自己写的提示词尽可能精确。

最终,当我只是简单地向 AI 扔了许多原始文本,并没有小心谨慎地写提示词时,最好的成果却呈现了。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

如此高的容错功能使人工智能东西能与传统软件东西合作作业,或者让AI东西彼此集成协同作业,或者与没有处理过的个人数据和个人偏好结合起来作业。

这种AI东西和现有的软件东西,原始数据协同合作作业,或者让AI东西彼此合作作业的办法,将彻底改动人们的作业流程,而不只是是像现在相同孤立地给人类行为供给一些主张。

由于这些AI东西能够理解各种模态的输入,咱们仍在试验怎么充分利用它们的,开发它们的潜力。

我现在经常运用 GPT-4 来答复随意和遣词含糊的问题,而以前我会要花许多精力去搜索引擎里寻觅这些问题的答案。

我现已让来它来帮我起草一些杂乱文件的初稿了。

我认识的其他人现已运用这些东西的杰出人工心情智能来获得心理上的支撑、舒适感和安全感。

我的一位同事的亲属最近被诊断出重病,但这位同事后来被一封 GPT-4 生成的安慰信感动流泪了。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

在和人类的对话交流中,GPT-4 能够充当赋有同情心的倾听者、热情的回应者、创意女神、翻译或教师,或者魔鬼代言人。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

它们能够协助咱们在任何方面都快速而继续地生长。

当前的大语言模型(LLM)通常能够令人信服地仿照某个常识范畴(例如我自己的研讨数学)中专家的正确答复。

但众所周知,假如你仔细检查他们的答复,回应中经常会有胡言乱语的内容。

人类和人工智能都需求培养分析这种「新型文本」的技能。

我传统上用来「勘探」某些离谱的过错数学论证的文体信号,对 LLM 生成的数学文本没有多大用处。

只有逐行仔细地阅览才能辨别出是否有任何本质内容。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼

奇怪的是,即使是无意义的 LLM 生成的无意义的数学内容也经常引用相关概念。

只需花些功夫,人类专家能够将不可行的想法修改为正确并且是原创的观念。

2023年的AI现已能够生成关于数学家有用的提示和头绪,然后在数学家的决议计划和考虑过程中发挥作用。

当与方式证明验证器、互联网搜索和符号数学包等东西集成到一同合作作业时,我猜测,只需运用得当,2026 年的人工智能将成为数学研讨中值得信赖的合著者,在许多其他范畴也应该如此。

之后会怎么开展?这不只是取决于技能,还取决于现有的人类准则和机制怎么习惯。

现在AI 指导下的研讨生能够在不到一天的时间内生成一篇入门级的数学论文,并且未来 AI 东西的精确性还要高得多。

陶哲轩:2026年GPT帮我合著数学论文!提前试用「完全版」GPT-4,大受震撼
面临这种状况研讨期刊将怎么改动他们的宣布和引用政策?咱们的研讨生教育办法将怎么改动?咱们会积极鼓舞和训练咱们的学生运用这些东西吗?咱们还没有预备好答复这些问题。将AI东西纳入咱们的专业构架后,取得的AI辅佐下的成就和英勇的测验都会很令人震惊。但同时也会伴随令人尴尬的过错、争议、痛苦的破坏、激烈的辩论和草率的决定。咱们现有的技能典范无法作为探索这些未知范畴的指南。 或许最大的应战将是怎么尽可能安全、正确和公平地过渡到一个由人工智能辅佐的新世界。 参考资料:unlocked.microsoft.com/ai-antholog…