数学家陶哲轩刚刚透露,他在 GPT-4 发布之前就获得了微软的访问权限。
也就是说,它与微软154页的《Spark of AGI》论文中的模型相同,是未经过安全培训但能力更强的纯血版。
他通过让 GPT-4 提出有关论文的问题来准备讲座。
他让GPT-4百思特网生成数学证明,发现以往阅读人类作品的经验完全不适用。
对于人工智能在数学研究中的表现,他给出了一个大胆但严谨的预测:
当与形式证明验证器、互联网搜索和数学符号包等工具集成时,如果使用得当,2026 年的人工智能将成为数学研究以及许多其他领域值得信赖的合著者。
除了数学研究,他在生活中也使用 GPT-4。
他经常使用 GPT-4 来回答随机的、措辞模糊的问题,这些问题以前需要在搜索引擎中微调关键字。
还有一位同事,他的亲属得了重症,被GPT-4写的慰问信感动得落泪。
在对话中,GPT-4 可以充当富有同情心的倾听者、热情的反馈提供者、创造性的灵感、翻译或老师,或者魔鬼的拥护者。
...
微软邀请他根据自己的经历写了一篇文章,开头他总结道:
在过去的几十年里,人类已经习惯于从信息技术中期待某些东西......
随着 GPT-4 等生成式人工智能工具的出现,所有这些期望即使不能完全放弃,也需要重新校准。
以下是Tao 的全文翻译,由公开发布版本GPT-4完成。
拥抱变化并重新设定期望
在过去的几十年里,人类已经习惯于从信息技术中期待某些东西。 这里是其中的一些:
随着 GPT-4 等生成式人工智能工具的出现,所有这些期望即使不能完全放弃,也需要重新校准。
这些工具非常适合处理模棱两可(甚至是轻微错误)的自然语言提示或从网页或 PDF 中提取的嘈杂数据。
我可以将最近一份数学预印本的前几页的 PDF 文件输入 GPT-4,让它生成预印本专家可能会问的六个聪明问题。 我计划使用这些类型的提示的变体来准备未来的演讲或开始阅读技术上复杂的论文。
最初,我试图根据我在编程或脚本语言方面的经验使提示尽可能准确。
当我放弃这种谨慎并简单地向 AI 提供大量原始文本时,最终取得了最好的结果。
这种稳健性可能允许人工智能工具与传统软件工具相结合,或相互结合,或与个人数据和偏好相结合。 它将扰乱各种工作流程,而目前单独使用的人工智能工具仅暗示了此类功能。
在对话中,GPT-4 可以充当富有同情心的倾听者、热情的反馈提供者、创造性的灵感来源、翻译或老师,或者魔鬼的代言人。
他们帮助我们在各个方面茁壮成长。
由于这些工具允许各种输入,我们仍在努力弄清楚如何充分利用它们。
我现在经常使用 GPT-4 来回答我以前需要使用精心设计的搜索引擎查询的随机和模糊的问题。
我要求它就我必须编写的复杂文档提供初稿建议。 我认识的一些人已经利用这些工具惊人的人工情商来获得支持、保证和安全的环境来探索他们的感受。 我的一位同事被一封 GPT-4 生成的安慰信感动了,他写给一位最近接受了毁灭性医学诊断的亲戚。
在对话中,GPT-4 可以充当富有同情心的倾听者、热情的反馈提供者、创造性的灵感、翻译或老师,或者魔鬼的拥护者。
他们帮助我们在各个方面茁壮成长。
当前的大型语言模型 (LLM) 通常能够令人信服地模仿特定知识领域(例如我自己的研究数学)中专家的正确回答。 但众所周知,仔细观察后,答案往往是荒谬的。
人类和人工智能都需要培养分析这种百思特网新型文本的技能。
我过去用来“嗅出”糟糕的数学论点的文体信号在 LLM 生成的数学中几乎没有用处。 只有逐行阅读才能判断是否有实质内容。
奇怪的是,即使是无意义百思特网的 LLM 生成的数学也经常引用正确的相关概念。
通过努力,人类专家可以将这些行不通的想法提炼成正确的、原创的论点。
2023 年级别的 AI 已经可以为实践数学家提供建设性的提示和有希望的线索,并积极参与决策过程。
当与形式证明验证器、互联网搜索和符号数学包等工具集成时,我预测,例如,2026 年级的人工智能(如果使用得当)将成为数学研究领域值得信赖的合著者,以及在许多其他领域。
下一个是什么? 这不仅取决于技术,还取决于现有的人类制度和实践如何适应。
当人工智能指导的研究生撰写的介绍性数学论文现在可以在不到一天的时间内生成——并且未来人工智能工具的准确性更高时,研究期刊将如何改变他们的出版和引用实践? 我们的研究生教育方法将如何改变? 我们是否积极鼓励和培训我们的学生使用这些工具?
我们基本上没有准备好处理这些问题。 将有令人惊叹的 AI 辅助成就展示和大胆实验,将它们融入我们的专业结构。 但也会有尴尬的错误、争执、痛苦的分手、激烈的争论和仓促的决定。
我们通常的技术范例将无法作为导航这些未知水域的充分指南。 也许最大的挑战是以尽可能安全、明智和公平的方式过渡到一个新的人工智能辅助世界。
还有一件事
Tao 也在个人博客中分享了创作这篇文章的一些花絮。
他和GPT-4先写了一份。
让GPT-4看完我写的东西后,我让GPT-4把它的文章改成自己的风格。
最后让GPT-4直接改写它的初稿,贴出来给大家对比一下。
(终于用上了自己写的)
有兴趣的可以去看看~
原来的:
4个版本比较:
参考链接: