过去一个月,AI在多个领域出现了巨大的飞跃。
宾夕法尼亚大学沃顿商学院教授Ethan Mollick在近日一篇文章中,总结了他所观察到的人工智能最新进展,以及这些进展的含义。Mollick的专业是研究创业与创新以及人工智能,并致力于探索人工智能对工作和教育的意义。
Mollick观察到,人工智能在近一个月发生了突破性的进展:
(1)在以GPT-4为代表的智能人工智能已经无处不在的情况下,更聪明的人工智能正在出现,尤其是Gen3和o1模型的发布;
(2)随着视觉功能的引入,ChatGPT 和 Gemini 现在都可以同时观看实时视频和语音交互。能够通过最常见的人类感官(视觉和声音)与人类实时互动的模型将 AI 变成与您同在房间里的陪伴者,而不是被困在计算机上聊天框中的实体;
(3)AI 视频突然变得非常好,但真正的飞跃来自上周出现的人工智能文本转视频生成器。
Mollick表示,我们还远远没有看到人工智能进步的终结,引人注目的不仅仅是个别的突破,而是变革的速度和广度。人工智能正以以不均匀的速度大幅跨越,甚至超出了人类能轻松衡量其影响的能力。
以下为Mollick文章全文翻译:
上个月,人工智能的状况发生了变化,仅在上周,变化速度就急剧加快。人工智能实验室推出了大量新产品,有些是革命性的,有些是渐进式的,让人难以跟上。我相信,这些变化中有几个是真正的突破,将重塑人工智能(也许还有我们的)的未来。以下是我们的现状:
智能人工智能如今无处不在
去年年底,只有一个公开可用的 GPT-4/ Gen2类模型,那就是 GPT-4。现在有六到十个这样的模型,其中一些是开源的,这意味着任何人都可以免费使用或修改它们。来自美国的有 OpenAI 的 GPT-4o、Anthropic 的 Claude Sonnet 3.5、谷歌的 Gemini 1.5、Meta 的开放 Llama 3.2、埃隆·马斯克的 Grok 2 和亚马逊的新 Nova。中国公司已经发布了三种似乎具有 GPT-4 级性能的开放多语言模型,尤其是阿里巴巴的 Qwen、R1 的 DeepSeek 和 01.ai 的 Yi。欧洲在这个领域只有一家参与者,那就是法国的 Mistral。这一堆令人困惑的名字意味着,构建有能力的人工智能并非只涉及 OpenAI 独有的神奇公式,而是任何拥有计算机科学人才以及能够获得训练模型所需的芯片和算力的公司都能够做到。
事实上,GPT-4 级别的人工智能在发布时令人震惊,引发了人们对未来的极大担忧,而现在它可以在我的家用电脑上运行了。Meta 本月发布的最新小型型号名为Llama 3.3 ,它提供了类似的性能,并且可以在我的游戏电脑上完全离线运行。微软新推出的微型Phi 4是 GPT-4 级别的,几乎可以在手机上运行,而其性能稍差的前代产品 Phi 3.5 更是可以。某种程度上的智能是按需提供的。
而且,正如我所讨论过的(很快会再次发布),这些无处不在的人工智能现在开始为代理提供动力,这些代理是可以追求自己目标的自主人工智能。你可以在我之前的文章中看到这意味着什么,我使用早期的代理进行购物比较和监控建筑工地。
非常聪明的人工智能现在已经出现
所有这些意味着,如果 GPT-4 级别的性能是 AI 可以达到的最高水平,那么随着我们逐渐习惯它们的能力,这可能足以让我们经历五到十年的持续变化。但没有迹象表明 AI 发展即将大幅放缓。我们之所以知道这一点,是因为上个月还有另外两个重要的发布——Gen3 模型的首次发布(你可以将它们视为 GPT-5 类模型)和 o1 模型的发布,这些模型可以在回答之前“思考”,这实际上使它们比其他 LLM 的推理能力强得多。我们正处于 Gen3 发布的早期阶段,所以我不会在这篇文章中过多地介绍它们,但我确实想谈谈 o1。
当 o1 以早期的 o1-preview 形式发布时,我曾讨论过它,但两个更复杂的版本 o1 和 o1-pro 的功能显著增强。这些模型在回答问题之前会花时间进行隐形“思考”——模仿人类的逻辑问题解决方式。这种方法称为测试时间计算,事实证明,它是让模型更好地解决问题的关键。事实上,这些模型现在已经足够聪明,能够以大大小小的方式为研究做出有意义的贡献。
举一个有趣的例子,我读到一篇关于最近社交媒体恐慌的文章——一篇学术论文指出,黑色塑料餐具可能会毒害人类,因为它们部分是由回收的电子垃圾制成的。该论文指出,一种名为 BDE-209 的化合物从这些餐具中渗出的速率非常高,接近美国环保署设定的安全剂量水平。很多人都扔掉了他们的锅铲,但麦吉尔大学的 Joe Schwarcz 认为这没有道理,并发现了一个数学错误,作者在文章的第七页错误地将 BDE-209 的剂量乘以了 10 倍——这个错误被论文作者和同行评审员忽略了。我很好奇 o1 是否能发现这个错误。因此,我从手机上粘贴了PDF 文本并输入:“仔细检查本文中的数学计算”。就这样。o1 立即发现了错误(其他 AI 模型没有)。