首页 > 生活感悟 > 免费教学 > 过去一个月,AI的变化是突破性的

过去一个月,AI的变化是突破性的

发布时间:2024-12-24 17:13:18来源: 15210273549

过去一个月,AI在多个领域出现了巨大的飞跃。

宾夕法尼亚大学沃顿商学院教授Ethan Mollick在近日一篇文章中,总结了他所观察到的人工智能最新进展,以及这些进展的含义。Mollick的专业是研究创业与创新以及人工智能,并致力于探索人工智能对工作和教育的意义。

Mollick观察到,人工智能在近一个月发生了突破性的进展:

(1)在以GPT-4为代表的智能人工智能已经无处不在的情况下,更聪明的人工智能正在出现,尤其是Gen3和o1模型的发布;

(2)随着视觉功能的引入,ChatGPT 和 Gemini 现在都可以同时观看实时视频和语音交互。能够通过最常见的人类感官(视觉和声音)与人类实时互动的模型将 AI 变成与您同在房间里的陪伴者,而不是被困在计算机上聊天框中的实体;

(3)AI 视频突然变得非常好,但真正的飞跃来自上周出现的人工智能文本转视频生成器。

Mollick表示,我们还远远没有看到人工智能进步的终结,引人注目的不仅仅是个别的突破,而是变革的速度和广度。人工智能正以以不均匀的速度大幅跨越,甚至超出了人类能轻松衡量其影响的能力。

以下为Mollick文章全文翻译:

上个月,人工智能的状况发生了变化,仅在上周,变化速度就急剧加快。人工智能实验室推出了大量新产品,有些是革命性的,有些是渐进式的,让人难以跟上。我相信,这些变化中有几个是真正的突破,将重塑人工智能(也许还有我们的)的未来。以下是我们的现状:

 

智能人工智能如今无处不在

去年年底,只有一个公开可用的 GPT-4/ Gen2类模型,那就是 GPT-4。现在有六到十个这样的模型,其中一些是开源的,这意味着任何人都可以免费使用或修改它们。来自美国的有 OpenAI 的 GPT-4o、Anthropic 的 Claude Sonnet 3.5、谷歌的 Gemini 1.5、Meta 的开放 Llama 3.2、埃隆·马斯克的 Grok 2 和亚马逊的新 Nova。中国公司已经发布了三种似乎具有 GPT-4 级性能的开放多语言模型,尤其是阿里巴巴的 Qwen、R1 的 DeepSeek 和 01.ai 的 Yi。欧洲在这个领域只有一家参与者,那就是法国的 Mistral。这一堆令人困惑的名字意味着,构建有能力的人工智能并非只涉及 OpenAI 独有的神奇公式,而是任何拥有计算机科学人才以及能够获得训练模型所需的芯片和算力的公司都能够做到。

事实上,GPT-4 级别的人工智能在发布时令人震惊,引发了人们对未来的极大担忧,而现在它可以在我的家用电脑上运行了。Meta 本月发布的最新小型型号名为Llama 3.3 ,它提供了类似的性能,并且可以在我的游戏电脑上完全离线运行。微软新推出的微型Phi 4是 GPT-4 级别的,几乎可以在手机上运行,而其性能稍差的前代产品 Phi 3.5 更是可以。某种程度上的智能是按需提供的。

我家用电脑上运行的 Llama 3.3 通过了“涉及奶酪双关语的押韵诗”基准测试,只有几个不自然的双关语。

而且,正如我所讨论过的(很快会再次发布),这些无处不在的人工智能现在开始为代理提供动力,这些代理是可以追求自己目标的自主人工智能。你可以在我之前的文章中看到这意味着什么,我使用早期的代理进行购物比较和监控建筑工地。

 

非常聪明的人工智能现在已经出现

所有这些意味着,如果 GPT-4 级别的性能是 AI 可以达到的最高水平,那么随着我们逐渐习惯它们的能力,这可能足以让我们经历五到十年的持续变化。但没有迹象表明 AI 发展即将大幅放缓。我们之所以知道这一点,是因为上个月还有另外两个重要的发布——Gen3 模型的首次发布(你可以将它们视为 GPT-5 类模型)和 o1 模型的发布,这些模型可以在回答之前“思考”,这实际上使它们比其他 LLM 的推理能力强得多。我们正处于 Gen3 发布的早期阶段,所以我不会在这篇文章中过多地介绍它们,但我确实想谈谈 o1。

当 o1 以早期的 o1-preview 形式发布时,我曾讨论过它,但两个更复杂的版本 o1 和 o1-pro 的功能显著增强。这些模型在回答问题之前会花时间进行隐形“思考”——模仿人类的逻辑问题解决方式。这种方法称为测试时间计算,事实证明,它是让模型更好地解决问题的关键。事实上,这些模型现在已经足够聪明,能够以大大小小的方式为研究做出有意义的贡献。

举一个有趣的例子,我读到一篇关于最近社交媒体恐慌的文章——一篇学术论文指出,黑色塑料餐具可能会毒害人类,因为它们部分是由回收的电子垃圾制成的。该论文指出,一种名为 BDE-209 的化合物从这些餐具中渗出的速率非常高,接近美国环保署设定的安全剂量水平。很多人都扔掉了他们的锅铲,但麦吉尔大学的 Joe Schwarcz 认为这没有道理,并发现了一个数学错误,作者在文章的第七页错误地将 BDE-209 的剂量乘以了 10 倍——这个错误被论文作者和同行评审员忽略了。我很好奇 o1 是否能发现这个错误。因此,我从手机上粘贴了PDF 文本并输入:“仔细检查本文中的数学计算”。就这样。o1 立即发现了错误(其他 AI 模型没有)。

免费教学更多>>

2024年终盘点|本田日产合并、大众“内部瘦身” 全球车市掀裁员、关厂狂潮 比亚迪唐 DM-i:大七座的多元魅力与生活畅想 比亚迪2025:三款潜力股,你pick哪一款? 本田日产官宣合并:电动化浪潮中“抱团取暖”,追赶特斯拉和比亚迪 日产和本田宣布正式签署合并协议,丰田计划在中国上海新建电动车工厂 24宝马中国MTN001B(BC)交易量0.1000亿元,最新收益率1.9400% 宝马重回中国市场豪华品牌销量榜首:单周销量超2万 试驾:2024 款奥迪 SQ8 低调性能惊艳亮相 骁龙8至尊版的三百万跑分:性能提升的意义何在?这次真不是噱头 连续两年斩获两项全国一等奖!5G让航道与ICU都有了“慧眼” 我国5G移动电话用户数突破10亿 5G发展进入下半场 微软Win11测试新功能:支持调整摄像头分辨率和帧率 消息称微软Win11已放弃显示不兼容水印计划 iOS 19可升级机型曝光,这些iPhone无缘新功能 纯血鸿蒙系统的优势和劣势对普通消费者的影响有哪些? 纯血鸿蒙深度体验评测:它真的值得你期待吗? IT之家纯血鸿蒙1.60原生正式版上架,支持新闻服务卡片 笔记本之外,平板也有补贴,这三款都有20%优惠,最低1599元 联想CES 2025平板阵容曝光:4款新品强势来袭 为什么手机电池都卷到7000mAh了 笔记本才6000mAh 选A不选I,9000系锐龙必冲的五大理由 三星 S24 Ultra 又降价了!再次跌破 6399 元成跳水冠军! 三星Galaxy M16 5G手机抢先看:天玑6300芯片、8GB内存 消息称三星明年将向国产手机供应2K/1.5K屏,涉及多种尺寸 惠普Omen Max 16游戏本曝光:酷睿Ultra 9+RTX 5080组合 每个瞬间都有爱:联想“美好假期”公益行第十季启航 联想CES 2025平板阵容曝光:4款新品强势来袭 新能源车型表现强劲 上汽通用转型“组合拳”显成效 上汽友道智途助力上海港成为全球首个5000万级集装箱港口! 上汽大众 2026 年“反攻”国内市场,2025 款汉城市领航智驾内测