首页 > 生活感悟 > 免费教学 > AI年末“狂欢”!OpenAI、谷歌、Meta、李飞飞发布重磅产品

AI年末“狂欢”!OpenAI、谷歌、Meta、李飞飞发布重磅产品

发布时间:2024-12-07 17:06:19来源: 15210273549
OpenAI为期12天的年终“技术盛宴”已结束第二天的直播。从当地时间12月5日发布的“满血版”o1模型和最贵ChatGPT Pro服务,到6日发布的强化微调(Reinforcement Fine-Tuning),无不证明AI世界又将迎来一次全新的产品升级和迭代。
 
在AI的狂欢中,其他科技公司也不甘示弱。有着“AI教母”之称的李飞飞创立的World Labs以及谷歌DeepMind团队本周先后发布重磅产品,让用户可以通过单张图片生成交互式3D场景,展示了AI在虚拟世界构建领域的巨大潜力。
 
Meta和马斯克的xAI也来凑了个热闹。Meta推出了今年的压轴AI大模型:Llama 3.3 70B,该模型据称能实现和Meta最大Llama 模型——Llama 3.1 405B同样的性能,成本还更低。xAI宣布Grok从今天起全球免费,但有使用限制。免费用户每2小时可以询问最多10个问题,每天最多可分析3张图片和生成4张图片。
 
随着各路玩家在AI领域竞赛的深入,AI的竞争焦点也转向了智能体和通用人工智能(AGI)。
 
据外媒6日的最新报道,OpenAI正在与微软磋商放弃AGI条款,以释放投资潜力。目前,最终决定尚未做出,OpenAI董事会将决定何时实现AGI。
 
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及告诉《每日经济新闻》记者,“基于多个大模型的AI智能体或多个智能体的协同,可能是未来AI技术发挥更大作用的一个重要趋势。”
 
OpenAI“12天活动”:“满血版”o1上线后,年度最大惊喜也来了
当地时间12月5日,OpenAI为期12天的圣诞季特别活动开启。
 
在第一天的活动上,OpenAI发布了推理大模型o1的“满血版”和进阶模式,以及每月收费高达200美元(约合人民币1450元)的ChatGPT Pro订阅服务。
 
“满血版”o1的特征是,在回答用户提问时不是“脱口而出”,而是形成一个类似人类思维方式的内部思维链条。该模型已面向ChatGPT Plus和团队用户开放,企业和教育用户则需要等到下周。
 
“满血版”o1比9月发布的预览版更快、更强大、更准确,同时增加了多模态输入(可以上传图片)的能力。OpenAI表示,现在的o1模型“思维已经被训练得更加简洁”(大概快50%),而且在回答困难现实问题时,出现重大错误的概率减少了34%。
 
 
图片来源:X
 
同时发布的ChatGPT Pro服务也引发了外界的广泛关注,每月200美元的订阅费是目前ChatGPT Plus定价的10倍。不过,用户可以无限量地使用o1模型(Plus用户当前有每周50条信息的限制),以及无限量使用o1 mini和高级语音模式,同时也能用上o1 pro模式,该模式“使用更多的计算来为最难的问题提供最佳答案”。
 
次日,OpenAI打出活动“第二弹”,推出了强化微调(Reinforcement Fine-Tuning)。阿尔特曼表示:“强化微调,效果出奇地好;它是我2024年最大的惊喜之一。”
 
 
图片来源:X平台
 
强化微调与标准微调不同,利用强化学习算法,研究者可以强化产生正确答案的思路,抑制产生错误答案的思路,只需要“几十个例子”(a few dozen examples)、甚至12个例子,模型就能以有效的新方式学习特定领域的推理,提升模型在特定领域任务中的推理能力和准确性。
 
据介绍,它甚至可以让简易版推理模型o1 mini的效果超过前一天刚发布的“满血版”o1。OpenAI预计将于2025年初公开发布强化微调功能。
 
李飞飞、谷歌Deepmind、Meta先后发布重磅模型
除了OpenAI的首批年末“王炸”外,本周还有诸多AI相关的重磅产品出炉。
 
作为AI领域影响力最大的女性和华人之一,斯坦福大学教授李飞飞于当地时间12月2日公布了其首个创业项目World Labs的成果——能用单张静态图片生成3D世界的AI产品。
 
在World Labs网站的演示里,由AI生成的场景均通过浏览器实时渲染而成,用户可以使用箭头键或键盘(WASD)键移动,然后单击并拖动鼠标实现交互,从而自由探索场景。World Labs的AI工具配备了可操控的滑块来调节模拟景深(DoF)与模拟推拉变焦(dolly zoom),当使用者将景深效果调至越强时,背景中的物体便会越发模糊,为整个视觉体验增添了更多层次感与真实感。
 
 
图片来源:World Labs推特截图
 
但World Labs目前只向公众发布了关于该技术的博客,外界能够体验的功能极为有限,而且并未放出任何代码和模型。
 
在单图生成3D世界领域探索的还有谷歌。北京时间12月5日凌晨,谷歌DeepMind在官网发布了大型基础世界模型Genie 2,可通过单张图片和文字描述生成种类多样的游戏3D世界,标志着AI在虚拟世界生成领域的又一次突破。
 
 
图片来源:谷歌Deepmind官网截图
 
简单来说,给Genie 2一张图片,它可以生成供人类游玩、可实时渲染、可控和可交互的无限3D世界,不需要借助任何游戏引擎。例如,输入“森林中的可爱人形机器人”,模型便可构建一个包含机器人角色和可探索环境的动态场景。用户可以通过键盘或鼠标操作角色在世界中进行跳跃、游泳等互动。
 
和Genie 1相比,Genie 2拥有长期记忆,即使是角色短暂离开画面,在重新进入视野后,依旧能被精准还原出来。
 
清华大学电子工程系长聘教授、清华大学精准医学研究院临床大数据中心共同主任吴及在接受《每日经济新闻》记者采访时表示,“从学术研究的角度来看,能否将文本意义上的世界模型与物理意义上的世界模型关联起来,把真正的物理世界进行建模,是AI技术能否取得突破的关键。”
 
World Labs和谷歌之后,Meta也来凑了个热闹,于当地时间12月6日推出了今年的压轴AI大模型:Llama 3.3 70B。Meta 生成式AI副总裁 Ahmad Al-Dahle在X发帖表示,纯文本的 Llama 3.3能实现和Meta最大Llama模型——Llama 3.1 405B同样的性能,成本还更低。
 
Al-Dahle还附上了一张图表,显示包括针对大模型语言理解能力的测试MMLU在内,Llama 3.3在一系列行业基准测试中表现优于谷歌的Gemini 1.5 Pro、OpenAI 的 GPT-4o和亚马逊本周稍早发布的Nova Pro。
 

免费教学更多>>

阿媒:人形机器人的未来就在今日中国 产业一线·跨年行 | 无人驾驶出租车的远程安全员,“现在更像是客服”? 傅利叶CEO顾捷:人形机器人是人类与人工智能共生的一种全新尝试 中国发展AI的主线:与实体经济深度融合 小红书概念股,又有多股涨停!“TikTok难民”:来自中国用户的欢迎“超出想象” 京东白条免息优惠为消费者一年节省近十亿元 2025年上海新房、二手房的三大预测,一起来看看我说的对不对? 2025年上海新房、二手房的三大预测,一起来看看我说的对不对? 二线城市房价上涨,冰火两重天,楼市回暖还有多远? 楼市2025大考:止跌回稳,不再是说说而已! 买房卖房都有优惠!新都房产最新政策出炉 2024全年高校CNS顶刊排行,老牌强校稳如泰山,新型大学异军突起 2025综合类大学排名:412所高校上榜,广西大学首进50强! 为什么iPhone销量这么高?究竟是哪里吸引你呢? 金属中框+3D超声波指纹+无线充+6K电池+潜望 vivo X200s参数曝光 两千元档“电竞战神”,一加 Ace 5越级挑战旗舰体验 努比亚Flip 2 5G折叠屏手机日本上市,售价64080日元 摩托罗拉2025新款Moto G系列登场:性价比与耐用性兼备! 中兴通讯与河钢集团启动全面战略合作 红米K80至尊版快来了:7000mAh电池,2K大屏,几乎没短板 TCL华星大手笔收购LG广州工厂,产能将大幅增加 还要整合ISP技术 有lcd新机,iQOO z10系列正在加速赶来 华为携手方大集团,数智化转型难题,未来前景几何? 第九届华为ICT大赛中国实践赛甘肃省赛获奖名单公布 OPPO全家桶初体验:实现1+1>2 ,带来“随心互联”畅快新体验! 消息称塔塔电子与小米、OPPO洽谈手机代工,要做“印度富士康” 马自达MX-5特别版限量200台,动力飙升至197马力! 2024 款宾利欧陆 GT Azure 评测:极致奢华,驾驭 Shenandoah 的曲线 元PLUS即将迎来全新改款,外观新调整,配备天使之眼系统 短试玛莎拉蒂Grecale Trofeo:百万级SUV体验感拉满