淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区

标题: 刚刚，OpenAI发布首个AI智能体！主动帮你订餐购物，直播翻车，使用前须要知 [打印本页]

作者: 淘宝代运营 时间: 2025-2-14 18:12
标题: 刚刚，OpenAI发布首个AI智能体！主动帮你订餐购物，直播翻车，使用前须要知

本日破晓，OpenAI CEO Sam Altman 公布了两个重磅消息。
一个是 ChatGPT 用户不光将得到 o3-mini 的免费试用机会，Plus 付费订阅会员还将享有更多使用额度。

另一个则是备受期待的首个智能体产物——Operator 研究预览版正式表态。好消息是，它能帮你主动网购了，但坏消息是，它大概比力轻易「翻车」。

OpenAI 总裁 Greg Brockman 在 X 平台发文称：「Operator–一种可以或许使用自己的欣赏器为你实验任务的智能体。2025 年将是智能体之年。」

OpenAI 让 AI 学会「用电脑」了？这是迈向 AGI 的第一步

作为 OpenAI 首款真正模仿人类使用网页欣赏器的 AI 助手，Operator 可以或许主动完成预订观光留宿、餐厅预约和在线购物等复杂任务。用户可以在多个种别中选择差异的主动化任务，涵盖购物、配送、餐饮和观光等范畴。

这项功能将率先向订阅 200 美元 Pro 筹划的美国用户开放，随后渐渐扩展至 Plus、Team 和 Enterprise 级别用户。
API 预计将在数周内推出。
用户可通过 operator.chatgpt.com 访问该服务，OpenAI 筹划后续将其整合到 ChatGPT，不外，ChatGPT 在本日破晓又双叒叕崩了。

简单来说，当用户启用 Operator 时，体系会弹出一个小窗口，展示专用 Web 欣赏器的使用界面，并实时分析正在实验的任务。在此期间，答应用户随时接受控制。
技能层面，Operator 接纳远程云端欣赏器实验任务，无需依赖网站 API。
它通过截图辨认界面元素，规划后续动作，形成「观察-筹划-实验」的闭环，直至完成任务。体系支持多任务并行处置处罚，运行服从高，且能保持登录状态。

OpenAI 已与 DoorDash、Instacart、Priceline、StubHub 和 Uber 等公司创建相助。
Instacart 首席产物官 Daniel Danker 就指出「OpenAI 的 Operator 是一项技能突破，它使订购杂货等流程变得非常简单。」
按照惯例，OpenAI 也同期召开了一场发布会。Sam Altman 与 Yash Kumar、Casey Chu 和 Reiichiro Nakano 一起先容和演示 Operator。
演示涵盖了多个现实应用场景，比如通过 OpenTable 为 Beretta 餐厅预订双人座位，原定 7 点档位不可用后改订 7:45。

使用 Instacart 购物体系辨认购物清单——鸡蛋、菠菜、蘑菇、鸡腿、薯片，并中途接受添加更多鸡蛋等商品。

在 StubHub 上试图搜刮并选购预算 500 美元以下的勇士队角逐门票；预约干净服务；以及筹划通过 DoorDash 点餐，订购烧烤披萨等。

理想很优美，现实很骨感，Operator 现在最大的题目还是不敷稳固。刚开始演示时还算顺遂，但中后期的演示过程中遭遇连环「翻车」，乃至未能乐成加载干系网页。
大概是为了确保演示乐成，眼瞅着演示职员输入的提示词是越来越长。
X 平台大 V @rowancheung 也提前体验并分享了对 Operator 的观察。
比方说 Operator 固然在 ChatGPT 中运行，但功能完全差异，重要专注于网页使用（点击、滚动、输入）而非天生长文本。现在体系仍存在限定，包罗部分网站会屏蔽 AI 访问，相助搭档集成有限。

他指出 Operator 须要特定的使用方法来优化结果，就像 GPT-4 恰当 CoT 提示一样，但现在对 Operator 的最佳使用方式研究还很开端。
不外，他还是挺看好这项技能能资助人们主动化处置处罚枯燥工作，从而将时间用于更有代价的事件。
此前有消息称，Operator 在实验任务时使用的截图内容大概被恶意使用，导致「提示注入攻击」，存在严肃的安全隐患。
因此，确保 Operator 的安全使用是重要任务。
根据官方博客，OpenAI 重要是通过多层掩护步调防止滥用并确保用户牢牢控制 Operator。

接受模式：Operator 在欣赏器中输入敏感信息（比方登录根据或付出信息）时要求用户接受。在接受模式下，运营商不会网络或截图用户输入的信息。
用户确认：在完成任何巨大使用（比方提交订单或发送电子邮件）之前，Operator 应哀求答应。
任务限定：Operator 颠末培训可以拒绝某些敏感任务，比方银行交易业务或须要高风险决议的任务，比方对工作申请做出决定。
监视模式：在特别敏感的网站上，比方电子邮件或金融服务，Operator 须要对其举动举行密切监视，以便用户可以或许直接发现任何潜伏的错误。

别的，OpenAI 针对 Operator 实验了全面的隐私和安全掩护步调。在隐私管理方面，用户可以选择退出模子训练，一键删除欣赏数据和汗青对话，并注销全部网站。
为防范恶意网站的攻击，体系创建了多层防御机制，包罗检测并忽略提示注入、监控可疑举动和创建威胁辨认管道。同时，Operator 设有稽核体系来拒绝有害哀求和不当内容，对违规举动发出告诫或取消访问权限。

「体验陈诉」公布，Operator 背后的 CUA 技能有多强？

Computer-Using Agent (CUA)是支持 Operator 的核心技能，它融合了 GPT-4o 的视觉辨认本领和基于强化学习的高级推理功能。
CUA 通过训练把握了与图形用户界面（GUI）交互的本领，能像人类一样使用屏幕上的按钮、菜单和文本框，无需依赖特定的使用体系或网络 API。
据悉，其创新之处在于接纳通用界面方法，让 AI 能像人类般使用各类软件工具，突破了传统 AI 难以应对的浩繁细分应用场景。

不外 OpenAI 坦言 CUA 另有很多须要改进的地方，比如现在就没法包管在全部场景下都能稳固运行。
OpenAI 在 Operator 中摆设的 CUA 体系展示了差异场景下的性能体现。比如它在根本网页使用和重复性任务方面体现出色，如搜刮筛选、创建购物清单和音乐播放列表等任务的乐成率到达 10/10。
在电商网站搜刮商品时也保持 9/10 的高乐成率。但在处置处罚复杂的房产搜刮等任务时，乐成率降至 3/10。

测试还发现提示词的质量会明显影响任务乐成率，比方园地预订任务中，添加具体时间和使用指引后，乐成率从 3/10 提升至 8/10。
体系在处置处罚不认识的 UI 界面和文本编辑时体现欠佳，常出现试错和低效使用，文本编辑任务的乐成率仅为 4/10。
为了更好地量化 Operator 的性能指标，发布会上的演示职员也提到了 OS World 测试和 Web Arena 测试。 OS World 用于评估 AI 智能体在 Linux 等使用体系上的导航本领， Operator 得分 38.1%，高于其他公开体系但低于人类水平(72.4%)。
Web Arena 则是测试评估 AI 智能体在电商网站和外交论坛等网站的导航本领， Operator 得分 58.1%，同样高出其他公开 AI 体系但未达人类水平。

安全方面，演示环节先容了三个重要的安全思量方向。起首是体系拒绝实验有害任务，使用稽核模子和后续检测，并屏蔽特定网站。
其次对于模子大概存在的错误，体系在举行购买、预订等关键使用前必须得到用户确认，限定高风险任务如银行交易业务，并在敏感网站启用观察模式。
特别是针对网站对抗性攻击（如提示注入、越狱和垂纶），体系计划了审慎导航机制辨认并忽略提示注入，实时监控模子检测可疑内容，并创建检测管道快速辨认可疑访问模式。
末了体系设有注入监控器(prompt injection monitor)，雷同防病毒软件，实时监控模子检测可疑内容，发现可疑举动时会停息实验。思量到无法预见全部安全隐患，OpenAI 只能先从小规模摆设开始，通过连续网络反馈来美满安全机制。

ChatGPT 的崛起已经证明，巨大的产物通常诞生于无数次「不美满」的实验。
OpenAI 也坦然认可现在由 CUA 支持的 Operator 只是一项早期技能，固然在特定场景已证明有用，但仍需通过用户反馈连续改进。
而且，他们筹划进步体系在不认识界面的顺应本领，增强文本编辑准确度，优化对差异提示词的明白本领，并扩展可靠任务的范围。
Altman 曾在月初的博客文章中表现，OpenAI 已经有信心构建通用人工智能（AGI），并推测 2025 年第一批 AI 智能体将「参加劳动力雄师」。

包罗智谱昨天也公布推出了 GLM-PC。
这是基于智谱多模态大模子 CogAgent，环球首个面向公众、回车即用的电脑智能体（agent）。它能像人类一样「观察」和「使用」盘算机，帮助用户高效完成各类电脑任务。
可预见的是，这些智能体在将来将具备强盛的自主决议和任务实验本领，可以或许处置处罚复杂任务，乃至在某些范畴更换人类工作，并从根本上改变企业的生产方式和产出。
在 OpenAI 的五级 AGI 门路图中，智能体正是处于 L3 级别，其特点是不光能思索，还能代表用户采取举措，实验复杂任务。如许看来， Operator 不光是 OpenAI 智能体迈出的第一步，也将是迈向 AGI 的紧张一步。
#欢迎关注爱范儿官方微信公众号：爱范儿（微信号：ifanr），更多出色内容第一时间为您奉上。
爱范儿|原文链接· ·新浪微博

免责声明：如果侵犯了您的权益，请联系站长，我们会及时删除侵权内容，谢谢合作！

作者: zhangjjqb 时间: 2025-2-16 00:03
厉害学习到了

作者: wlsunyuan 时间: 2025-2-16 21:20
6666 不错好文章

作者: 凱伶 时间: 2025-2-20 23:59
写的不错谢谢分享

作者: 贲鹰杂牢 时间: 2025-2-25 17:28
支持楼主来学习一下

作者: xukke 时间: 2025-2-26 04:41
很好学习了

作者: qHGXRrfR 时间: 2025-2-26 20:50
来论坛来学习淘宝知识的

作者: qtribe 时间: 2025-2-26 22:17
不知道实力运用这个方法会怎么样

作者: 好酷 时间: 2025-3-1 09:16
过来学习啦哈哈

作者: guti 时间: 2025-3-2 01:24
来学习下,每天学习才能不断地进步开好淘宝店

作者: 蓝叶 时间: 2025-3-2 01:24
多谢楼主的分享

作者: kc1318 时间: 2025-3-2 02:39
谢谢楼主分享

作者: roomhome 时间: 2025-3-2 04:06
谢谢老板的帖子

作者: wallren 时间: 2025-3-2 04:29
很不错谢谢分享

作者: zjjime 时间: 2025-3-2 19:02
学习到了赶快利用一下去

作者: 19850107 时间: 2025-3-5 03:16
看看学习下支持个

作者: a22481234 时间: 2025-3-5 10:53
文章很好,学习了楼主

作者: yixin66 时间: 2025-3-6 14:22
66666666666666

作者: 东网标客 时间: 2025-3-16 11:09
楼主很优秀啊

欢迎光临淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区 (https://tao92.com/)