快捷导航
打印 上一主题 下一主题

刚刚,OpenAI发布首个AI智能体!主动帮你订餐购物,直播翻车,使用前须要知

[复制链接]
查看: 867|回复: 18
  • TA的每日心情
    无聊
    2019-11-23 04:32
  • 签到天数: 1 天

    [LV.1]初来乍到

    8227

    主题

    8586

    帖子

    2万

    积分

    积分
    25509
    跳转到指定楼层
    楼主
    发表于 2025-2-14 18:12:54 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    马上注册,结交更多淘宝商家,享用更多功能,让你轻松玩转社区。

    您需要 登录 才可以下载或查看,没有帐号?立即注册

    x
    本日破晓,OpenAI CEO Sam Altman 公布了两个重磅消息。
    一个是 ChatGPT 用户不光将得到 o3-mini 的免费试用机会,Plus 付费订阅会员还将享有更多使用额度。
    另一个则是备受期待的首个智能体产物——Operator 研究预览版正式表态。好消息是,它能帮你主动网购了,但坏消息是,它大概比力轻易「翻车」。
    OpenAI 总裁 Greg Brockman 在 X 平台发文称:「Operator–一种可以或许使用自己的欣赏器为你实验任务的智能体。2025 年将是智能体之年。」

    OpenAI 让 AI 学会「用电脑」了?这是迈向 AGI 的第一步

    作为 OpenAI 首款真正模仿人类使用网页欣赏器的 AI 助手,Operator 可以或许主动完成预订观光留宿、餐厅预约和在线购物等复杂任务。 用户可以在多个种别中选择差异的主动化任务,涵盖购物、配送、餐饮和观光等范畴。
    这项功能将率先向订阅 200 美元 Pro 筹划的美国用户开放,随后渐渐扩展至 Plus、Team 和 Enterprise 级别用户。
    API 预计将在数周内推出。
    用户可通过 operator.chatgpt.com 访问该服务,OpenAI 筹划后续将其整合到 ChatGPT,不外,ChatGPT 在本日破晓又双叒叕崩了。
    简单来说,当用户启用 Operator 时,体系会弹出一个小窗口,展示专用 Web 欣赏器的使用界面,并实时分析正在实验的任务。在此期间,答应用户随时接受控制。
    技能层面,Operator 接纳远程云端欣赏器实验任务,无需依赖网站 API。
    它通过截图辨认界面元素,规划后续动作,形成「观察-筹划-实验」的闭环,直至完成任务。体系支持多任务并行处置处罚,运行服从高,且能保持登录状态。
    OpenAI 已与 DoorDash、Instacart、Priceline、StubHub 和 Uber 等公司创建相助。
    Instacart 首席产物官 Daniel Danker 就指出「OpenAI 的 Operator 是一项技能突破,它使订购杂货等流程变得非常简单。」
    按照惯例,OpenAI 也同期召开了一场发布会。Sam Altman 与 Yash Kumar、Casey Chu 和 Reiichiro Nakano 一起先容和演示 Operator。
    演示涵盖了多个现实应用场景,比如通过 OpenTable 为 Beretta 餐厅预订双人座位,原定 7 点档位不可用后改订 7:45。
    使用 Instacart 购物体系辨认购物清单——鸡蛋、菠菜、蘑菇、鸡腿、薯片,并中途接受添加更多鸡蛋等商品。
    在 StubHub 上试图搜刮并选购预算 500 美元以下的勇士队角逐门票;预约干净服务;以及筹划通过 DoorDash 点餐,订购烧烤披萨等。
    理想很优美,现实很骨感,Operator 现在最大的题目还是不敷稳固。刚开始演示时还算顺遂,但中后期的演示过程中遭遇连环「翻车」,乃至未能乐成加载干系网页。
    大概是为了确保演示乐成,眼瞅着演示职员输入的提示词是越来越长。
    X 平台大 V @rowancheung 也提前体验并分享了对 Operator 的观察。
    比方说 Operator 固然在 ChatGPT 中运行,但功能完全差异,重要专注于网页使用(点击、滚动、输入)而非天生长文本。现在体系仍存在限定,包罗部分网站会屏蔽 AI 访问,相助搭档集成有限。
    他指出 Operator 须要特定的使用方法来优化结果,就像 GPT-4 恰当 CoT 提示一样,但现在对 Operator 的最佳使用方式研究还很开端。
    不外,他还是挺看好这项技能能资助人们主动化处置处罚枯燥工作,从而将时间用于更有代价的事件。
    此前有消息称,Operator 在实验任务时使用的截图内容大概被恶意使用,导致「提示注入攻击」,存在严肃的安全隐患。
    因此,确保 Operator 的安全使用是重要任务。
    根据官方博客,OpenAI 重要是通过多层掩护步调防止滥用并确保用户牢牢控制 Operator。

    • 接受模式:Operator 在欣赏器中输入敏感信息(比方登录根据或付出信息)时要求用户接受。在接受模式下,运营商不会网络或截图用户输入的信息。
    • 用户确认:在完成任何巨大使用(比方提交订单或发送电子邮件)之前,Operator 应哀求答应。
    • 任务限定:Operator 颠末培训可以拒绝某些敏感任务,比方银行交易业务或须要高风险决议的任务,比方对工作申请做出决定。
    • 监视模式:在特别敏感的网站上,比方电子邮件或金融服务,Operator 须要对其举动举行密切监视,以便用户可以或许直接发现任何潜伏的错误。
    别的,OpenAI 针对 Operator 实验了全面的隐私和安全掩护步调。在隐私管理方面,用户可以选择退出模子训练,一键删除欣赏数据和汗青对话,并注销全部网站。
    为防范恶意网站的攻击,体系创建了多层防御机制,包罗检测并忽略提示注入、监控可疑举动和创建威胁辨认管道。同时,Operator 设有稽核体系来拒绝有害哀求和不当内容,对违规举动发出告诫或取消访问权限。

    「体验陈诉」公布,Operator 背后的 CUA 技能有多强?

    Computer-Using Agent (CUA)是支持 Operator 的核心技能,它融合了 GPT-4o 的视觉辨认本领和基于强化学习的高级推理功能。
    CUA 通过训练把握了与图形用户界面(GUI)交互的本领,能像人类一样使用屏幕上的按钮、菜单和文本框,无需依赖特定的使用体系或网络 API。
    据悉,其创新之处在于接纳通用界面方法,让 AI 能像人类般使用各类软件工具,突破了传统 AI 难以应对的浩繁细分应用场景。
    不外 OpenAI 坦言 CUA 另有很多须要改进的地方,比如现在就没法包管在全部场景下都能稳固运行。
    OpenAI 在 Operator 中摆设的 CUA 体系展示了差异场景下的性能体现。比如它在根本网页使用和重复性任务方面体现出色,如搜刮筛选、创建购物清单和音乐播放列表等任务的乐成率到达 10/10。
    在电商网站搜刮商品时也保持 9/10 的高乐成率。但在处置处罚复杂的房产搜刮等任务时,乐成率降至 3/10。
    测试还发现提示词的质量会明显影响任务乐成率,比方园地预订任务中,添加具体时间和使用指引后,乐成率从 3/10 提升至 8/10。
    体系在处置处罚不认识的 UI 界面和文本编辑时体现欠佳,常出现试错和低效使用,文本编辑任务的乐成率仅为 4/10。
    为了更好地量化 Operator 的性能指标,发布会上的演示职员也提到了 OS World 测试和 Web Arena 测试。 OS World 用于评估 AI 智能体在 Linux 等使用体系上的导航本领, Operator 得分 38.1%,高于其他公开体系但低于人类水平(72.4%)。
    Web Arena 则是测试评估 AI 智能体在电商网站和外交论坛等网站的导航本领, Operator 得分 58.1%,同样高出其他公开 AI 体系但未达人类水平。
    安全方面,演示环节先容了三个重要的安全思量方向。起首是体系拒绝实验有害任务,使用稽核模子和后续检测,并屏蔽特定网站。
    其次对于模子大概存在的错误,体系在举行购买、预订等关键使用前必须得到用户确认,限定高风险任务如银行交易业务,并在敏感网站启用观察模式。
    特别是针对网站对抗性攻击(如提示注入、越狱和垂纶),体系计划了审慎导航机制辨认并忽略提示注入,实时监控模子检测可疑内容,并创建检测管道快速辨认可疑访问模式。
    末了体系设有注入监控器(prompt injection monitor),雷同防病毒软件,实时监控模子检测可疑内容,发现可疑举动时会停息实验。 思量到无法预见全部安全隐患,OpenAI 只能先从小规模摆设开始,通过连续网络反馈来美满安全机制。
    ChatGPT 的崛起已经证明,巨大的产物通常诞生于无数次「不美满」的实验。
    OpenAI 也坦然认可现在由 CUA 支持的 Operator 只是一项早期技能,固然在特定场景已证明有用,但仍需通过用户反馈连续改进。
    而且,他们筹划进步体系在不认识界面的顺应本领,增强文本编辑准确度,优化对差异提示词的明白本领,并扩展可靠任务的范围。
    Altman 曾在月初的博客文章中表现,OpenAI 已经有信心构建通用人工智能(AGI),并推测 2025 年第一批 AI 智能体将「参加劳动力雄师」。
    包罗智谱昨天也公布推出了 GLM-PC。
    这是基于智谱多模态大模子 CogAgent,环球首个面向公众、回车即用的电脑智能体(agent)。它能像人类一样「观察」和「使用」盘算机,帮助用户高效完成各类电脑任务。
    可预见的是,这些智能体在将来将具备强盛的自主决议和任务实验本领,可以或许处置处罚复杂任务,乃至在某些范畴更换人类工作,并从根本上改变企业的生产方式和产出。
    在 OpenAI 的五级 AGI 门路图中,智能体正是处于 L3 级别,其特点是不光能思索,还能代表用户采取举措,实验复杂任务。 如许看来, Operator 不光是 OpenAI 智能体迈出的第一步,也将是迈向 AGI 的紧张一步。
    #欢迎关注爱范儿官方微信公众号:爱范儿(微信号:ifanr),更多出色内容第一时间为您奉上。
    爱范儿|原文链接· ·新浪微博

    免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!




    上一篇:东西部协作谱新篇 电商发达发展助力黔货出山
    下一篇:从流量至上到代价为王,2025 电商模式正在履历的深刻蜕变
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    2

    主题

    82

    帖子

    557

    积分

    积分
    557
    沙发
    发表于 2025-2-16 00:03:54 | 只看该作者
    厉害学习到了
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    67

    帖子

    502

    积分

    积分
    502
    板凳
    发表于 2025-2-16 21:20:41 | 只看该作者
    6666 不错好文章
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    67

    帖子

    508

    积分

    积分
    508
    地板
    发表于 2025-2-20 23:59:11 | 只看该作者
    写的不错 谢谢分享
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    72

    帖子

    520

    积分

    积分
    520
    5#
    发表于 2025-2-25 17:28:27 | 只看该作者
    支持楼主  来学习一下
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    68

    帖子

    503

    积分

    积分
    503
    6#
    发表于 2025-2-26 04:41:11 | 只看该作者
    很好学习了
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    77

    帖子

    542

    积分

    积分
    542
    7#
    发表于 2025-2-26 20:50:15 | 只看该作者
    来论坛来学习淘宝知识的
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    76

    帖子

    532

    积分

    积分
    532
    8#
    发表于 2025-2-26 22:17:37 | 只看该作者
    不知道实力运用这个方法会怎么样
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    0

    主题

    89

    帖子

    578

    积分

    积分
    578
    9#
    发表于 2025-3-1 09:16:42 | 只看该作者
    过来学习啦 哈哈
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    该用户从未签到

    1

    主题

    68

    帖子

    515

    积分

    积分
    515
    10#
    发表于 2025-3-2 01:24:45 | 只看该作者
    来学习下,每天学习才能不断地进步 开好淘宝店
    这里可以随意广告或签名,发布主题后即可显示,设置方法:右上角【我的设置-个人信息-个性签名】
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    精彩推荐

    让创业更简单

    • 反馈建议:admin@tao92.com
    • 工作时间:周一到周五 10:00-19:00
    • 淘九二电商网祝您店铺火火火!!!

    云服务支持

    精彩文章,快速检索

    关注我们

    Copyright   ©2015-2016  淘宝卖家开店运营论坛_淘宝卖家经验交流学习社区  Powered by©Tuyuanma  技术支持:tao92