OpenAI 周四宣布,它正在推出 Operator 的研究预览版,Operator 是一种通用 AI 代理,可以控制 Web 浏览器并独立执行某些操作。Operator将首先通过 ChatGPT 的 200 美元 Pro 订阅计划向美国用户推出。OpenAI 表示,它计划最终将此功能推广给其 Plus、Team 和 Enterprise 级别的更多用户。
OpenAI 首席执行官 Sam Altman 在周四的直播中表示:“[Operator] 将很快登陆其他国家。不幸的是,欧洲还需要一段时间。”
该初步研究预览可通过 operator.chatgpt.com 获得,但 OpenAI 表示很快将希望将 Operator 集成到其所有 ChatGPT 客户端中。
当 ChatGPT 用户激活 Operator 时,会弹出一个小窗口,显示代理用于完成任务的专用网络浏览器,以及代理正在执行的具体操作的说明。由于 Operator 使用自己的专用浏览器,因此用户在 Operator 工作时仍可以控制自己的屏幕。
OpenAI 表示,Operator 由计算机使用代理模型 (CUA) 提供支持,该模型结合了该公司GPT-4o模型的视觉功能和 OpenAI 更高级模型的推理能力。CUA 经过训练可以与网站前端进行交互,这意味着它不需要使用面向开发人员的 API 来利用不同的服务。
换句话说,CUA 可以像人类一样使用按钮、浏览菜单和填写网页上的表格。
暂无评论