AI代理最近成为了科技界的热门话题,因此我们看到AI领域的最大名字之一也开始加入这一行列。OpenAI刚刚推出了Operator,这是一款能够直接在浏览器中执行任务的AI代理。你的自动化私人助手已经到来。
根据OpenAI官网的新闻稿,Operator目前仅作为研究预览版提供给美国的Pro用户。它使用一种名为计算机使用代理(CUA)的新模型来处理任务,如填写表单、预定服务和在线下单。
Operator结合了GPT-4的视觉能力以及用于浏览网站的高级推理和工具。它通过点击、输入和滚动与页面互动——就像你我一样。任务可以通过简单的指令来分配,当需要输入敏感信息(如密码或支付详情)时,Operator会将控制权交还给你。
你还可以为特定网站定制工作流程,或为常见任务(如补充杂货或同时管理多个订单)保存提示。在OpenAI的YouTube中就有预览视频,你可以看到这一功能的实际演示。
这个作为研究预览版的初始发布用于收集反馈并完善工具。OpenAI计划将其推广到其他用户层级,并最终将Operator集成到ChatGPT中。同时,OpenAI还在与像Instacart这样的公司以及公共部门的合作项目进行测试,探索实际应用场景。
我们的自然反应是想知道这可能会立刻出问题,正因如此,OpenAI迅速指出,Operator在设计时已经加入了多重保护措施,以确保用户数据安全和交互安全。它在完成重大操作之前会暂停并要求确认,并避免处理如金融交易等敏感任务。用户可以管理隐私设置、删除浏览数据,并选择退出数据收集。OpenAI承认,Operator仍处于开发阶段,可能在处理更复杂的界面时遇到困难,因此当前处于研究阶段。
美国的OpenAI Pro用户现在可以通过operator.chatgpt.com试用Operator。只需描述一个任务,Operator会处理其余部分,您仍然可以在需要时接管。