小米16系列新动态 自研影像品牌玄戒{辅助芯片} 规:格!!也清晰了

2025-07-25 15:08:07      来源:半月谈

OpenAI正在推出一款名为ChatGPT的全新通用AI代理,该公司表示,它可以代表用户完成各种基于计算机的任务。

OpenAI表示,该代理可以自动浏览用户的日历,生成可编辑的演示文稿和幻灯片,并运行代码。

这款名为ChatGPT代理的工具融合了OpenAI之前代理工具的多项功能,包括Operator在网站上点击的能力,以及DeepResearch将数十个网站的信息整合成一份简明研究报告的能力。

OpenAI表示,用户只需使用自然语言输入ChatGPT即可与该代理进行交互。

ChatGPT代理将于周四向OpenAIPro、Plus和Team计划的订阅用户推出。要激活该工具,用户可以在ChatGPT的工具下拉菜单中选择代理模式。

ChatGPT代理的推出代表了OpenAI迄今为止最大胆的尝试,旨在将ChatGPT打造成一款能够为用户采取行动和分担任务的代理产品,而不仅仅是回答问题。

近年来,包括OpenAI、谷歌和Perplexity在内的硅谷公司已经推出了数十款承诺实现这一目标的AI代理。然而,这些早期版本的AI代理已被证明难以处理复杂任务,而且作为产品,它们似乎不如科技高管们所宣传的AI代理的终极愿景那么引人注目。

话虽如此,OpenAI表示ChatGPT代理比其以前的产品功能强大得多。

该公司的新代理可以访问ChatGPT连接器,允许用户连接Gmail和GitHub等应用程序,以便代理能够找到与你的提示相关的信息。OpenAI表示,ChatGPT代理可以访问终端,并且可以使用API访问某些应用程序。

OpenAI建议用户利用ChatGPT代理“规划并购买食材,制作四人份日式早餐”,以及“分析三个竞争对手并制作幻灯片”。这些功能需要ChatGPT代理解析网站、规划行动方案并使用工具——这比OpenAI之前尝试用代理解决的任务要复杂得多。

OpenAI表示,ChatGPT代理所基于的模型在多个基准测试中提供了最先进的性能。

该公司表示,ChatGPT代理模型在Humanity的LastExam(pass@1)考试中获得了41.6%的分数。这项考试难度极高,包含一百多个科目的数千道题目。这大约是OpenAI的o3和o4-mini在该测试中得分的两倍。

OpenAI表示,在已知最难的数学基准测试之一FrontierMath上,ChatGPT代理在能够使用工具(例如用于代码执行的终端)的情况下,得分可达27.4%。此前的最高得分来自o4-mini,得分仅为6.3%。

OpenAI指出,其在开发ChatGPT代理时始终将安全性放在首位,主要是因为该产品的一些新功能可能会使其在不法分子手中变得更加危险。OpenAI此前曾警告称,代理模型可能会带来更危险的功能。

OpenAI在ChatGPT代理的安全报告中表示,该模型在生物和化学武器领域被评定为高能力,OpenAI的防范框架将其定义为具有放大现有严重危害途径能力的模型。

OpenAI指出,目前尚无直接证据证明这一点,但已决定采取预防措施,并启动新的保障措施来降低这些风险。

ChatGPT代理的新安全措施包括一个在用户与产品交互时实时运行的监视器。

OpenAI表示,它会对输入ChatGPT代理的每个提示运行一个分类器,以确定该请求是否与生物学相关。如果是,OpenAI会通过第二个监视器运行ChatGPT代理的响应,以确定该内容是否可能被用来引发生物威胁。

OpenAI还表示,为了防止滥用,它已禁用ChatGPT代理的记忆功能。在ChatGPT的其他部分,OpenAI的记忆功能允许聊天机器人引用之前用户聊天记录中的信息。

然而,OpenAI表示,不法分子可能会利用ChatGPT代理中的该功能,通过快速注入攻击窃取敏感数据。不过,该公司表示,未来可能会重新考虑添加该功能。

ChatGPT代理听起来令人印象深刻,但它在现实世界中的能力究竟如何还有待观察。迄今为止,代理技术在与现实世界交互时已被证明相对脆弱。

即便如此,OpenAI表示,它已经开发出一种功能更强大的模型,能够兑现AI代理的承诺。

  携程数据显示,今年一季度,可免签入境中国的新加坡游客同比增长10倍,马来西亚游客同比增长9倍,法国、西班牙、泰国游客均同比增长约4倍。 端午小长假期间,平台入境游订单量同比增长115%。来自美国、英国、澳大利亚、韩国和马来西亚的游客最多。

责编:愈精编辑

女子货车内休息被冲走失联超天

  靳东,1976年出生于山东省,毕业于中央戏剧学院,国家一级演员,曾获得“青年五四奖章”先进个人、“全国德艺双馨电视艺术工作者”等荣誉称号。他还是第十四届全国政协委员。

那尔那茜岁户口随父迁出内蒙古

  据介绍,全省夏收工作6月7日基本结束,夏粮丰收已成定局。夏播工作从5月28日大面积展开,截至6月13日,已播种面积7915.2万亩,夏播工作大头落地。初步统计,目前全省因旱不能播种面积323万亩,若未来持续无有效降水,夏播进度将会进一步放慢。

男方资助女子近万留学分手后索回

  6月13日9时,国家防总针对广西、福建启动防汛四级应急响应,派出两个工作组分赴广西、福建协助指导;新增针对河北、内蒙古启动抗旱四级应急响应,并继续维持针对河南、山东的抗旱四级应急响应,两个工作组正在两省协助指导。

今年下半年亿国补在路上了

  张先生说,因为网球人群的增多,网球运动关联经济也更加活跃。球衣、球袜、球包以及打球的各种装备和周边产品,包括网球训练课都在走俏。比赛数量的增加,更是提升了各地运动场馆的利用率。

真的建议吃烤肉时配紫苏

  要解决这一问题,放松税收征管并非良策,因为这不仅涉及税务机关工作人员渎职问题,也影响社会公平,毕竟各地税务机关征管力度不一,将影响企业公平竞争,有违全国统一大市场构建。

韩红痛斥歌手耳机里都是提示音

  家住北京朝阳区的资深网球爱好者张先生在接受《环球时报》记者采访时感慨,“原来就不好预约的网球场,在郑钦文夺冠后,更不好约了。”他说:“我经常打球的球馆最早预约时间是提前一周的早上七点,但是现在到点就秒没,手一慢就显示预约完毕。”/p>

李乃文我们是来的

  张先生告诉《环球时报》记者,近年来走入网球馆和网球场的人越来越多,这一现象在郑钦文夺冠后更加明显,其中尤以青少年人群为多。/p>

伊朗向以色列发射其最强导弹

  笔者跟多位省级、市级税务人士交流得知,目前并没有全国性查税部署。一些地方根据当地税收大数据风险提示等对个别企业查税,是日常工作,也是税务部门正常履职。毕竟税务部门主要负责税收、社会保险费和有关非税收入的征收管理,发现偷逃税、少缴税行为,理应依法制止,否则就是渎职。