近日,Open AI发布了能够根据文本生成超现实视频的工具Sora,多款震撼视频引爆科技圈刷屏,热度持续发酵占据AI领域话题中心,被认为是AGI实现过程里的重大里程碑事件。新一轮的人工智能浪潮给人类未来的生产和生活方式带来巨大而深远的影响,同时基于大模型的Agent智能体正在颠覆我们的未来。
23年8月,实在智能就已推出全球首款将计算机视觉、TARS大模型与RPA深度融合的落地产品——实在Agent智能体,实现你说,PC做。如今,实在智能又全新升级:手机Agent智能体已经会“玩”手机了!通过自主学习和模仿人类的点击和滑动手势,可以在手机上操作App执行各种任务。
从“你说PC做,所说即所得”人机协同办公的个人PC数字助理,到实现“你说,手机做”的超级手机助理,只需一句话直接传达自己的意图,就可以帮你操作所有电脑、手机的软件完成各类工作和生活的目标任务,从而不需要手动操作,我们正在迈向一个每个人都拥有多个AI Agent的时代。
AI Agent(人工智能助理),是一种可以实现自主理解、长期记忆、规划决策、执行复杂任务的智能体,正在探索AGI的道路上快速前进,成为人工智能应用的重要方向之一,比尔·盖茨为此重磅发文,非常值得一起来分享一下Agent智能体以及在电脑和手机工作的原理。
实在智能推出“手机+Agent”结合的手机智能体,可以打破手机App的界限,跨应用操作任何手机软件完成任务,与传统的Siri不同的是,手机智能体不是简单的命令执行者,而是规划、决策和执行的多面手,通过ISSUT(智能屏幕语义理解技术)视觉能力进行整个操纵过程,无侵入接口,也不需要系统后台访问用户的隐私、敏感数据来实现操作。
例如,春节开工期间,您正忙于工作,无暇分身向客户发送开工问候,类似于此的重复性工作,在手机智能体的帮助下就可以自动完成,您只需对手机说出“向标签为客户的好友发送开工问候”的需求,它就可以识别您的微信标签备注,向该标签下所有客户发送专属问候语,成为你的手机办公助理。
手机Agent能够通过模仿人类的直观动作来与手机应用程序交互,就像一个真人用户一样,可以查询天气定机票、预约餐厅订位、进行在线购物、编辑图片或制作视频,也可以操作办公软件发送邮件、采集业务数据和处理表格、提交工作流程审批单等等,只需一个指令,手机Agent智能体在瞬息间即可帮你完成。
实在智能推出的手机Agent智能体,验证了AI Agent的实用性,在移动Agent领域做出了一个很好的应用示范,其未来有更多创新的多模态框架探索,我们可以期待未来手机Agent智能体在提高工作效率、改善生活方式、辅助日常生活等多个方面的应用,将对商业、个人产生深远影响。