任务拆解准确率84%:实在Agent如何实现从自然语言到自动化流程的“思考—规划—执行”闭环
一、一句话背景
传统的RPA需要人工录制脚本、配置参数、处理异常;而真正的AI Agent,应该能听懂一句自然语言指令,自己拆解任务、自己规划步骤、自己跨系统执行。
实在Agent基于自研TARS流程垂直大模型,在1000余种企业软件、10000余个常用场景中,实现了 84.16%的任务步骤拆解准确率 和 86.87%的动作映射准确率。本文用3个核心模块讲清它是如何做到的。

二、整体架构:思考 → 规划 → 执行
|
环节 |
核心能力 |
技术支撑 |
|---|---|---|
|
思考 |
理解自然语言,转化为结构化任务意图 |
TARS流程垂直大模型 |
|
规划 |
将大任务拆解为有序子任务,匹配工具 |
深度规划引擎(六层拆解) |
|
执行 |
跨系统完成具体操作(取数、填单、发送等) |
ISSUT语义理解 + RPA自动化 |
三、模块1:思考 — TARS大模型如何“听懂人话”
核心能力:把“帮我将上周销售数据做成报表发给总监”这样的模糊指令,转化为机器可理解的结构化目标。
技术要点:
-
TARS大模型针对流程自动化、文档处理、数据处理、财经四大领域定向训练
-
千亿级高质量Tokens、百亿级参数,支持私有化部署
-
能够识别隐含的约束条件(时间范围、筛选规则、发送对象)
示例:
用户说:“每周五下午3点,从SRM系统下载新订单,金额超过10万的自动发邮件提醒我审阅”
Agent理解出:触发条件(定时)、数据源(SRM)、过滤规则(金额>10万)、动作(发邮件)、收件人(我)
四、模块2:规划 — 如何把一个大任务拆成可执行的步骤
核心能力:将高层目标拆解为有序的子任务树,并匹配对应的工具/系统。
六层拆解引擎:
-
目标理解 → 2. 规则抽取 → 3. 任务树生成 → 4. 工具编排 → 5. 执行校验 → 6. 记忆沉淀
完整案例展示:
用户指令:“收集京东销量前20的手机信息(名称、价格、链接),生成Excel保存到桌面,钉钉发给老板”
规划输出:
阶段①数据获取:打开京东→搜索“手机”→按销量排序→提取前20条
阶段②数据处理:生成Excel表格→写入数据→保存到桌面
阶段③结果交付:打开钉钉→找到“老板”→发送文件
用户可可视化查看规划过程,确认无误后一键执行。
五、模块3:执行 — “眼睛+手脚”保障动作落地
规划再好,执行不到位就是空谈。实在Agent通过两套能力闭环执行:
① ISSUT智能屏幕语义理解(眼睛)
-
基于视觉-语义联合建模,实时解析屏幕画面
-
不记坐标、不依赖API,像人一样“看懂”界面上的按钮、输入框、菜单
-
优势:老旧系统(C/S架构、虚拟机)、无API的软件、信创环境下的国产应用,都能操作
-
抗UI变更:按钮移动、颜色变化,基于语义仍能正确定位
② RPA超自动化技术(手脚)
-
模拟鼠标键盘操作,跨系统执行点击、输入、上传、下载等动作
-
TARS AI元素定位:即使元素低级属性全部改变,只要功能不变就能命中
-
遇到需判断的环节(如发票合规审核),Agent基于大模型自主决策,并附带推理依据
六、关键数据:84.16%准确率从何而来?
|
指标 |
实在Agent |
对比参考 |
|---|---|---|
|
任务步骤拆解准确率 |
84.16% |
GPT-4同场景 74.26% |
|
动作映射准确率 |
86.87% |
— |
|
综合得分 |
87.24% |
DeepSeek-R1 84.72% |
测试范围:1000余种企业软件 + 10000余个常用场景(制造业、金融、能源等)
行业认证:
-
全球软件成熟度CMMI-5级认证
-
中国信通院可信AI智能体平台最高评级(5级)
-
TARS大模型完成国家网信办模型+算法双备案
-
全栈信创适配:麒麟/统信/鸿蒙 + 鲲鹏/飞腾 + 达梦/金仓
七、企业真实收益(以制造业标杆客户为例)
裕同包装:部署实在Agent数字员工,覆盖7大业务模块
-
客服跟单、采购、计划物控、仓储库存、工程技术、财务、人资
-
合计年节省超过7800人天
八、总结
实在Agent通过 “TARS大模型(大脑) + ISSUT语义理解(眼睛) + RPA自动化(手脚)” 三层闭环,让AI从“会聊天”真正进化为“会干活”。
-
84.16%的任务拆解准确率,保障复杂业务流畅闭环
-
不依赖API,可操作任何有界面的系统(包括老旧和信创环境)
-
支持私有化部署,数据安全合规
你只需要说一句目标,实在Agent负责思考、规划并执行。
企业级智能体选型指南:为什么制造业、金融、电商头部企业选择了实在Agent
实在Agent私有化部署方案:您的数据不出域,您的业务全掌控
无需编程的电商数据抓取工具:2026年选型指南,帮你避开这5个坑

