Lazy loaded image
心情随笔
🤩AgentNexus测试用例
Words 2941Read Time 8 min
2025-12-17
2025-12-17
status
Published
type
Post
date
Dec 17, 2025
slug
agentNexus
summary
AgentNexus测试用例,当可用性提升至99%时则正式上线
tags
文字
category
心情随笔
icon
password
😀
前言: AgentNexus测试用例,专门针对于系统在复杂场景的可用性进行验证,当通过率不低于99%时则正式上线
 
 
 

第一阶段:简单任务 (Simple)

目标:测试基础的意图识别、单一工具调用和两个 Agent 之间的简单数据传递。
涉及 Agent 数量:2-3 个
  1. 学术综述与归档
      • Prompt:请帮我搜索关于“Transformer 架构在 2024 年的最新改进”的论文,总结摘要,并生成一个 PDF 报告。
      • 链路学术搜索助手 (搜索) -> 高级PDF生成专家 (生成文档)。
  1. 本地数据可视化
      • Prompt:请读取我电脑里 "D:/Data/sales.xlsx" 文件,分析里面的销售数据,并帮我画一张展示各产品销售占比的饼状图。
      • 链路Excel专家 (读取/分析) -> 数据可视化助手 (画图)。
  1. 视频会议纪要转播客
      • Prompt:帮我把这个会议记录文档(D:/docs/meeting.docx)里的内容提取出来,制作成一个两人对话形式的播客音频,讨论会议的重点。
      • 链路智能文件侦探 (如果需要找文件) -> word文件生成助手 (读取/解析 - 注:可能需要Agent具备读Word能力,或通过Fetch工具) -> 播客生成助手 (生成音频)。
  1. GitHub 项目推荐与落地
      • Prompt:我想在 Windows 上找一个开源的视频播放器,要好用的,找到后帮我下载安装包。
      • 链路Github开源管家 (搜索/筛选/下载)。(单智能体,但步骤多)
  1. 新闻配图生成
      • Prompt:搜索今天关于“SpaceX 星舰发射”的最新新闻,根据新闻内容生成一张史诗感的封面图。
      • 链路联网深度搜索员 (搜新闻) -> AI灵感画师 (绘图)。

第二阶段:中等任务 (Medium)

目标:测试上下文在 3-5 个 Agent 之间的流转,以及 Agent 对中间产物(如生成的文件路径)的引用能力。
涉及 Agent 数量:4-6 个
  1. 竞品分析报告全流程
      • Prompt:请深度调研“DeepSeek”和“OpenAI”最近的模型参数对比,把对比数据做成表格存入 Excel,最后写一份 Markdown 格式的分析报告。
      • 链路联网深度搜索员 (调研) -> Excel专家 (存数据) -> word文件生成助手 (写报告)。
  1. 自动化教学课件制作
      • Prompt:我想教小学生学习“微积分入门”。请先搜索相关教学大纲,然后用 Python 画一个函数动态演示图(或静态图),再生成一份包含图文的 PDF 教案。
      • 链路学术搜索助手 (搜大纲) -> 数学专家 (绘图/计算) -> 高级PDF生成专家 (排版)。
  1. 多媒体素材处理流水线
      • Prompt:帮我找到 D 盘所有的 mp4 视频,把它们合并成一个长视频,然后提取音频,最后把音频压缩一下。
      • 链路智能文件侦探 (找文件) -> 媒体文件助手 (合并视频 -> 提取音频 -> 压缩)。
  1. 网页数据抓取与大屏展示
      • Prompt:抓取这个网页(URL...)上的股票数据,清洗后存入 Excel,然后生成一个 HTML 格式的 Web 仪表盘文件用于展示。
      • 链路Fetch网页助手 (抓取) -> Excel专家 (清洗/存储) -> 信息可视化助手 (生成 HTML Dashboard)。
  1. 自媒体全自动流水线
      • Prompt:请以“AI 取代程序员”为主题,先优化一下提示词,然后用优化后的提示词写一篇公众号文章,并为文章生成一张封面图,最后把文章转成 Word 文档。
      • 链路提示词生成助手 (优化思路) -> word文件生成助手 (写文章) -> AI灵感画师 (画图) -> word文件生成助手 (插入图片/保存)。

第三阶段:高难度任务 (Hard)

目标:测试系统的逻辑推理、错误修正(Self-Correction)以及长时间运行任务的稳定性(快照机制)。
涉及 Agent 数量:7-9 个
  1. 科研辅助:从理论到验证
      • Prompt:请帮我研究“洛伦兹吸引子”。先用维基百科查定义,再用数学工具计算并绘制其轨迹图,接着搜索 Github 上有没有相关的 Java 模拟代码并下载,最后把图和代码说明写成 PDF 实验报告。
      • 链路学术搜索助手 -> 数学专家 (计算/绘图) -> Github开源管家 (找代码) -> 高级PDF生成专家 (写报告)。
  1. 企业财报深度分析
      • Prompt:搜索“英伟达 2024 Q3 财报”,抓取网页详细内容,提取核心财务数据存入 Excel;然后计算其同比增长率(用数学工具),画出柱状图;最后生成一个网页版的可视化报表。
      • 链路联网深度搜索员 -> Fetch网页助手 -> Excel专家 -> 数学专家 (复杂计算) -> 数据可视化助手 (画图) -> 信息可视化助手 (Web展示)。
  1. 混合媒体创作风暴
      • Prompt:我要做一个关于“赛博朋克城市”的视频。先帮我写一个视频脚本,然后生成 5 张场景图,把这些图合成一个视频,配上背景音乐(假设本地有 music.mp3),最后生成一个双人播客讨论这个视频的设计理念。
      • 链路word文件生成助手 (写脚本) -> AI灵感画师 (生成5张图) -> 媒体文件助手 (图片转视频 + 合并音频) -> 播客生成助手 (生成解说音频)。
  1. 本地代码库审计与文档化
      • Prompt:搜索我电脑里 D:/Projects 下所有的 .java 文件,读取代码内容,分析其中的“Service”类,画出 UML 类图,并把类图和代码摘要写入 Word 文档。
      • 链路智能文件侦探 (找文件) -> Fetch网页助手 (这里可能被用来读本地文本,或需要新增读取工具) -> 数据可视化助手 (画 PlantUML) -> word文件生成助手 (汇总)。
  1. 全网资源聚合器
      • Prompt:我想学习“RAG 检索增强生成”。请去 Arxiv 找论文,去 Github 找最高星项目,去 Wiki 找定义。把这些信息汇总,画一个思维导图(UML),并生成一份 PDF 学习指南。
      • 链路学术搜索助手 (Arxiv/Wiki) -> Github开源管家 (Github) -> 数据可视化助手 (思维导图) -> 高级PDF生成专家 (PDF)。

第四阶段:极限压力测试 (Extreme)

目标:测试 MAX_ORCHESTRATION_ROUNDS 限制、Token 上下文溢出处理、Agent 间的“死循环”风险以及极度复杂的依赖关系。
涉及 Agent 数量:10 个以上(全家桶)
  1. “从零构建一家公司”模拟方案
      • Prompt:我想开一家 AI 咖啡店。
          1. 先帮我上网调研市场前景,总结成 Word。
          1. 用 Excel 做一份成本预算表,用数学工具算出盈亏平衡点。
          1. 帮我设计店名和 Logo(生成图片)。
          1. 写一份招聘店长的 JD(提示词优化后生成)。
          1. 搜索 Github 上有没有开源的点餐系统。
          1. 把以上所有内容整合成一个商业计划书 PDF。
          1. 最后生成一段 2 分钟的播客,模拟投资人对这个计划的评价。
      • 涉及 Agent联网深度搜索员word文件生成助手Excel专家数学专家提示词生成助手AI灵感画师Github开源管家高级PDF生成专家播客生成助手媒体文件助手(可能用于处理Logo格式)。
  1. 全能学术导师
      • Prompt:我要写一篇关于“气候变暖对经济影响”的论文。
          1. 先搜 5 篇核心论文(学术搜索)。
          1. 去抓取最新的全球气温数据(Fetch网页)。
          1. 存入 Excel 并清洗数据。
          1. 用数学工具做线性回归预测。
          1. 画出预测趋势图(数据可视化)。
          1. 生成网页版的数据大屏(信息可视化)。
          1. 撰写论文正文(Word)。
          1. 生成 Latex 格式的 PDF 版本。
          1. 把论文摘要做成双人播客讨论。
          1. 找一下本地有没有类似主题的旧文件作为参考(文件侦探)。
      • 涉及 Agent:几乎涵盖所有“学术”和“生产力”类 Agent。
  1. 本地磁盘大清洗与可视化报告
      • Prompt:扫描我 D 盘所有大于 100MB 的文件(文件侦探)。读取它们的元数据。把文件列表存入 Excel。按文件类型画饼状图(数据可视化)。如果发现是视频文件,提取第一帧做封面(媒体助手)。如果是压缩包,看看是不是开源软件(Github助手辅助判断命名)。最后生成一个 HTML 报告展示我的磁盘占用情况,并导出为 PDF。
      • 涉及 Agent智能文件侦探Excel专家数据可视化助手媒体文件助手Github开源管家信息可视化助手高级PDF生成专家
  1. 多语言跨平台内容分发系统
      • Prompt:搜索今天 Hacker News 的头条(联网搜索)。抓取内容(Fetch)。翻译并改写成中文播客文稿(Word)。制作播客音频(播客助手)。为音频制作一个波形可视化视频(媒体助手)。为视频生成封面图(画师)。最后生成一个包含所有资源链接和介绍的 PDF 发布单。
      • 涉及 Agent联网深度搜索员Fetch网页助手word文件生成助手播客生成助手媒体文件助手AI灵感画师高级PDF生成专家
  1. 系统终极自测(递归与死循环诱捕)
      • Prompt:请利用“提示词生成助手”帮我生成一个能调用“联网深度搜索员”的提示词,然后用这个提示词去搜索“如何使用 Excel 专家 Agent”,接着让“Excel 专家”创建一个包含这些搜索结果的表格,再让“数据可视化助手”画图,最后让“Github 开源管家”去找有没有类似的 Agent 框架代码。请确保每一步都互相检查。
      • 目的:这个 Prompt 故意制造了 Meta-Prompting(用 Agent 生成 Agent 的指令)和复杂的依赖链,非常容易导致 Manager Agent 混淆上下文或进入死循环。

上一篇
如何安装绿色版的Latex编译器
下一篇
A2A协议深入介绍

Comments
Loading...