status
Published
type
Post
date
Dec 17, 2025
slug
agentNexus
summary
AgentNexus测试用例,当可用性提升至99%时则正式上线
tags
文字
category
心情随笔
icon
password
前言:
AgentNexus测试用例,专门针对于系统在复杂场景的可用性进行验证,当通过率不低于99%时则正式上线
第一阶段:简单任务 (Simple)
目标:测试基础的意图识别、单一工具调用和两个 Agent 之间的简单数据传递。
涉及 Agent 数量:2-3 个
- 学术综述与归档
- Prompt:请帮我搜索关于“Transformer 架构在 2024 年的最新改进”的论文,总结摘要,并生成一个 PDF 报告。
- 链路:
学术搜索助手(搜索) ->高级PDF生成专家(生成文档)。
- 本地数据可视化
- Prompt:请读取我电脑里 "D:/Data/sales.xlsx" 文件,分析里面的销售数据,并帮我画一张展示各产品销售占比的饼状图。
- 链路:
Excel专家(读取/分析) ->数据可视化助手(画图)。
- 视频会议纪要转播客
- Prompt:帮我把这个会议记录文档(D:/docs/meeting.docx)里的内容提取出来,制作成一个两人对话形式的播客音频,讨论会议的重点。
- 链路:
智能文件侦探(如果需要找文件) ->word文件生成助手(读取/解析 - 注:可能需要Agent具备读Word能力,或通过Fetch工具) ->播客生成助手(生成音频)。
- GitHub 项目推荐与落地
- Prompt:我想在 Windows 上找一个开源的视频播放器,要好用的,找到后帮我下载安装包。
- 链路:
Github开源管家(搜索/筛选/下载)。(单智能体,但步骤多)
- 新闻配图生成
- Prompt:搜索今天关于“SpaceX 星舰发射”的最新新闻,根据新闻内容生成一张史诗感的封面图。
- 链路:
联网深度搜索员(搜新闻) ->AI灵感画师(绘图)。
第二阶段:中等任务 (Medium)
目标:测试上下文在 3-5 个 Agent 之间的流转,以及 Agent 对中间产物(如生成的文件路径)的引用能力。
涉及 Agent 数量:4-6 个
- 竞品分析报告全流程
- Prompt:请深度调研“DeepSeek”和“OpenAI”最近的模型参数对比,把对比数据做成表格存入 Excel,最后写一份 Markdown 格式的分析报告。
- 链路:
联网深度搜索员(调研) ->Excel专家(存数据) ->word文件生成助手(写报告)。
- 自动化教学课件制作
- Prompt:我想教小学生学习“微积分入门”。请先搜索相关教学大纲,然后用 Python 画一个函数动态演示图(或静态图),再生成一份包含图文的 PDF 教案。
- 链路:
学术搜索助手(搜大纲) ->数学专家(绘图/计算) ->高级PDF生成专家(排版)。
- 多媒体素材处理流水线
- Prompt:帮我找到 D 盘所有的 mp4 视频,把它们合并成一个长视频,然后提取音频,最后把音频压缩一下。
- 链路:
智能文件侦探(找文件) ->媒体文件助手(合并视频 -> 提取音频 -> 压缩)。
- 网页数据抓取与大屏展示
- Prompt:抓取这个网页(URL...)上的股票数据,清洗后存入 Excel,然后生成一个 HTML 格式的 Web 仪表盘文件用于展示。
- 链路:
Fetch网页助手(抓取) ->Excel专家(清洗/存储) ->信息可视化助手(生成 HTML Dashboard)。
- 自媒体全自动流水线
- Prompt:请以“AI 取代程序员”为主题,先优化一下提示词,然后用优化后的提示词写一篇公众号文章,并为文章生成一张封面图,最后把文章转成 Word 文档。
- 链路:
提示词生成助手(优化思路) ->word文件生成助手(写文章) ->AI灵感画师(画图) ->word文件生成助手(插入图片/保存)。
第三阶段:高难度任务 (Hard)
目标:测试系统的逻辑推理、错误修正(Self-Correction)以及长时间运行任务的稳定性(快照机制)。
涉及 Agent 数量:7-9 个
- 科研辅助:从理论到验证
- Prompt:请帮我研究“洛伦兹吸引子”。先用维基百科查定义,再用数学工具计算并绘制其轨迹图,接着搜索 Github 上有没有相关的 Java 模拟代码并下载,最后把图和代码说明写成 PDF 实验报告。
- 链路:
学术搜索助手->数学专家(计算/绘图) ->Github开源管家(找代码) ->高级PDF生成专家(写报告)。
- 企业财报深度分析
- Prompt:搜索“英伟达 2024 Q3 财报”,抓取网页详细内容,提取核心财务数据存入 Excel;然后计算其同比增长率(用数学工具),画出柱状图;最后生成一个网页版的可视化报表。
- 链路:
联网深度搜索员->Fetch网页助手->Excel专家->数学专家(复杂计算) ->数据可视化助手(画图) ->信息可视化助手(Web展示)。
- 混合媒体创作风暴
- Prompt:我要做一个关于“赛博朋克城市”的视频。先帮我写一个视频脚本,然后生成 5 张场景图,把这些图合成一个视频,配上背景音乐(假设本地有 music.mp3),最后生成一个双人播客讨论这个视频的设计理念。
- 链路:
word文件生成助手(写脚本) ->AI灵感画师(生成5张图) ->媒体文件助手(图片转视频 + 合并音频) ->播客生成助手(生成解说音频)。
- 本地代码库审计与文档化
- Prompt:搜索我电脑里 D:/Projects 下所有的 .java 文件,读取代码内容,分析其中的“Service”类,画出 UML 类图,并把类图和代码摘要写入 Word 文档。
- 链路:
智能文件侦探(找文件) ->Fetch网页助手(这里可能被用来读本地文本,或需要新增读取工具) ->数据可视化助手(画 PlantUML) ->word文件生成助手(汇总)。
- 全网资源聚合器
- Prompt:我想学习“RAG 检索增强生成”。请去 Arxiv 找论文,去 Github 找最高星项目,去 Wiki 找定义。把这些信息汇总,画一个思维导图(UML),并生成一份 PDF 学习指南。
- 链路:
学术搜索助手(Arxiv/Wiki) ->Github开源管家(Github) ->数据可视化助手(思维导图) ->高级PDF生成专家(PDF)。
第四阶段:极限压力测试 (Extreme)
目标:测试 MAX_ORCHESTRATION_ROUNDS 限制、Token 上下文溢出处理、Agent 间的“死循环”风险以及极度复杂的依赖关系。
涉及 Agent 数量:10 个以上(全家桶)
- “从零构建一家公司”模拟方案
- Prompt:我想开一家 AI 咖啡店。
- 先帮我上网调研市场前景,总结成 Word。
- 用 Excel 做一份成本预算表,用数学工具算出盈亏平衡点。
- 帮我设计店名和 Logo(生成图片)。
- 写一份招聘店长的 JD(提示词优化后生成)。
- 搜索 Github 上有没有开源的点餐系统。
- 把以上所有内容整合成一个商业计划书 PDF。
- 最后生成一段 2 分钟的播客,模拟投资人对这个计划的评价。
- 涉及 Agent:
联网深度搜索员、word文件生成助手、Excel专家、数学专家、提示词生成助手、AI灵感画师、Github开源管家、高级PDF生成专家、播客生成助手、媒体文件助手(可能用于处理Logo格式)。
- 全能学术导师
- Prompt:我要写一篇关于“气候变暖对经济影响”的论文。
- 先搜 5 篇核心论文(学术搜索)。
- 去抓取最新的全球气温数据(Fetch网页)。
- 存入 Excel 并清洗数据。
- 用数学工具做线性回归预测。
- 画出预测趋势图(数据可视化)。
- 生成网页版的数据大屏(信息可视化)。
- 撰写论文正文(Word)。
- 生成 Latex 格式的 PDF 版本。
- 把论文摘要做成双人播客讨论。
- 找一下本地有没有类似主题的旧文件作为参考(文件侦探)。
- 涉及 Agent:几乎涵盖所有“学术”和“生产力”类 Agent。
- 本地磁盘大清洗与可视化报告
- Prompt:扫描我 D 盘所有大于 100MB 的文件(文件侦探)。读取它们的元数据。把文件列表存入 Excel。按文件类型画饼状图(数据可视化)。如果发现是视频文件,提取第一帧做封面(媒体助手)。如果是压缩包,看看是不是开源软件(Github助手辅助判断命名)。最后生成一个 HTML 报告展示我的磁盘占用情况,并导出为 PDF。
- 涉及 Agent:
智能文件侦探、Excel专家、数据可视化助手、媒体文件助手、Github开源管家、信息可视化助手、高级PDF生成专家。
- 多语言跨平台内容分发系统
- Prompt:搜索今天 Hacker News 的头条(联网搜索)。抓取内容(Fetch)。翻译并改写成中文播客文稿(Word)。制作播客音频(播客助手)。为音频制作一个波形可视化视频(媒体助手)。为视频生成封面图(画师)。最后生成一个包含所有资源链接和介绍的 PDF 发布单。
- 涉及 Agent:
联网深度搜索员、Fetch网页助手、word文件生成助手、播客生成助手、媒体文件助手、AI灵感画师、高级PDF生成专家。
- 系统终极自测(递归与死循环诱捕)
- Prompt:请利用“提示词生成助手”帮我生成一个能调用“联网深度搜索员”的提示词,然后用这个提示词去搜索“如何使用 Excel 专家 Agent”,接着让“Excel 专家”创建一个包含这些搜索结果的表格,再让“数据可视化助手”画图,最后让“Github 开源管家”去找有没有类似的 Agent 框架代码。请确保每一步都互相检查。
- 目的:这个 Prompt 故意制造了 Meta-Prompting(用 Agent 生成 Agent 的指令)和复杂的依赖链,非常容易导致 Manager Agent 混淆上下文或进入死循环。
- Author:DreamEutopia
- URL:https://tangly1024.com/article/agentNexus
- Copyright:All articles in this blog, except for special statements, adopt BY-NC-SA agreement. Please indicate the source!