Lazy loaded image
技术分享
🤗CNB快速体验Graph Rag
Words 3990Read Time 10 min
2025-8-12
2025-8-13
status
type
date
slug
summary
tags
category
icon
password
 

准备阶段

 

老规矩,安装必要软件包

创建虚拟环境并激活进入

 

 

开始安装

 

安装应用

创建工作目录并下载示例文本

初始化项目

 
可能遇到openai版本的问题,运行以下两个命令
 
这个命令会生成两个文件:.envsettings.yaml
  • .env 文件:这个文件用来放你的秘密密钥。打开它,你会看到 GRAPHRAG_API_KEY=<API_KEY>。你需要把 <API_KEY> 这部分替换成你自己的 OpenAI (或兼容OpenAi格式)的 API 密钥。这个密钥是让 GraphRAG 能够调用 AI 模型进行分析的凭证。
  • settings.yaml 文件:这是个高级配置文件,我们需要使用自定义的模型,全靠这个
 
注意这里也需要修改,防止API过载
 

运行索引命令

在终端里输入以下命令。-root ./ragtest 是告诉它我们的项目文件夹在哪里。
 

耐心等待

这个过程会花一些时间,因为它在进行大量的阅读、理解和分析工作。处理完成后,你会看到 ragtest 文件夹里多了一个 output 文件夹,里面有很多 .parquet 文件。这些文件就是它生成的知识图谱!
 

开始提问-查询 🔎

知识图谱建好了,现在可以像那个聪明的图书管理员提问了。GraphRAG 提供了两种主要的提问方式:

方式一:全局搜索

用于提一些宏观、总结性的问题。
  • 例子:问这本书的主要主题是什么?
  • 命令
它会查看整个知识图谱,给你一个高度概括的答案。
 

方式二:本地搜索

用于提一些关于特定人物、地点或事件的深入问题。
  • 例子:问“史高治”是谁,以及他的主要人际关系是怎样的?
  • 命令
 
它会聚焦在知识图谱中“史高治”这个节点,并找出所有与他直接相关的联系和信息,给你一个非常具体的答案。
 
示例回答:
 
 

 

持久化

 
此部分针对于CNB云开发环境的用户,如何持久化数据进行保存
  1. 创建 .ide 文件夹,并创建Dockerfile文件和settings.json,写入以下数据
 
 
  1. 接下来,我们在根目录也创建一个文件 .cnb.yml
 
 
这个配置文件启用了我们默认的配置文件,并实现了销毁容器自动提交改变,无需手动提交
 
  1. 把代码推送到仓库
这里我们不推荐用code-server自带的推送,采用命令为佳
 
 
 
很好,到这就全部完成了,下次启动云原生开发环境直接输入
 
即可还原与之前一样的环境
 

 

总结

总的来说,使用 GraphRAG 的流程就是:
  1. 准备 (Setup):安装工具,把你的文档(如 .txt, .pdf 等)放进 input 文件夹。
  1. 索引 (Index):运行 graphrag index 命令,让它阅读文档并建立知识图谱。这是“一次性”的投入。
  1. 查询 (Query):运行 graphrag query 命令,用 globallocal 方式反复向你的知识库提问。
 

可视化 docker compose up -d
 
 
 
 
 
 
MATCH (n)-[r]->(m) RETURN n, r, m LIMIT 50
 
 
 
下一章节,我们来谈谈 GraphRag的技术原理,怎么进阶使用,用途怎么样
上一篇
细谈Graph Rag
下一篇
与AI合作的12个范式

Comments
Loading...