PageIndex

基于推理的文档检索引擎。...

【产品介绍】

PageIndex 是一款基于推理的文档检索引擎,采用无向量数据库架构。

该产品通过将文档转换为树状层级索引结构,模拟人类专家的阅读和信息提取方式,利用大语言模型进行推理式检索。

【核心功能】

结构化索引:将 PDF 文档转换为类似目录的树状结构,保留完整文档层级

推理式检索:通过树搜索实现上下文感知的信息提取,无需向量相似度匹配

可追溯性:提供明确的页面和章节引用,检索过程透明可解释

零基础设施:无需向量数据库、文档分块或嵌入管道

该产品在 FinanceBench 金融文档分析基准测试中达到 98.7% 准确率,适用于金融报告、法律文件、技术手册等专业长文档分析场景。

项目开源地址:https://github.com/VectifyAI/PageIndex