关于行业报告系统
这套系统已经调整为面向行业报告 PDF 的中文搜索平台,核心目标是让用户通过标题与正文快速定位报告内容,并在结果列表中直接看到命中页码、相关片段和下载入口。
搜索模型
Elasticsearch 按 PDF 页级内容建立索引,搜索结果按 `doc_id` 聚合为单个 PDF 卡片。
结果展示
每张卡片显示标题、文件名、页数、字数、命中页码,以及前 5 条最相关片段。
下载地址
系统会根据文件名生成标准下载链接,格式为 `https://download.yikeaigc.com/hangyebaogao/文件名.pdf`。
索引字段约定
标题
`title`
正文内容
`text`
页码 / 页数
`page_num` / `page_count`
文件信息
`file_name`、`doc_id`、`relative_pdf_path`