RAG 分块可视化工具
Copied!
Input text
Chunk size (characters)
Chunk count
0 chunk(s)
Chunk 1
Chunk 2
Chunk 3
Chunk 4
Highlighted text (by chunk)
一款免费的RAG文本分块可视化工具,直观展示长文本如何被分割为重叠的文本块。设置字符数形式的块大小与重叠区间后,即可看到相同文本按交替颜色高亮标记的分块效果。支持复制全文或将文本块导出为JSON数组。完全在浏览器中运行,无需服务器支持。适用于构建检索增强生成(RAG)流程及调整文本块大小与重叠参数的场景。
为何使用这款RAG分块工具?
- 可视化:清晰查看每个文本块的起止位置及重叠机制。
- 可调节:即时调整块大小与重叠参数并同步更新视图。
- 可导出:复制完整文本或将分块结果以JSON数组形式复制到应用程序中使用。
- 私密性:所有处理均在您的浏览器内完成。
核心功能
- 块大小与重叠:设置基于字符的块大小与重叠度;工具采用滑动窗口(步长 = 大小 − 重叠)。
- 颜色高亮:最多支持四种交替背景色,以便清晰识别块边界。
- 块数量统计:显示生成的块总数。
- 复制全文 / 复制为JSON数组:复制原始文本或块字符串数组。
工作原理
该工具使用滑动窗口将输入字符串分割成多个片段:每个块的长度为“块大小”;下一个块从前一个块起始位置后“块大小 − 重叠”字符处开始,因此连续块之间会重叠“重叠”个字符。每个片段被包裹在具有特定类别的span标签中,并应用四种背景色之一。JSON数组即按顺序排列的块字符串列表。
尝试RAG分块可视化工具
粘贴您的文本并设置块大小与重叠量;当您输入或更改数值时,高亮显示的块会实时更新。使用图例将颜色与块顺序对应,并通过复制按钮获取完整文本或块的 JSON 数组。