JSONL 格式检查器、验证器与 LLM 数据集格式化工具
Copied!
Formatted JSONL (OpenAI messages)
JSONL 格式校验与整理工具 — 清理微调数据
JSONL 格式校验与整理工具用于验证和规范化用于大语言模型微调的 JSONL(JSON Lines)数据。它接受提示词/补全内容或自定义键名,并输出符合 OpenAI 风格的消息对象,每行一个,以便您可以将干净的数据上传到 OpenAI 或兼容的处理流程。
为何使用此工具?
- 验证:及早捕获无效的 JSON,避免上传失败。
- 规范化:将提示词/补全内容或输入/输出转换为统一的消息格式。
- 无需服务器:所有处理均在浏览器中完成。
主要特性
- 每行一个 JSON:解析严格的 JSONL 格式;报告首个错误行。
- OpenAI 格式:输出
{"messages": [{"role":"user","content":"..."}, {"role":"assistant","content":"..."}]}。 - 灵活的输入:识别提示词/补全内容以及输入/输出键。
- 复制:一键复制格式化后的 JSONL。
工作原理
该工具按换行符分割输入内容,将每个非空行解析为 JSON,并将已知的键名映射到消息结构。如果有任何行解析失败,它会显示行号和错误信息。结果会以每行一个紧凑 JSON 对象的形式写回。
试试 JSONL 格式校验与整理工具
将您的 JSONL 内容粘贴在上方。格式化后的输出会显示在下方。修复所有报告的行错误,并复制结果用于您的微调任务。