JSONL 格式检查器、验证器与 LLM 数据集格式化工具

JSONL Linter, Validator & LLM Dataset Formatter
Copied!
Formatted JSONL (OpenAI messages)

JSONL 格式校验与整理工具 — 清理微调数据

JSONL 格式校验与整理工具用于验证和规范化用于大语言模型微调的 JSONL(JSON Lines)数据。它接受提示词/补全内容或自定义键名,并输出符合 OpenAI 风格的消息对象,每行一个,以便您可以将干净的数据上传到 OpenAI 或兼容的处理流程。

为何使用此工具?

  • 验证:及早捕获无效的 JSON,避免上传失败。
  • 规范化:将提示词/补全内容或输入/输出转换为统一的消息格式。
  • 无需服务器:所有处理均在浏览器中完成。

主要特性

  • 每行一个 JSON:解析严格的 JSONL 格式;报告首个错误行。
  • OpenAI 格式:输出 {"messages": [{"role":"user","content":"..."}, {"role":"assistant","content":"..."}]}
  • 灵活的输入:识别提示词/补全内容以及输入/输出键。
  • 复制:一键复制格式化后的 JSONL。

工作原理

该工具按换行符分割输入内容,将每个非空行解析为 JSON,并将已知的键名映射到消息结构。如果有任何行解析失败,它会显示行号和错误信息。结果会以每行一个紧凑 JSON 对象的形式写回。

试试 JSONL 格式校验与整理工具

将您的 JSONL 内容粘贴在上方。格式化后的输出会显示在下方。修复所有报告的行错误,并复制结果用于您的微调任务。