В этой статье
Что такое форматы TSV и CSV?
TSV (значения, разделенные табуляциями) и CSV (значения, разделенные запятыми) — это текстовые форматы для хранения табличных данных. Каждая строка представляет запись, с колонками, разделенными символом-разделителем — табуляциями для TSV и запятыми для CSV.
Хотя функционально схожи, два формата имеют разные преимущества. TSV проще, так как табуляции редко встречаются в данных. CSV более широко принят как формат обмена, стандартизирован RFC 4180.
Как работает конвертация TSV в CSV
Конвертация TSV в CSV включает замену разделителей табуляции на запятые с обработкой правил кавычек.
- Замена разделителя — каждый символ табуляции, разделяющий поля, заменяется запятой
- Кавычки полей — поля, содержащие запятые, двойные кавычки или переносы строк, обрамляются двойными кавычками по правилам RFC 4180
- Экранирование кавычек — существующие двойные кавычки в значениях полей экранируются удвоением
Попробуйте бесплатно — без регистрации
Конвертировать TSV в CSV →Когда конвертировать TSV в CSV
Конвертация TSV в CSV устраняет пробелы совместимости между инструментами, ожидающими разные форматы разделителей.
- Экспорт из электронных таблиц — данные, скопированные из Google Sheets или Excel, обычно разделены табуляциями, но последующие инструменты часто требуют формат CSV
- Импорт в базу данных — большинство утилит импорта баз данных поддерживают CSV нативно
- Обработка лог-файлов — серверные логи часто разделены табуляциями и требуют конвертации в CSV
Часто задаваемые вопросы
Что такое RFC 4180?
RFC 4180 — это стандарт, определяющий формат CSV. Ключевые правила: поля разделяются запятыми, записи — переносами строк, поля с запятыми или кавычками должны быть в двойных кавычках.
Может ли конвертация TSV в CSV потерять данные?
Нет, если выполнена правильно. Надлежащий конвертер обрабатывает все граничные случаи по правилам RFC 4180.
Что лучше использовать для моего проекта — TSV или CSV?
Используйте CSV для обмена — это наиболее универсально поддерживаемый табличный формат. Используйте TSV, когда ваши данные содержат много запятых.