Как конвертировать EPUB в TSV
Как конвертировать файл EPUB в TSV‑таблицу
KnowledgeBase Epub Converter предлагает молниеносный API — один вызов, который превращает любую электронную книгу (.epub) в аккуратный файл формата TSV (.tsv). Идеально подходит для извлечения таблиц, оглавления глав или метаданных для аналитических конвейеров, BI‑инструментов или простых электронных таблиц.
Почему стоит выбрать KnowledgeBase Epub Converter для конвертации EPUB → TSV?
- Учитывает структуру — извлекает главы, таблицы и сноски как отдельные секции TSV (можно разделять или объединять по необходимости).
- Unicode‑безопасность — все символы, включая RTL‑скрипты и эмодзи, сохраняются без потерь.
- Без установки — не требуется Office, Calibre или сторонние бинарники; нужен лишь .NET 6+.
- Кроссплатформенный — работает под Windows, macOS и Linux.
- Высокая настройка — можно задавать разделитель, кавычки, тип окончания строк и параметры обнаружения таблиц.
Приступаем к работе
Установите пакет Sheetize через NuGet и вызовите EpubConverter.Process.
Пример кода на C#
using Sheetize;
var load = new EpubLoadOptions
{
// Путь к исходному файлу EPUB
InputFile = @"C:\Books\MarketAnalysis.epub"
};
var save = new SaveOptions
{
// Путь к результирующему TSV‑файлу (или папке, если делить по главам)
OutputPath = @"C:\Exports\MarketAnalysis.tsv"
};
EpubConverter.Process(load, save);Лучшие практики
- Сначала проверьте EPUB — повреждённый файл может обрезать TSV; используйте валидатор EPUB.
- Проверьте полученные TSV — при необходимости поправьте разделитель или кавычки, если ваша downstream‑система ожидает иной формат.
- Сделайте быструю проверку — откройте несколько строк в текстовом редакторе или таблице, чтобы убедиться в правильной кодировке (по умолчанию UTF‑8).
Готовы превратить электронные книги в полезные данные? Установите пакет, вставьте пример в проект и позвольте KnowledgeBase Epub Converter выполнить тяжёлую работу.