Cómo convertir un archivo EPUB a una hoja de cálculo TSV
Cómo convertir un archivo EPUB a una hoja de cálculo TSV
KnowledgeBase Epub Converter ofrece una API ultrarrápida y de una sola llamada que transforma cualquier libro electrónico (.epub) en un archivo de valores separados por tabuladores (.tsv). Ideal para extraer tablas, esquemas de capítulos o metadatos para pipelines de análisis de datos, herramientas de BI o simples hojas de cálculo.
¿Por qué elegir KnowledgeBase Epub Converter para la conversión EPUB → TSV?
- Consciente de la estructura – extrae capítulos, tablas y notas al pie como secciones TSV distintas (puede dividirlas o combinarlas según necesite).
- Seguro con Unicode – todos los caracteres, incluidos scripts RTL y emojis, sobreviven al proceso.
- Sin instalación – no necesita Office, Calibre u otros binarios externos; solo una librería .NET 6+.
- Multiplataforma – funciona en Windows, macOS y Linux.
- Altamente configurable – controle delimitador, comillas, terminación de líneas y detección de tablas.
Primeros pasos
Agregue el paquete NuGet Sheetize e invoque EpubConverter.Process.
Código de ejemplo en C#
using Sheetize;
var load = new EpubLoadOptions
{
// Ruta al archivo EPUB de origen
InputFile = @"C:\Books\MarketAnalysis.epub"
};
var save = new SaveOptions
{
// Ruta de destino del archivo TSV (o carpeta si separa por capítulos)
OutputPath = @"C:\Exports\MarketAnalysis.tsv"
};
EpubConverter.Process(load, save);Buenas prácticas
- Valide el EPUB antes – un archivo corrupto puede truncar el TSV; use una herramienta de validación de EPUB.
- Revise los TSV generados – ajuste delimitadores o comillas si su sistema downstream espera un formato específico.
- Ejecute una comprobación rápida – abra algunas filas en un editor de texto o hoja de cálculo para confirmar la codificación adecuada (UTF‑8 es el valor predeterminado).
¿Listo para convertir libros electrónicos en datos utilizables? Instale el paquete, inserte el fragmento en su proyecto y deje que KnowledgeBase Epub Converter haga el trabajo pesado.