EPUB를 TSV로 변환하는 방법
EPUB 파일을 TSV 스프레드시트로 변환하는 방법
KnowledgeBase Epub Converter는 한 번의 API 호출만으로 어떤 전자책(.epub)이든 깔끔한 탭 구분값 파일(.tsv)로 변환하는 초고속 솔루션입니다. 테이블, 챕터 개요, 메타데이터 등을 추출해 데이터 분석 파이프라인, BI 도구, 혹은 일반 스프레드시트에 활용하기에 최적화되었습니다.
왜 KnowledgeBase Epub Converter를 선택해야 할까요?
- 구조 인식 – 챕터, 표, 각주 등을 별개의 TSV 섹션으로 추출합니다(필요에 따라 분할·병합 가능).
- 유니코드 안전 – RTL 스크립트와 이모지를 포함한 모든 문자가 손실 없이 보존됩니다.
- 설치 불필요 – Office, Calibre, 외부 바이너리 없이 .NET 6+ 라이브러리만 있으면 됩니다.
- 크로스플랫폼 – Windows, macOS, Linux 어디서든 실행됩니다.
- 높은 설정 가능성 – 구분자, 인용 부호, 줄바꿈, 표 감지 옵션을 자유롭게 제어할 수 있습니다.
시작하기
Sheetize NuGet 패키지를 추가하고 EpubConverter.Process를 호출합니다.
샘플 C# 코드
using Sheetize;
var load = new EpubLoadOptions
{
// 원본 EPUB 파일 경로
InputFile = @"C:\Books\MarketAnalysis.epub"
};
var save = new SaveOptions
{
// 출력 TSV 파일 경로(챕터별로 나누려면 폴더 지정)
OutputPath = @"C:\Exports\MarketAnalysis.tsv"
};
EpubConverter.Process(load, save);베스트 프랙티스
- 먼저 EPUB 검증 – 손상된 파일은 TSV가 중단될 수 있으니 EPUB 검증 도구를 사용하세요.
- 생성된 TSV 검토 – 하위 시스템이 요구하는 형식에 맞게 구분자·인용 부호를 조정합니다.
- 간단한 무결성 검사 – 텍스트 편집기나 스프레드시트로 몇 줄을 열어 인코딩(기본 UTF‑8)이 정상인지 확인합니다.
전자책을 실용적인 데이터로 전환할 준비가 되셨나요? 패키지를 설치하고 위 코드를 프로젝트에 삽입하면 KnowledgeBase Epub Converter가 모든 작업을 대신해 줍니다.