Cara Mengonversi HTML ke CSV
Panduan Konversi HTML ke CSV
Gambaran Umum
Mengonversi tabel HTML atau markup terstruktur menjadi file CSV memungkinkan Anda mengekstrak data tabular untuk analisis, mengimpor ke spreadsheet, atau memasok sistem hilir. Sheetize HTML Converter untuk .NET mendukung transformasi langsung dari HTML (atau MHTML) ke CSV sambil mempertahankan nilai sel, tipe data, dan format dasar.
Format yang Didukung
- Input:
HtmlatauMHtml(setiap dokumen HTML yang berisi elemen<table>). - Output:
Csv(nilai yang dipisahkan koma). Destinasi lain yang didukung termasukXlsx,Json,Xml,Tsv, dll.
Alur Kerja Langkah‑per‑Langkah
- Buat Load Options – Arahkan konverter ke file HTML sumber.
- Konfigurasikan Save Options – Tetapkan
SaveFormatkeFileFormatType.Csvdan opsional tentukan delimiter, encoding, atau apakah menyertakan baris header. - Jalankan Proses – Panggil
HtmlConverter.Process(loadOptions, saveOptions); alat ini menguraikan tabel HTML dan menulis file CSV.
Contoh Kode (C#)
using Sheetize;
// Muat dokumen HTML
var loadOptions = new LoadOptions
{
InputFile = @"D:\\Report.html", // Sumber Html atau MHtml
};
// Tentukan pengaturan output CSV
var saveOptions = new HtmlSaveOptions
{
SaveFormat = FileFormatType.Csv,
OutputFile = @"D:\\Report.csv",
};
// Lakukan konversi
HtmlConverter.Process(loadOptions, saveOptions);Tips & Praktik Terbaik
- Struktur Tabel – Pastikan setiap
<table>memiliki<thead>untuk header kolom; jika tidak, konverter akan menganggap baris pertama sebagai data. - Dukungan MHTML – Jika sumber adalah arsip
MHtml, berikan path file.mht; konverter secara otomatis mengekstrak HTML yang tersemat.
Kapan Menggunakan HTML → CSV
- Mengambil (scraping) laporan halaman web yang disajikan dalam tabel HTML.
- Mengonversi konten e‑book (ePub, AZW3) yang berisi data tabular menjadi CSV untuk analitik.
- Mengarsipkan dasbor HTML legacy ke format ringan yang siap diimpor.