Cara Mengonversi HTML ke JSON
Sheetize HtmlConverter untuk .NET memudahkan proses parsing file HTML dan menghasilkan representasi JSON terstruktur dari data spreadsheet yang terdapat di dalamnya. Konverter ini menangani gaya inline, gambar tersemat, serta tabel kompleks, menghasilkan JSON bersih yang dapat dipakai oleh API web, pipeline data, atau aplikasi front‑end.
Mengapa Mengonversi HTML → JSON?
- JSON bersifat bahasa‑agnostik dan sangat cocok untuk mentransmisikan data tabel melalui HTTP.
- Memungkinkan Anda memanfaatkan laporan berbasis HTML sebagai sumber data untuk dasbor, model pembelajaran mesin, atau aplikasi seluler.
- Mempertahankan tata letak visual asli di HTML sambil mengekspose nilai sel, rumus, dan metadata secara programatik.
Fitur Utama
- Ekstraksi tabel lengkap – baris, kolom, sel yang digabung, serta gaya semuanya tertangkap.
- Penanganan aset – gambar dan media dapat dienkode menjadi base64 atau disimpan sebagai file terpisah yang direferensikan dalam JSON.
- Output yang dapat dikustomisasi – pilih antara struktur datar yang ringkas atau model workbook hierarkis.
Alur Konversi (HTML → JSON)
- Buat Konverter – instantiate
HtmlConverter. - Setel Opsi Muat – tentukan file HTML sumber dan, bila perlu, URI dasar untuk sumber daya yang terhubung.
- Konfigurasikan Opsi Simpan – gunakan
HtmlSaveOptionsuntuk memilih skema JSON, menyematkan sumber daya, dan menentukan jalur keluaran. - Jalankan Proses – panggil
HtmlConverter.Process(loadOptions, saveOptions).
Contoh Kode – HTML ke JSON dengan Gambar Tertanam
using Sheetize;
var loadOptions = new LoadOptions
{
InputFile = @"C:\Docs\Report.html"
};
var saveOptions = new HtmlSaveOptions
{
OutputFile = @"C:\Output\Report.json"
};
HtmlConverter.Process(loadOptions, saveOptions);Bagaimana Bentuk JSON (disederhanakan)
{
"sheets": [{
"name": "Sheet1",
"rows": [{
"cells": [{
"address": "A1",
"value": "Title",
"style": { "fontWeight": "bold" }
}, {
"address": "B1",
"value": "Image",
"image": "..."
}]
}]
}]
}Tips Lanjutan
- Ekstraksi Selektif – set
HtmlLoadOptions.IncludeElements = new[] { "table", "img" }untuk mengabaikan markup yang tidak relevan. - Performa – untuk file HTML berukuran besar, aktifkan
ParallelProcessing = truepadaJsonSaveOptions. - Serialisasi Kustom – implementasikan
IJsonConverteruntuk mengubah nilai sel (misalnya, tanggal ke format ISO‑8601).
Dukungan Format yang Diperluas
Selain JSON, HtmlConverter yang sama dapat menargetkan MHTML, CSV, EPUB, AZW3, bahkan kembali ke XLSX. Ini menjadikannya jembatan universal untuk pertukaran data antara ekosistem web, e‑book, dan spreadsheet.
Dengan mengikuti langkah‑langkah di atas, Anda dapat mengonversi laporan HTML apa pun menjadi JSON yang bersih dan siap pakai menggunakan Sheetize HtmlConverter.