Cara Mengonversi HTML ke JSON

Sheetize HtmlConverter untuk .NET memudahkan proses parsing file HTML dan menghasilkan representasi JSON terstruktur dari data spreadsheet yang terdapat di dalamnya. Konverter ini menangani gaya inline, gambar tersemat, serta tabel kompleks, menghasilkan JSON bersih yang dapat dipakai oleh API web, pipeline data, atau aplikasi front‑end.

Mengapa Mengonversi HTML → JSON?

  • JSON bersifat bahasa‑agnostik dan sangat cocok untuk mentransmisikan data tabel melalui HTTP.
  • Memungkinkan Anda memanfaatkan laporan berbasis HTML sebagai sumber data untuk dasbor, model pembelajaran mesin, atau aplikasi seluler.
  • Mempertahankan tata letak visual asli di HTML sambil mengekspose nilai sel, rumus, dan metadata secara programatik.

Fitur Utama

  • Ekstraksi tabel lengkap – baris, kolom, sel yang digabung, serta gaya semuanya tertangkap.
  • Penanganan aset – gambar dan media dapat dienkode menjadi base64 atau disimpan sebagai file terpisah yang direferensikan dalam JSON.
  • Output yang dapat dikustomisasi – pilih antara struktur datar yang ringkas atau model workbook hierarkis.

Alur Konversi (HTML → JSON)

  1. Buat Konverter – instantiate HtmlConverter.
  2. Setel Opsi Muat – tentukan file HTML sumber dan, bila perlu, URI dasar untuk sumber daya yang terhubung.
  3. Konfigurasikan Opsi Simpan – gunakan HtmlSaveOptions untuk memilih skema JSON, menyematkan sumber daya, dan menentukan jalur keluaran.
  4. Jalankan Proses – panggil HtmlConverter.Process(loadOptions, saveOptions).

Contoh Kode – HTML ke JSON dengan Gambar Tertanam

using Sheetize;

var loadOptions = new LoadOptions
{
    InputFile = @"C:\Docs\Report.html"
};

var saveOptions = new HtmlSaveOptions
{
    OutputFile = @"C:\Output\Report.json"
};

HtmlConverter.Process(loadOptions, saveOptions);

Bagaimana Bentuk JSON (disederhanakan)

{
  "sheets": [{
    "name": "Sheet1",
    "rows": [{
      "cells": [{
        "address": "A1",
        "value": "Title",
        "style": { "fontWeight": "bold" }
      }, {
        "address": "B1",
        "value": "Image",
        "image": "..."
      }]
    }]
  }]
}

Tips Lanjutan

  • Ekstraksi Selektif – set HtmlLoadOptions.IncludeElements = new[] { "table", "img" } untuk mengabaikan markup yang tidak relevan.
  • Performa – untuk file HTML berukuran besar, aktifkan ParallelProcessing = true pada JsonSaveOptions.
  • Serialisasi Kustom – implementasikan IJsonConverter untuk mengubah nilai sel (misalnya, tanggal ke format ISO‑8601).

Dukungan Format yang Diperluas

Selain JSON, HtmlConverter yang sama dapat menargetkan MHTML, CSV, EPUB, AZW3, bahkan kembali ke XLSX. Ini menjadikannya jembatan universal untuk pertukaran data antara ekosistem web, e‑book, dan spreadsheet.

Dengan mengikuti langkah‑langkah di atas, Anda dapat mengonversi laporan HTML apa pun menjadi JSON yang bersih dan siap pakai menggunakan Sheetize HtmlConverter.

 Indonesia