HTML'yi JSON'a Nasıl Dönüştürürsünüz
Sheetize HtmlConverter for .NET, bir HTML dosyasını ayrıştırıp içinde bulunan elektronik tablo verilerinin yapılandırılmış JSON temsili olarak dışa aktarmayı çok kolaylaştırır. Dönüştürücü, satır içi stilleri, gömülü görselleri ve karmaşık tabloları işleyerek, web API’leri, veri‑akışları veya ön‑uç uygulamaları tarafından kullanılabilecek temiz JSON üretir.
Neden HTML → JSON Dönüştürülür?
- JSON, dil bağımsızdır ve tablo verilerini HTTP üzerinden iletmek için mükemmeldir.
- HTML tabanlı raporlarınızı, gösterge panoları, makine‑öğrenimi modelleri veya mobil uygulamalar için veri kaynağı olarak yeniden kullanabilirsiniz.
- Görsel düzeni HTML içinde korurken, hücre değerlerini, formülleri ve meta verileri programatik bir biçimde ortaya çıkarır.
Temel Özellik Seti
- Tam tablo çıkartma – satırlar, sütunlar, birleştirilmiş hücreler ve stiller yakalanır.
- Varlık yönetimi – görseller ve medya ya base64‑kodlu olarak gömülür ya da JSON içinde referans verilen ayrı dosyalar olarak saklanır.
- Özelleştirilebilir çıktı – kompakt düz bir yapı ya da hiyerarşik bir çalışma kitabı modeli arasında seçim yapabilirsiniz.
Dönüştürme İş Akışı (HTML → JSON)
- Dönüştürücüyü Oluşturun –
HtmlConverternesnesinin bir örneğini alın. - Yükleme Seçeneklerini Ayarlayın – kaynak HTML dosyasını gösterin ve isteğe bağlı olarak bağlı kaynaklar için temel URI’yi tanımlayın.
- Kaydetme Seçeneklerini Yapılandırın – JSON şemasını seçmek, varlıkları gömmek ve çıktı yolunu belirlemek için
HtmlSaveOptionskullanın. - İşlemi Çalıştırın –
HtmlConverter.Process(loadOptions, saveOptions)metodunu çağırın.
Kod Örneği – Gömülü Görsellerle HTML’den JSON’a
using Sheetize;
var loadOptions = new LoadOptions
{
InputFile = @"C:\Docs\Report.html"
};
var saveOptions = new HtmlSaveOptions
{
OutputFile = @"C:\Output\Report.json"
};
HtmlConverter.Process(loadOptions, saveOptions);JSON Nasıl Görünür? (basitleştirilmiş)
{
"sheets": [{
"name": "Sheet1",
"rows": [{
"cells": [{
"address": "A1",
"value": "Title",
"style": { "fontWeight": "bold" }
}, {
"address": "B1",
"value": "Image",
"image": "..."
}]
}]
}]
}İleri Düzey İpuçları
- Seçmeli Çıkarma –
HtmlLoadOptions.IncludeElements = new[] { "table", "img" }ayarıyla ilgisiz işaretlemeyi görmezden gelin. - Performans – büyük HTML dosyaları için
JsonSaveOptionsiçindeParallelProcessing = trueözelliğini etkinleştirin. - Özel Serileştirme – hücre değerlerini (ör. tarihleri ISO‑8601’e dönüştürmek) değiştirmek için
IJsonConverteruygulayın.
Genişletilmiş Biçim Desteği
JSON dışında aynı HtmlConverter MHTML, CSV, EPUB, AZW3 ve hatta XLSX formatlarını hedefleyebilir. Bu sayede web, e‑kitap ve elektronik tablo ekosistemleri arasında evrensel bir veri köprüsü oluşturmuş olursunuz.
Bu adımları izleyerek, Sheetize HtmlConverter ile herhangi bir HTML raporunu temiz, kullanılabilir JSON’a güvenilir bir şekilde dönüştürebilirsiniz.