Πώς να μετατρέψετε HTML σε JSON
Sheetize HtmlConverter για .NET κάνει εύκολη την ανάλυση ενός αρχείου HTML και την εκπομπή μιας δομημένης αναπαράστασης JSON των δεδομένων υπολογιστικού φύλλου που περιέχει. Ο μετατροπέας διαχειρίζεται ενσωματωμένα στυλ, εικόνες και πολύπλοκους πίνακες, παράγοντας καθαρό JSON που μπορεί να χρησιμοποιηθεί από web APIs, pipelines δεδομένων ή front‑end εφαρμογές.
Γιατί να μετατρέψετε HTML → JSON;
- Το JSON είναι ανεξάρτητο από γλώσσα προγραμματισμού και ιδανικό για τη μετάδοση προβολικών δεδομένων μέσω HTTP.
- Σας επιτρέπει να επαναχρησιμοποιήσετε αναφορές HTML ως πηγές δεδομένων για dashboards, μοντέλα μηχανικής μάθησης ή κινητές εφαρμογές.
- Διατηρεί την αρχική οπτική διάταξη στο HTML ενώ αποκαλύπτει τις υποκείμενες τιμές κελιών, τύπους και μεταδεδομένα με προγραμματιζόμενο τρόπο.
Κύρια Χαρακτηριστικά
- Πλήρης εξαγωγή πινάκων – καταγράφονται σειρές, στήλες, συγχωνευμένα κελιά και στυλ.
- Διαχείριση πόρων – εικόνες και πολυμέσα είτε κωδικοποιούνται σε base64 είτε αποθηκεύονται ως ξεχωριστά αρχεία που παραπέμπουν στο JSON.
- Προσαρμόσιμο αποτέλεσμα – επιλέξτε μεταξύ συμπαγούς επίπεδης δομής ή ιεραρχικού μοντέλου βιβλίου εργασίας.
Ροή Μετατροπής (HTML → JSON)
- Δημιουργία του Μετατροπέα – δημιουργήστε μια παρουσία του
HtmlConverter. - Ορισμός Επιλογών Φόρτωσης – υποδείξτε το αρχείο HTML πηγής και προαιρετικά τη βασική διεύθυνση URI για συνδεδεμένους πόρους.
- Διαμόρφωση Επιλογών Αποθήκευσης – χρησιμοποιήστε το
HtmlSaveOptionsγια να επιλέξετε το σχήμα JSON, να ενσωματώσετε πόρους και να ορίσετε τη διαδρομή εξόδου. - Εκτέλεση της Διαδικασίας – καλέστε
HtmlConverter.Process(loadOptions, saveOptions).
Παράδειγμα Κώδικα – HTML προς JSON με Ενσωματωμένες Εικόνες
using Sheetize;
var loadOptions = new LoadOptions
{
InputFile = @"C:\Docs\Report.html"
};
var saveOptions = new HtmlSaveOptions
{
OutputFile = @"C:\Output\Report.json"
};
HtmlConverter.Process(loadOptions, saveOptions);Πώς Μοιάζει το JSON (απλοποιημένο)
{
"sheets": [{
"name": "Sheet1",
"rows": [{
"cells": [{
"address": "A1",
"value": "Title",
"style": { "fontWeight": "bold" }
}, {
"address": "B1",
"value": "Image",
"image": "..."
}]
}]
}]
}Συμβουλές Προχωρημένων
- Επιλεκτική Εξαγωγή – ορίστε
HtmlLoadOptions.IncludeElements = new[] { "table", "img" }για να παραλείψετε περιττό markup. - Απόδοση – για μεγάλα αρχεία HTML, ενεργοποιήστε
ParallelProcessing = trueστοJsonSaveOptions. - Προσαρμοσμένη Σειριοποίηση – υλοποιήστε το
IJsonConverterγια να μετατρέψετε τιμές κελιών (π.χ. ημερομηνίες σε ISO‑8601).
Επέκταση Υποστήριξης Μορφών
Πέρα από το JSON, ο ίδιος HtmlConverter μπορεί να στοχεύσει MHTML, CSV, EPUB, AZW3, ακόμη και πίσω σε XLSX. Αυτό τον καθιστά μια καθολική γέφυρα για ανταλλαγή δεδομένων μεταξύ web, e‑book και οικοσυστημάτων υπολογιστικών φύλλων.
Με αυτά τα βήματα μπορείτε αξιόπιστα να μετατρέψετε οποιαδήποτε αναφορά HTML σε καθαρό, επεξεργάσιμο JSON χρησιμοποιώντας το HtmlConverter της Sheetize.