كيف تحوّل HTML إلى JSON
Sheetize HtmlConverter لـ .NET يجعل من السهل تحليل ملف HTML وإصدار تمثيل JSON منظم لبيانات الجدول التي يحتويها. يتعامل المحول مع الأنماط المضمنة، الصور المتضمة، والجداول المعقّدة، مُنتجًا JSON نظيف يمكن استهلاكه بواسطة واجهات برمجة تطبيقات الويب، أنابيب البيانات، أو تطبيقات الواجهة الأمامية.
لماذا تحويل HTML → JSON؟
- JSON غير مرتبط بلغة معينة ومثالي لنقل البيانات الجدولية عبر HTTP.
- يتيح لك إعادة استخدام تقارير HTML كمصادر بيانات للوحة البيانات، نماذج التعلم الآلي، أو التطبيقات المحمولة.
- يحافظ على التخطيط البصري الأصلي في HTML مع كشف القيم الخلوية، الصيغ، والبيانات الوصفية بصورة برمجية.
مجموعة الميزات الأساسية
- استخراج الجداول بالكامل – الصفوف، الأعمدة، الخلايا المدمجة، والأنماط تُلتقط.
- معالجة الأصول – الصور والوسائط إما يتم تشفيرها بصيغة base64 أو تُخزن كملفات منفصلة يُشار إليها في JSON.
- إخراج قابل للتخصيص – اختر بين بنية مسطحة مدمجة أو نموذج دفتر عمل هرمي.
سير عمل التحويل (HTML → JSON)
- إنشاء المحول – استنساخ
HtmlConverter. - تعيين خيارات التحميل – حدد مسار ملف HTML الأصلي ويمكنك تعريف الـ URI الأساسي للموارد المرتبطة.
- تكوين خيارات الحفظ – استخدم
HtmlSaveOptionsلاختيار مخطط JSON، تضمين الموارد، وتحديد مسار الإخراج. - تشغيل العملية – استدعِ
HtmlConverter.Process(loadOptions, saveOptions).
مثال شفرة – HTML إلى JSON مع صور مدمجة
using Sheetize;
var loadOptions = new LoadOptions
{
InputFile = @"C:\Docs\Report.html"
};
var saveOptions = new HtmlSaveOptions
{
OutputFile = @"C:\Output\Report.json"
};
HtmlConverter.Process(loadOptions, saveOptions);كيف يبدو JSON (مبسط)
{
"sheets": [{
"name": "Sheet1",
"rows": [{
"cells": [{
"address": "A1",
"value": "Title",
"style": { "fontWeight": "bold" }
}, {
"address": "B1",
"value": "Image",
"image": "..."
}]
}]
}]
}نصائح متقدمة
- استخلاص انتقائي – عيّن
HtmlLoadOptions.IncludeElements = new[] { "table", "img" }لتجاهل العلامات غير ذات الصلة. - الأداء – للملفات HTML الكبيرة، فعّل
ParallelProcessing = trueفيJsonSaveOptions. - تسلسل مخصص – نفّذ
IJsonConverterلتحويل قيم الخلايا (مثلاً تواريخ إلى صيغة ISO‑8601).
دعم صيغ موسّع
إلى جانب JSON، يمكن لـ HtmlConverter استهداف MHTML، CSV، EPUB، AZW3، وحتى العودة إلى XLSX. هذا يجعله جسرًا عالميًا لتبادل البيانات بين الويب، الكتب الإلكترونية، وأنظمة الجداول الحسابية.
باتباع هذه الخطوات يمكنك تحويل أي تقرير HTML إلى JSON نظيف وقابل للاستهلاك باستخدام Sheetize HtmlConverter.