Hur man konverterar Html till Csv
Guide för HTML‑till‑CSV‑konvertering
Översikt
Att konvertera HTML‑tabeller eller strukturerad markup till CSV‑filer gör det möjligt att extrahera tabulära data för analys, import till kalkylblad eller vidare bearbetning i andra system. Sheetize HTML Converter för .NET stödjer direkt omvandling från HTML (eller MHTML) till CSV samtidigt som cellvärden, datatyper och grundläggande formatering bevaras.
Stödda format
- Inmatning:
HtmlellerMHtml(vilket HTML‑dokument som helst som innehåller<table>‑element). - Utmatning:
Csv(kommaseparerade värden). Andra stödda destinationer inkluderarXlsx,Json,Xml,Tsvosv.
Steg‑för‑steg arbetsflöde
- Skapa inläsningsalternativ – Peka konvertern mot käll‑HTML‑filen.
- Konfigurera sparalternativ – Ställ in
SaveFormattillFileFormatType.Csvoch specificera eventuellt avgränsare, teckenkodning eller om rubrikrader ska inkluderas. - Kör processen – Anropa
HtmlConverter.Process(loadOptions, saveOptions); verktyget parserar HTML‑tabellerna och skriver en CSV‑fil.
Exempelkod (C#)
using Sheetize;
// Ladda HTML‑dokumentet
var loadOptions = new LoadOptions
{
InputFile = @"D:\\Report.html", // Html eller MHtml‑källa
};
// Definiera CSV‑utgångsinställningar
var saveOptions = new HtmlSaveOptions
{
SaveFormat = FileFormatType.Csv,
OutputFile = @"D:\\Report.csv",
};
// Utför konverteringen
HtmlConverter.Process(loadOptions, saveOptions);Tips & bästa praxis
- Tabellstruktur – Säkerställ att varje
<table>har ett<thead>för kolumnrubriker; annars behandlar konvertern den första raden som data. - MHTML‑stöd – Om källan är ett
MHtml‑arkiv, ange sökvägen till.mht‑filen; konvertern extraherar den inbäddade HTML‑koden automatiskt.
När du bör använda HTML → CSV
- Skrapa webbsidrapporter som levereras som HTML‑tabeller.
- Konvertera e‑bokinnehåll (ePub, AZW3) som innehåller tabulär data till CSV för analys.
- Arkivera äldre HTML‑instrumentpaneler i ett lättviktigt, import‑klart format.