Hur man konverterar Html till Csv

Guide för HTML‑till‑CSV‑konvertering

Översikt
Att konvertera HTML‑tabeller eller strukturerad markup till CSV‑filer gör det möjligt att extrahera tabulära data för analys, import till kalkylblad eller vidare bearbetning i andra system. Sheetize HTML Converter för .NET stödjer direkt omvandling från HTML (eller MHTML) till CSV samtidigt som cellvärden, datatyper och grundläggande formatering bevaras.

Stödda format

  • Inmatning: Html eller MHtml (vilket HTML‑dokument som helst som innehåller <table>‑element).
  • Utmatning: Csv (kommaseparerade värden). Andra stödda destinationer inkluderar Xlsx, Json, Xml, Tsv osv.

Steg‑för‑steg arbetsflöde

  1. Skapa inläsningsalternativ – Peka konvertern mot käll‑HTML‑filen.
  2. Konfigurera sparalternativ – Ställ in SaveFormat till FileFormatType.Csv och specificera eventuellt avgränsare, teckenkodning eller om rubrikrader ska inkluderas.
  3. Kör processen – Anropa HtmlConverter.Process(loadOptions, saveOptions); verktyget parserar HTML‑tabellerna och skriver en CSV‑fil.

Exempelkod (C#)

using Sheetize;

// Ladda HTML‑dokumentet
var loadOptions = new LoadOptions
{
    InputFile = @"D:\\Report.html", // Html eller MHtml‑källa
};

// Definiera CSV‑utgångsinställningar
var saveOptions = new HtmlSaveOptions
{
    SaveFormat = FileFormatType.Csv,
    OutputFile = @"D:\\Report.csv",
};

// Utför konverteringen
HtmlConverter.Process(loadOptions, saveOptions);

Tips & bästa praxis

  • Tabellstruktur – Säkerställ att varje <table> har ett <thead> för kolumnrubriker; annars behandlar konvertern den första raden som data.
  • MHTML‑stöd – Om källan är ett MHtml‑arkiv, ange sökvägen till .mht‑filen; konvertern extraherar den inbäddade HTML‑koden automatiskt.

När du bör använda HTML → CSV

  • Skrapa webbsidrapporter som levereras som HTML‑tabeller.
  • Konvertera e‑bokinnehåll (ePub, AZW3) som innehåller tabulär data till CSV för analys.
  • Arkivera äldre HTML‑instrumentpaneler i ett lättviktigt, import‑klart format.

Vidare läsning

 Svenska