Hogyan konvertáljunk HTML-t CSV-re

HTML → CSV átalakítási útmutató

Áttekintés
A HTML‑táblázatok vagy strukturált markup CSV‑fájlokká történő konvertálása lehetővé teszi a táblázatos adatok kinyerését elemzéshez, táblázatkezelő programokba való importáláshoz, vagy downstream rendszereknek való továbbításához. A Sheetize HTML Converter for .NET közvetlen átalakítást támogat HTML (vagy MHTML) és CSV között, miközben megőrzi a cellaértékeket, adat típusokat és az egyszerű formázásokat.

Támogatott formátumok

  • Bemenet: Html vagy MHtml (bármely HTML‑dokumentum, amely `` elemeket tartalmaz).
  • Kimenet: Csv (vesszővel elválasztott értékek). Egyéb támogatott célformátumok: Xlsx, Json, Xml, Tsv stb.

Lépésről‑lépésre munkafolyamat

  1. Betöltési beállítások létrehozása – Mutassa meg a konverternek a forrás‑HTML fájlt.
  2. Mentési beállítások konfigurálása – Állítsa a SaveFormat értékét FileFormatType.Csv‑re, és opcionálisan adjon meg elválasztót, kódolást vagy azt, hogy legyen‑e fejléc sor.
  3. Futtassa a folyamatot – Hívja meg a HtmlConverter.Process(loadOptions, saveOptions) metódust; az eszköz beolvassa a HTML‑táblázatokat és CSV‑fájlt ír.

Minta kód (C#)

using Sheetize;

// Load the HTML document
var loadOptions = new LoadOptions
{
    InputFile = @"D:\\Report.html", // Html vagy MHtml forrás
};

// Define CSV output settings
var saveOptions = new HtmlSaveOptions
{
    SaveFormat = FileFormatType.Csv,
    OutputFile = @"D:\\Report.csv",
};

// Perform the conversion
HtmlConverter.Process(loadOptions, saveOptions);

Tippek és bevált gyakorlatok

  • Táblázat felépítése – Győződjön meg róla, hogy minden tartalmaz elemet az oszlopfejlécekhez; különben a konverter az első sort adatként kezeli.
  • MHTML támogatás – Ha a forrás egy MHtml archívum, adja meg a .mht fájl elérési útját; a konverter automatikusan kicsomagolja a beágyazott HTML‑t.

Mikor érdemes HTML → CSV konverziót használni

  • Web‑oldali jelentések kaparásakor, amelyek HTML‑táblázatként érkeznek.
  • E‑könyv tartalom (ePub, AZW3) konvertálása, ha táblázatos adatokat tartalmaz, és azokat CSV‑re szeretné átalakítani elemzés céljából.
  • Öreg HTML‑dashboardok archiválása könnyű, importálásra kész formátumban.

További olvasnivaló

 Magyar