Hogyan konvertáljunk HTML-t CSV-re
HTML → CSV átalakítási útmutató
Áttekintés
A HTML‑táblázatok vagy strukturált markup CSV‑fájlokká történő konvertálása lehetővé teszi a táblázatos adatok kinyerését elemzéshez, táblázatkezelő programokba való importáláshoz, vagy downstream rendszereknek való továbbításához. A Sheetize HTML Converter for .NET közvetlen átalakítást támogat HTML (vagy MHTML) és CSV között, miközben megőrzi a cellaértékeket, adat típusokat és az egyszerű formázásokat.
Támogatott formátumok
- Bemenet:
HtmlvagyMHtml(bármely HTML‑dokumentum, amely `` elemeket tartalmaz). - Kimenet:
Csv(vesszővel elválasztott értékek). Egyéb támogatott célformátumok:Xlsx,Json,Xml,Tsvstb.
Lépésről‑lépésre munkafolyamat
- Betöltési beállítások létrehozása – Mutassa meg a konverternek a forrás‑HTML fájlt.
- Mentési beállítások konfigurálása – Állítsa a
SaveFormatértékétFileFormatType.Csv‑re, és opcionálisan adjon meg elválasztót, kódolást vagy azt, hogy legyen‑e fejléc sor. - Futtassa a folyamatot – Hívja meg a
HtmlConverter.Process(loadOptions, saveOptions)metódust; az eszköz beolvassa a HTML‑táblázatokat és CSV‑fájlt ír.
Minta kód (C#)
using Sheetize;
// Load the HTML document
var loadOptions = new LoadOptions
{
InputFile = @"D:\\Report.html", // Html vagy MHtml forrás
};
// Define CSV output settings
var saveOptions = new HtmlSaveOptions
{
SaveFormat = FileFormatType.Csv,
OutputFile = @"D:\\Report.csv",
};
// Perform the conversion
HtmlConverter.Process(loadOptions, saveOptions);Tippek és bevált gyakorlatok
- Táblázat felépítése – Győződjön meg róla, hogy minden
tartalmazelemet az oszlopfejlécekhez; különben a konverter az első sort adatként kezeli. - MHTML támogatás – Ha a forrás egy
MHtmlarchívum, adja meg a.mhtfájl elérési útját; a konverter automatikusan kicsomagolja a beágyazott HTML‑t.
Mikor érdemes HTML → CSV konverziót használni
- Web‑oldali jelentések kaparásakor, amelyek HTML‑táblázatként érkeznek.
- E‑könyv tartalom (ePub, AZW3) konvertálása, ha táblázatos adatokat tartalmaz, és azokat CSV‑re szeretné átalakítani elemzés céljából.
- Öreg HTML‑dashboardok archiválása könnyű, importálásra kész formátumban.