< na hlavú stránku
Html Parser v ASP.NET - Agility Pack
27. 9. 2008 -- nasavin --
Keďže sa momentálne intenzívne venujem programovaniu v ASP.NET a tento blog je aj o takýchto záležitostiach, predstavujem vám veľmi užitočnú knižnicu, či balíček s názvom Html Agility Pack.
Pri programovaní niečoho ako webbot pre katalóg stránok Directory.sk som narazil na menší problém, ako vyprasovať z html kódu potrebné tagy a ich hodnoty. Trochu som googlil a ako najelegantnejšie riešenie sa ukázal Html Agility Pack od típka čo si hovorí Simonm. Napriek tomu že kód na vyparsovanie tite tagu zo zdrojového kódu som už mal z väčšej časti napísaný, táto utilita je tak elegantná, že nieje čo riešiť.
Zdrojový kód stiahnete z uvedenej stránky, potom ho musíte build-núť vo Visual Studio, prípradne vo Visual Studio C# Express. Vzniknutú knižnicu vložte do vášho projektu.
Pre prácu s Html Agility Pack sa vám zídu aj základy z Xpath, ak ich nemáte všetko potrebné zistíte tu Xpath syntax. Príklad použitia Html Agility Packu na získanie stringu z html nájdete tu
HTTP Request and HTML Parsing in .NET