Eliminazione tags HTML da una stringa .NET

Eliminazione tags HTML da una stringa .NET

eliminare tags html da string asp.net

Sviluppando in Asp.NET tramite il linguaggio C# può capitare di dover eliminare i tag HTML da una stringa di testo, magari prelevata da un file o da uno stream.
La necessità può sorgere nelle occasioni in cui serve il testo “grezzo” e pulito di tale stringa.

Usando le potentissime Regular Expressions la soluzione risulta alquanto semplice:

string stringa_finale = System.Text.RegularExpressions.Regex.Replace(stringa_iniziale, “<[^>]*>”, string.Empty);

Il metodo .Replace possiede altri overload più o meno complessi, lascio al lettore la possibilità di studiarne i comportamenti.

 

Scritto da
Daniele Ferla