C#去除HTML标签

简介:

在做网站的时候,用到了去除html标签的问题,用正则匹配到html标签,然后replace即可。

public static string ReplaceHtmlTag(string html, int length = 0)
{
    string strText = System.Text.RegularExpressions.Regex.Replace(html, "<[^>]+>", "");
    strText = System.Text.RegularExpressions.Regex.Replace(strText, "&[^;]+;", "");


    if (length > 0  && strText.Length > length)
        return strText.Substring(0, length);

    return strText;
}

这个方法可以实现去除html标签的功能。

Length参数可以根据传入值取固定长度的值。用于生成文章摘要比较方便。




本文转自齐师傅博客园博客,原文链接:http://www.cnblogs.com/youring2/archive/2013/04/03/2997826.html,如需转载请自行联系原作者

相关文章
|
C# 数据采集 搜索推荐
|
Web App开发 C#
|
C# 编解码
C#对HTML转译需要注意的问题
原文:C#对HTML转译需要注意的问题      在做B/S程序时我们多少会用到一点HTML特殊符号转译。 如:“&”——>“&amp;” , ""——>"&gt;" , " "——>"&nbsp;" .
1045 0
|
.NET C# 开发框架
C#中实现WebBrowser控件的HTML源代码读写
原文: C#中实现WebBrowser控件的HTML源代码读写 C#中实现WebBrowser控件的HTML源代码读写http://www.blogcn.com/user8/flier_lu/index.
1238 0