广

ASP编程

  • IOS开发
  • android开发
  • PHP编程
  • JavaScript
  • ASP.NET
  • ASP编程
  • JSP编程
  • Java编程
  • 易语言
  • Ruby编程
  • Perl编程
  • AJAX
  • 正则表达式
  • C语言
  • 编程开发

    利用正则表达式去掉html代码

    2018-05-03 14:17:29 次阅读 稿源:互联网
    零七广告

      using System.Text.RegularExpressions;//需要引用

        // 利用正则表达式去掉"<"和">"之间的内容
        private string StripHT(string strHtml)
        {
         Regex regex=new Regex("<.+?>",RegexOptions.IgnoreCase);
         string strOutput=regex.Replace(strHtml,"");
         return strOutput;
        }

      
      //方法二(不知为什么此方法占用CPU100%)

      public static string DropHTML(string strHtml)
        {
         string [] aryReg ={
                @"<script[^>]*?>.*?</script>",
                @"<(/s*)?!?((w+:)?w+)(w+(s*=?s*(([""''])([""''tbnr]|[^7])*?7|w+)|.{0})|s)*?(/s*)?>",
                @"([])[s]+",
                @"&(quot|#34);",
                @"&(amp|#38);",
                @"&(lt|#60);",
                @"&(gt|#62);",
                @"&(nbsp|#160);",
                @"&(iexcl|#161);",
                @"&(cent|#162);",
                @"&(pound|#163);",
                @"&(copy|#169);",
                @"&#(d+);",
                @"-->",
                @"<!--.*"        
               };

         string [] aryRep = {
                 "",
                 "",
                 "",
                 """,
                 "&",
                 "<",
                 ">",
                 " ",
                 "xa1",//chr(161),
                 "xa2",//chr(162),
                 "xa3",//chr(163),
                 "xa9",//chr(169),
                 "",
                 "",
                 ""   
                };

         string newReg =aryReg[0];
         string strOutput=strHtml;
         for(int i = 0;i<aryReg.Length;i++)
         {
          Regex regex = new Regex(aryReg[i],RegexOptions.IgnoreCase );
          strOutput = regex.Replace(strOutput,aryRep[i]);
         }

         strOutput.Replace("<","");
         strOutput.Replace(">","");
         strOutput.Replace("","");
         return strOutput;
           
        }
      http://www.cnblogs.com/wang123/archive/2006/09/16/505758.html

    零七网部分新闻及文章转载自互联网,供读者交流和学习,若有涉及作者版权等问题请及时与我们联系,以便更正、删除或按规定办理。感谢所有提供资讯的网站,欢迎各类媒体与零七网进行文章共享合作。

    零七广告
    零七广告
    零七广告
    零七广告