网站地图 | RSS订阅 凌陈亮博客 - 专业上海SEO上海SEO优化,分享网站优化知识,同时提供上海SEO服务。
你的位置:首页
ASP程序

ASP过滤HTML标签、JS代码、CSS样式,只获取纯文本

ASP过滤HTML标签、JS代码、CSS样式,只获取纯文本
<%
'函数:ASP过滤HTML标签、JS代码、CSS样式,只获取纯文本【凌陈亮(QQ:57404811)】
'参数:字符串,左边字符数(空为全文,1个中文字符=2个英文字符),超出部分的连接字符串
function gw_nohtml(content,n,nexttext)
	dim f_content : f_content=content
	if len(f_content)>0 then
		dim re : set re=New RegExp	'建立正则表达式
		re.Global=true		'设置全局可用性
		re.Ignorecase=false	'设置是否区分字符大小写
		re.MultiLine=true	'设置多行标记可用性
		re.Pattern="<[sS][tT][yY][lL][eE][^>]*?>[\s\S]*?<\/[sS][tT][yY][lL][eE]>" '去STYLE样式正则式
		f_content=re.replace(f_content,"") '执行搜索测试
		re.Pattern="<[sS][cC][rR][iI][pP][tT][^>]*?>[\s\S]*?<\/[sS][cC][rR][iI][pP][tT]>" '去SCRIPT脚本正则式
		f_content=re.replace(f_content,"") '执行搜索测试
		re.Pattern="<(.|\n)+?>"	'去HTML标签正则式
		f_content=re.replace(f_content,"") '执行搜索测试
		'自适应UNICODE特殊字符
		const utf8str_const="&amp;|&quot;|&lt;|&gt;|&nbsp;|&copy;|&reg;|&raquo;|&Theta;|&acute;|&AElig;|&aelig;|&Agrave;|&agrave;|&Aring;|&aring;|&Atilde;|&atilde;|&Auml;|&auml;|&brvbar;|&Ccedil;|&ccedil;|&cedil;|&cent;|&circ;|&Aacute;|&curren;|&deg;|&divide;|&Eacute;|&eacute;|&Ecirc;|&ecirc;|&Egrave;|&egrave;|&ETH;|&eth;|&Euml;|&euml;|&euro;|&fnof;|&frac12;|&frac14;|&frac34;|&Iacute;|&iacute;|&Icirc;|&icirc;|&iexcl;|&Igrave;|&igrave;|&iquest;|&Iuml;|&iuml;|&laquo;|&macr;|&micro;|&middot;|&not;|&Ntilde;|&ntilde;|&Oacute;|&oacute;|&Ocirc;|&ocirc;|&OElig;|&oelig;|&Ograve;|&ograve;|&ordf;|&ordm;|&Oslash;|&oslash;|&Otilde;|&otilde;|&Ouml;|&ouml;|&para;|&plusmn;|&pound;|&aacute;|&Acirc;|&Scaron;|&scaron;|&sect;|&shy;|&sup1;|&sup2;|&sup3;|&szlig;|&THORN;|&thorn;|&tilde;|&times;|&Uacute;|&uacute;|&Ucirc;|&ucirc;|&Ugrave;|&ugrave;|&uml;|&Uuml;|&uuml;|&Yacute;|&yacute;|&yen;|&Yuml;|&yuml;|&ensp;|&emsp;|&thinsp;|&zwnj;|&zwj;|&lrm;|&rlm;|&ndash;|&mdash;|&lsquo;|&rsquo;|&sbquo;|&ldquo;|&rdquo;|&bdquo;|&lsaquo;|&rsaquo;|&dagger;|&Dagger;|&permil;|&bull;|&hellip;|&Prime;|&oline;|&frasl;|&weierp;|&image;|&real;|&trade;|&alefsym;|&larr;|&uarr;|&rarr;|&darr;|&harr;|&crarr;|&lArr;|&uArr;|&rArr;|&dArr;|&hArr;|&forall;|&part;|&exist;|&empty;|&nabla;|&isin;|&notin;|&ni;|&prod;|&sum;|&minus;|&lowast;|&radic;|&prop;|&infin;|&ang;|&and;|&or;|&cap;|&cup;|&int;|&there4;|&sim;|&cong;|&asymp;|&ne;|&equiv;|&le;|&ge;|&sub;|&sup;|&nsub;|&sube;|&supe;|&oplus;|&otimes;|&perp;|&sdot;|&lceil;|&rceil;|&lfloor;|&rfloor;|&lang;|&rang;|&loz;|&spades;|&clubs;|&hearts;|&diams;|&Alpha;|&alpha;|&Beta;|&beta;|&Gamma;|&gamma;|&Delta;|&delta;|&Epsilon;|&epsilon;|&Zeta;|&zeta;|&Eta;|&eta;|&acirc;|&theta;|&thetasym;|&Iota;|&iota;|&Kappa;|&kappa;|&Lambda;|&lambda;|&Mu;|&mu;|&Nu;|&nu;|&Xi;|&xi;|&Omicron;|&omicron;|&Pi;|&pi;|&piv;|&Rho;|&rho;|&Sigma;|&sigma;|&sigmaf;|&Tau;|&tau;|&Upsilon;|&upsilon;|&upsih;|&Phi;|&phi;|&Chi;|&chi;|&Psi;|&psi;|&Omega;|&omega;"
		dim utf8str : utf8str=split(utf8str_const,"|")
		
		dim f_return
		if len(n)>0 then
			dim f_k : f_k=0
			dim f_i,f_j,f_a,f_b
			for f_i=1 to len(f_content)
				f_a=mid(f_content,f_i,1)
				
				for f_j=0 to ubound(utf8str)
					f_b=mid(f_content,f_i,len(utf8str(f_j)))
					if f_b=utf8str(f_j) then
						f_a=f_b
						f_i=f_i+len(utf8str(f_j))-1
						exit for
					end if
				next
				
				re.Pattern="[^\x00-\xff]"	'设置模式,即建立正则式规则
				f_k=f_k+len(re.replace(f_a,"$2"))	'执行搜索测试
				if f_k<=n then
					f_return=f_return & f_a
				else
					f_return=f_return & nexttext
					exit for
				end if
			next
		else
			f_return=f_content
		end if
		set re=nothing
		gw_nohtml=f_return
	end if
end function
%>

发布时间:2015年8月10日 | 评论:0 | 浏览: | 标签:获取字符串  过滤HTML代码  过滤JS代码  过滤CSS代码  获取纯文本  

网站制作

ASP中GB2312转换UTF-8编码乱码的完整解决方法

ASP中GB2312转换UTF-8编码乱码的完整解决方法

第一:ASP代码

ASP文件头写下如下代码:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<%
session.codepage=65001
response.charset="utf-8"
%>

发布时间:2015年8月10日 | 评论:0 | 浏览: | 标签:乱码  编码转换  ASP教程  

«123456789101112»