日期:2014-05-18  浏览次数:20439 次

如何去掉网页中抓出来内容的<...>标记,只留下文字和标点呢?
假设字符串变量sContent中存放着网页中抓出来的内容如:
-----------------------------
<P class=MsoNormal style="TEXT-INDENT: 24.1pt; LINE-HEIGHT: 25pt; mso-line-height-rule: exactly"><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">山西信华汽车服务有限公司是上汽汽车授权的山西省第一家经销荣威品牌的<SPAN lang=EN-US>4S</SPAN>店,位于太原市太榆路<SPAN lang=EN-US>26</SPAN>号。公司依托上汽汽车<SPAN lang=EN-US>&#8220;</SPAN>以客户为中心、以市场为导向、仁义诚信<SPAN lang=EN-US>&#8221;</SPAN>的理念,凭借良好的信誉和诚信为本的原则面向广大用户。</SPAN></P><BR><br/><P class=MsoNormal style="TEXT-INDENT: 24.1pt; LINE-HEIGHT: 25pt; mso-line-height-rule: exactly"><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体"></SPAN><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">公司集汽车销售、保养维修、配件供应于一体,成立于<SPAN lang=EN-US>2003</SPAN>年<SPAN lang=EN-US>8</SPAN>月.是一支年轻团队,员工平均年龄较低,但整体素质较高,所以,公司的各方面都处于澎湃的朝气当中。公司组织结构较完善,由综合服务中心、销售服务中心、售后服务中心三个部门组成,其中又下设各自小组,工作分工明确,各部门之间相互衔接,能促使工作顺利快速完成。<SPAN lang=EN-US><?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p></SPAN></SPAN></P><BR><br/><P class=MsoBodyTextIndent2 style="LINE-HEIGHT: 25pt; mso-line-height-rule: exactly"><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">公司的销售人员都经过上汽汽车专业培训,在服务方面,能够切合公司理念,全心全意为您服务。在销售流程方面,能够结合上汽汽车并联系实际地打造自己的流程,如从选购车型到试乘试驾、从签定合同到灵活的付款方面,从车辆介绍到提交上牌,并提供一站式购车服务,代办保险,车辆上户、车辆装潢等等方面,都最大限度地让客户从进销售大厅到离去都能感受到专业且温馨的服务理念。<SPAN lang=EN-US><o:p></o:p></SPAN></SPAN></P><BR><br/><P class=MsoNormal style="TEXT-INDENT: 24.1pt; LINE-HEIGHT: 25pt; mso-line-height-rule: exactly"><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">在售后方面,我公司秉承上汽汽车一贯的售后服务理念,不但最大限度的满足顾客的需求,做到物有所值,努力营造温馨亲切的服务标准,使您感受到倍可信赖的售后服务。体现出罗孚特有的服务特色<SPAN lang=EN-US>,</SPAN>并且售后服务的员工均经过上汽汽车专业的技术培训,能够熟练的运用上汽汽车指定的专业维修工具,严格按照其要求进行维修操作。</SPAN></P><BR><br/><P class=MsoNormal style="TEXT-INDENT: 24.1pt; LINE-HEIGHT: 25pt; mso-line-height-rule: exactly"><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体"></SPAN><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp;&nbsp; 仁义诚信<SPAN lang=EN-US><SPAN style="mso-spacerun: yes"> </SPAN></SPAN>信华荣威 <SPAN lang=EN-US><SPAN style="mso-spacerun: yes"></SPAN><o:p></o:p></SPAN></SPAN></P><BR><br/><P class=MsoNormal style="LINE-HEIGHT: 25pt; mso-line-height-rule: exactly" align=right><SPAN lang=EN-US style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体"><SPAN style="mso-spacerun: yes"></SPAN><SPAN style="mso-spacerun: yes"></SPAN></SPAN><SPAN style="FONT-SIZE: 10.5pt; FONT-FAMILY: 宋体">山西信华汽车服务有限公司</SPAN></P>
------------------------------
现在想把其中所有的<...>标记去掉,只留下文字和标点,该怎么做呢,虚心请教大家
楼主很笨,只说明方法也还是不会做,高手最好给出具体可执行的语句:)

------解决方案--------------------
SQL code

go

create function [dbo].[clearhtml_V2] (@maco varchar(8000))
returns varchar(8000) 
as 
begin
    declare @randchar_one nvarchar(200)
    declare @randchar_two nvarchar(200)
        if(charindex('<<',@maco)>0)
                begin
                        set @randchar_one='D4678B36-B958