如何截取一篇带样式的文章
悬赏:10 发布时间:2008-07-18 提问人:javaeyexu (初级程序员)
<p>环球时报驻德国特约记者<strong>张铭</strong>报道 17日,德国《明星》杂志网络版在首页刊登重要文章,题目为“资本主义化的共产主义者——庞然大物中国”。</p>
一篇文章,文章内容夹杂着各种各样的样式代码,
我想截取文章的前十五个字符,不包括样式代码,该如何做了?
请大家指教.
该问题已经关闭: a
一篇文章,文章内容夹杂着各种各样的样式代码,
我想截取文章的前十五个字符,不包括样式代码,该如何做了?
请大家指教.
该问题已经关闭: a
回答
提取内容的时候不要使用innerHTML提取.因为innerHTML会提取标签内容.
而应该使用innerText属性.
如
而用innerText提取.则内容是
而应该使用innerText属性.
如
引用
测试用粗体
用innerHTML提取.它得到的内容会是:引用
<I>测试用<B>粗体</B></I>
而用innerText提取.则内容是
引用
测试用粗体
ham (架构师) 2008-07-18
假定你用java语言了,用正则表达式先去除格式代码,再截取。
因为你只取前面15个字符,没有必要对整个文章的标记进行替换,可以考虑用replaceFirst()方法,不足15个字符时,再重复一次即可。
content.replaceAll("(?i)<[^>]+>", "");
因为你只取前面15个字符,没有必要对整个文章的标记进行替换,可以考虑用replaceFirst()方法,不足15个字符时,再重复一次即可。
qdzheng (中级程序员) 2008-07-18




