好问题
Good  Question
  • 首 页
  • 问题
    • PHP
    • JAVA
    • CPlusPlus
    • C#
    • SQL
  • 关 于
  • 联 系
从字符串中删除HTML标签 关闭 返回上一级  

从字符串中删除HTML标签
+ 查看更多

发布日期:2018-03-23 17:15
分类:JAVA
浏览次数:79
如下:
有没有从Java字符串中删除HTML标签的好方法?如下的正则表达式
 replaceAll("\\<.*?>","") 
会起作用,但 &amp这样的无法被正确转换,而且在两个尖括号之间非HTML代码也会被移除(换句话说, 在正则表达式中.*?会被移除)

回答:

使用HTML解析器代替正则表达式,使用Jsoup非常简单
public static String html2text(String html) {
    return Jsoup.parse(html).text();
}
Jsoup也支持移除HTML标签,而那些你需要的有用的标签(例如 <b>, <i> ,<u>)可列为白名单不会被删除.
此外(以下为相关问题链接):
 
  • RegEx match open tags except XHTML self-contained tags
  • What are the pros and cons of the leading Java HTML parsers?
  • I'm looking for a Java HTML encoder
  • XSS prevention in JSP/Servlet web application
上一篇什么是枚举,枚举为什么很有用?
如何将java字符串转换成字节数组?下一篇
下一篇如何将java字符串转换成字节数组?

最新文章

  • 函数`__construct`用来干嘛的
    发布日期:2018-03-26
  • 通过访客的IP得到他们的地区
    发布日期:2018-03-26
  • 合并两个PHP对象的最好的方法是什么?
    发布日期:2018-03-26
  • 该如何把一该如何把一个对象转化成数组?
    发布日期:2018-03-26
  • 什么是输出缓冲区?
    发布日期:2018-03-26
  • 在PHP中怎么把用逗号分隔的字符串分隔在一个数组里?
    发布日期:2018-03-26
  • 在PHP中使用foreach循环时查找数组的最后一个元素
    发布日期:2018-03-26
关于好问
收集整理一些有用的问题和回答,造福中国的程序旺和IT喵们!
友情链接
起飞页 
相关信息
版权声明
Copyright © 2016 - 2022  苏州卡达网络科技有限公司 备案号:苏ICP备09008221号