当前位置:

正则表达式提取html标签间的内容

访客 2024-01-05 1216 0

使用正则表达式提取html标签中间的内容,如:abc<span>def</span>gh<font>666</font>999

代码如下:

  • publicstaticvoidmain(String[]args){
  • Strings="abc<span>def</span>gh<font>666</font>999";
  • Stringp="<(\\w)([^<>]*)>([^<>])</\\1>";
  • Patternpattern=Pattern.compile(p);
  • List<String>words=newArrayList<>();
  • Matchermatcher=pattern.matcher(s);
  • while(matcher.find()){
  • words.add(matcher.group(3));
  • }
  • System.out.println(JSON.toJSONString(words));
  • }
  • 输出结果:["def","666"]

    正则表达式可以根据具体标签做适当调整,当前是匹配所有标签,也可以改成针对font或span或者其他html标签做适当改写。

    正则表达式的group()方法用于捕获组,从正则表达式左侧开始,每出现一个左括号"("记做一个分组,分组编号从1开始。0代表整个表达式。

    PostViews:13

    发表评论

    • 评论列表
    还没有人评论,快来抢沙发吧~