Можа Jsoup ачысціць элементы на аснове свайго класа?

Я выкарыстоўваю Jsoup, каб паспрабаваць ачысціць даволі шмат ўсе HTML з дакумента, але белы спіс а <�моцны> праверачным <�моцны /> тэг з пэўнага класа .

У мяне ёсць гэта, але, відавочна, гэта сканчаецца дазваляе ўсім пралёты з класам Атран

String html = "
Lorem ipsum dolor
sit amet


"+ "Aenean quam sem" + "lacinia molestie nibh mattis "; String clean = Jsoup.clean(html, Whitelist.none() .addTags("span") .addAttributes("span", "class"));

Is there a way to clean all html except the ?

так што мой канчатковы вынік будзе

Lorem ipsum dolor sit amet
Aenean quam sem
lacinia molestie nibh mattis
1

1 адказы

Sticking to Jsoup solution, you can try following steps, but it is hardcode:

  1. Выманне ўсіх элементаў значэнне з тэксту ў выглядзе спісу.
  2. Выманне ўсіх значэнняў з пралётных элементаў у іншы спіс.
  3. Зменіце значэнне тэксту з прыкладаемай знака, як OMG_value.
  4. Выдаліць усе HTML-тэгі з тэксту.
  5. ітэрацый і замяніць усе OMG_values ​​са значэннем з захаванага спісу.

If you find another solution - stick to it. This is a hardcode savior from your cruel CEO.

1
дададзена
Дзякуючы D1e, на самой справе гэта будзе рабіць трук, але, як вы кажаце, гэта жорстка. Я што-то ўздоўж ліній селектар шлях JQuery, нешта накшталт .Почистить чакаў ( «whitelistme») ..
дададзена аўтар maverick, крыніца
так, гэта на грамадскім мярзотнік, я мог бы даць яму паспрабаваць на гэтае пытанне. BTW, я дам вам крэдыт на гэта. дзякуй
дададзена аўтар maverick, крыніца
Вы таксама можаце паспрабаваць некаторыя налады зыходнага кода, калі гэта законна, вядома. Выкарыстоўвайце метад ачысткі() у якасці прыкладу для рэалізацыі ўласнага метаду, як чысты (EnumHtml.Tag ... выключае).
дададзена аўтар JMelnik, крыніца