Извлечь нужный текст из разметки HTML

Рейтинг: 0Ответов: 1Опубликовано: 25.09.2014

Привет. Помогите разобраться, как вытащить текст <td>Облачно, дымка</td> из полученного ниже кода, естественно, без приставок <td>:

<dl class="cloudness">
    <dt class="png" title="Облачно, дымка" style="background-image: url(http://s2.gismeteo.ua/static/images/icons/new/n.moon.c3.png)"><br /></dt>
    <dd><table><tr><td>Облачно, дымка</td></tr></table></dd>
</dl>

Ответы

▲ 2Принят

Например, с помощью jsoup

String html = "<dl class=\"cloudness\"><dt class=\"png\" title=\"Облачно, дымка\" style=\"background-image: url(http://s2.gismeteo.ua/static/images/icons/new/n.moon.c3.png)\"><br /></dt><dd><table><tr><td>Облачно, дымка</td></tr></table></dd></dl>";
Document doc = Jsoup.parse(html);

Elements columns = doc.select("td");

String desiredText = columns.first().text();