Как в bs4 удалить дочерний тег?
У тега 'p' есть дочерний тег 'strong', как его удалить из выдачи?
soup = BeautifulSoup(r.text , "html.parser")
import re
for tag in soup.find_all(re.compile('^p'):
print(tag)
Источник: Stack Overflow на русском
У тега 'p' есть дочерний тег 'strong', как его удалить из выдачи?
soup = BeautifulSoup(r.text , "html.parser")
import re
for tag in soup.find_all(re.compile('^p'):
print(tag)
Попробуйте что-то вроде этого. Здесь используется метод extract()
, который позволяет удалять теги.
from bs4 import BeautifulSoup
import re
# Ваш r.text
# ...
soup = BeautifulSoup(r.text, 'html.parser')
for tag in soup.find_all(re.compile('^p')):
strong_tag = tag.find('strong')
if strong_tag:
strong_tag.extract()
print(tag)