BS4 .decompose выводит None
Провожу парсинг онлайн магазина.
from bs4 import BeautifulSoup
import re
import lxml
bookInfo = []
with open("C:/Users/user/Desktop/Alib.html") as file:
src = file.read()
soup = BeautifulSoup(src, "lxml")
book = soup.find_all("p")
count = 0
for item in book:
count += 1
if 4 <= count <= 63:
all_data = item
all_data = all_data.b.decompose()
print(all_data)
.decompose
выводит None. Входные данные:
<p>
<b>
Valar morghulis, Valar dohaeris
</b>
Valar morghulis, Valar dohaeris
<br/>
(Читайте описание продавца
<a href="">
Valar morghulis, Valar dohaeris
</a>
, Москва.) Цена: 66000 руб.
<a href="">
<b>
Купить
</b>
</a>
<br/>
Valar morghulis, Valar dohaeris
<br/>
Состояние: Отличное
<br/>
Смотрите:
<a href="">
Фото
</a>
</p>
Возможно, есть способ добраться до текста вне вложенных тегов по-другому, но это единственное решение, которое я нашёл.
Источник: Stack Overflow на русском