BS4 .decompose выводит None

Рейтинг: 0Ответов: 0Опубликовано: 18.08.2023

Провожу парсинг онлайн магазина.

from bs4 import BeautifulSoup
import re
import lxml

bookInfo = []

with open("C:/Users/user/Desktop/Alib.html") as file:
    src = file.read()

soup = BeautifulSoup(src, "lxml")

book = soup.find_all("p")
count = 0

for item in book:
    count += 1
    if 4 <= count <= 63:
        all_data = item
        all_data = all_data.b.decompose()
        print(all_data)

.decompose выводит None. Входные данные:

<p>
    <b>
        Valar morghulis, Valar dohaeris
    </b>
    Valar morghulis, Valar dohaeris
    <br/>
    (Читайте описание продавца
    <a href="">
        Valar morghulis, Valar dohaeris
    </a>
    , Москва.) Цена: 66000 руб.
    <a href="">
        <b>
            Купить
        </b>
    </a>
    <br/>
    Valar morghulis, Valar dohaeris
    <br/>
    Состояние: Отличное
    <br/>
    Смотрите:
    <a href="">
        Фото
    </a>
</p>

Возможно, есть способ добраться до текста вне вложенных тегов по-другому, но это единственное решение, которое я нашёл.

Ответы

Ответов пока нет.