Вопросы по тегу: beautiful-soup

0 ▲1 ответ.
Как в bs4 удалить дочерний тег?
У тега 'p' есть дочерний тег 'strong', как его удалить из выдачи? soup = BeautifulSoup(r.text , "html.parser") import re for tag in soup.find_all(re.compile('^p'): print…
Создано: 18.02.2023
0 ▲1 ответ.
Обнуляется html файл с кодом сайта, когда в него заходишь в браузере. Python
Мне нужна полная копия страницы для дальнейшего парсинга, но при открытии html файла сама страница держится всего пару секунд, как это обойти Как обойти ошибку 403 при get запросе…
Создано: 16.02.2023
-1 ▲2 ответ.
Python парсинг. Страница не отображает нужные элементы
Хочу спарсить некоторые игры вот здесь https://stopgame.ru/topgames?year_end=2022&p=1 , проблема в том, что html код который я получаю в программе не тот , который наблюдаю на…
Создано: 15.02.2023
0 ▲2 ответ.
Скрипт не может добавить спаршенные данные в список
Скрипт не может добавить спаршенные данные в список. Код: def test(soup): trs_0 = soup.findAll('div', class_='rcnt tr_0') for i in range(len(trs_0)): fprc = trs_0[i].find('div', c…
Создано: 15.02.2023
0 ▲1 ответ.
Как извлечение атрибута тега выполнить в цикле?
Как, используя beautifulsoup, извлечь значение атрибута тега и запустить всё в цикле? Запуская поодиночке - всё приходит, в цикле - нет from bs4 import BeautifulSoup import codecs…
Создано: 15.02.2023
1 ▲2 ответ.
Как используя beautifulsoup извлечь значение атрибута тега
<p id="plus" magazine_name="Supermarket" magazine_sort="jKZIRdGMXN" **name="Жевательная резинка DIROL 13,6гр Арбузная свежесть"** tid=&q…
Создано: 14.02.2023
0 ▲1 ответ.
Beautyful soup не может найти значение
BS спокойно парсит любые другие данные из блока, но на попытку спарсить счёт выдает None. При этом значение счёта есть в исходном коде. Код парсера: import requests from bs4 impor…
Создано: 13.02.2023
1 ▲1 ответ.
Парсер на beautifulSoap выводит только первый результат и не продолжает итерации
Пишу парсер для сайта анекдотов https://nekdo.ru/. Когда пытаюсь спарсить левый список тем этим же кодом, всё работает. Но когда пытаюсь спарсить чисто для примера тексты с первой…
Создано: 10.02.2023
0 ▲1 ответ.
Сохранение результата парсинга в txt файл
Не совсем понимаю как записать результат парсинга сайта https://myshows.me/news/ в формат txt. Я ищу заголовки с такой формулировкой: "Что посмотреть на этой неделе? Премьеры…
Создано: 09.02.2023
-2 ▲1 ответ.
Почему не получаю результаты при парсинге?
from bs4 import BeautifulSoup as b import requests url = 'https://p2p.binance.com/ru/trade/sell/USDT?fiat=UAH&payment=Monobank' response = requests.get(url) r = requests.get(u…
Создано: 09.02.2023
-1 ▲1 ответ.
Перенос переменной из одной функции в другую на Python
Есть функция парсинга сайта find_news, которая возвращает две переменные: return (filteredNews[0], filteredLinks[0]) Далее с помощью библиотеки telebot необходимо вернуть эти данн…
Создано: 07.02.2023
0 ▲0 ответ.
Можно ли вывести значения элементов страницы, если информация только в личной кабинете?
Хотел сделать парсер для вывода информации со школьного сайта, но BeautifulSoap не может найти элемент кода. from bs4 import BeautifulSoup import requests url = str("https://…
Создано: 06.02.2023
3 ▲2 ответ.
Как правильно парсить страницу с помощью BeautifulSoup?
Хочу спарсить страницу новостей сайта, а именно: время публикации, название новости, ссылка на новость. Но, вместо того, чтобы выводить все новости страницы выводит только 1 пункт…
Создано: 05.02.2023
0 ▲1 ответ.
Почему не работает код? и выдает ошибку AttributeError: 'NoneType' object has no attribute 'text'
import requests from bs4 import BeautifulSoup as BS url = 'https://finance.rambler.ru/calculators/converter/1-USD-RUB/' r = requests.get(url) soup = BS(r.content, 'html.parser') m…
Создано: 05.02.2023
0 ▲1 ответ.
Сохранить все картинки png со страницы
Как сохранить все картинки, а именно .png, которые находятся на странице? Мой код не работает: import requests from bs4 import BeautifulSoup response = requests.get("https://…
Создано: 05.02.2023
-2 ▲1 ответ.
Проблема с парсингом страницы
Мне нужно пропарсить всю страницу, но проблема состоит том, что когда я отправляю запрос на страницу там присутствуют всего 8 тегов, они увеличиваются по мере того как ее листаешь…
Создано: 31.01.2023
0 ▲1 ответ.
Как с помощью Beautiful soup найти все ссылки на файлы xlsx?
Существует сайт из которого нужно скопировать все ссылки на файлы формата .xlsx import requests URL = 'https://rosstat.gov.ru/vpn_popul' resp = requests.get(URL) html = resp.text …
Создано: 23.01.2023
0 ▲1 ответ.
Как найти все названия классов на сайте
Как найти все названия классов на сайте с помощью BeautifulSoup
Создано: 22.01.2023
0 ▲1 ответ.
Ошибка 'NavigableString' object has no attribute 'find_all'
Пишу парсер вк, который мог бы подсчитать лайки под постами. Мой код нже выдает ошибку: 'NavigableString' object has no attribute 'find_all' Подскажите, пожалуйста, что произошло?…
Создано: 20.01.2023
0 ▲1 ответ.
Почему BeautifulSoup возращает [ ]?
def parsing(): print("Парcинг...") pars_req = requests.get(url, headers=headers) print(pars_req.status_code) html = pars_req.text soup = BeautifulSoup(html, 'lxml') id =…
Создано: 19.01.2023
0 ▲1 ответ.
Как убрать отступы с черточками при выводе на печать в консоле текста
from bs4 import BeautifulSoup import requests response = requests.get("https://nasoscentr.ru/catalog/nasosy-tipa-d-1d-2d/") web_page = response.text soup = BeautifulSoup…
Создано: 15.01.2023
0 ▲2 ответ.
Python API: Как достать amount из страницы
Вот код страницы, которую надо спарсить: <html> <head> <meta name="color-scheme" content="light dark"> </head> <body> <pre sty…
Создано: 13.01.2023
1 ▲1 ответ.
Получение списка ячеек всех таблиц, используя BeautifulSoup
Есть код, который парсит все таблицы с сайта, которые только может найти: def parse(html): soup = BeautifulSoup(html) table = soup.find_all('table') res = [] for row in table: col…
Создано: 27.04.2015
0 ▲1 ответ.
Ошибка отсутствия ключа в словаре KeyError при разборе веб-страницы
При завершении парсинга и сохранении в csv выдается ошибка KeyError: 'name1' В чем может быть проблема? from bs4 import BeautifulSoup import urllib.request import requests import …
Создано: 24.04.2015