Вопросы по тегу: beautiful-soup

0 ▲1 ответ.
Помогите с пагинацией
Есть сайт https://www.houzz.ru/ideabooks с очень странной пагинацией. Страницы указаны как везде.... но по факту ссылки на страницы следующего формата Cтраница 1-https://www.houzz…
Создано: 24.08.2023
0 ▲1 ответ.
Как объединить одинаковые HTML теги?
Кто нибудь, подскажите реализацию объединения одинаковых HTML тегов на Python. Есть строка: <b>Т</b><b><i>е</i></b><b><i>с</i&gt…
Создано: 23.08.2023
0 ▲0 ответ.
BS4 .decompose выводит None
Провожу парсинг онлайн магазина. from bs4 import BeautifulSoup import re import lxml bookInfo = [] with open("C:/Users/user/Desktop/Alib.html") as file: src = file.read(…
Создано: 18.08.2023
0 ▲1 ответ.
Не получается спарсить данные из тега
Не получается залезть в этот тег, выдает None <app-root urlvalue="//search.worldbank.org/api/v2/procnotices?format=json&amp;apilang=en&amp;fl=*&amp;id=OP002314…
Создано: 17.08.2023
0 ▲1 ответ.
Как перебрать циклом список тегов?
Есть вот такой html: <div class="section"> <div class="catalog-music inline_player_playlist"> <div class="music-popular-wrapper"> &…
Создано: 09.08.2023
0 ▲2 ответ.
Проблема с парсингом unsplash.com
Доброго времени суток всем. Осваиваю python и в качестве практики и надобности решил написать парсер, который по введенному тегу(запросу поисковика на сайте), собирал бесплатные к…
Создано: 09.08.2023
-1 ▲3 ответ.
Python. Парсинг. Как со всех страниц?
import bs4 import requests import xlsxwriter main_url = 'https://www.21vek.by/' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like…
Создано: 08.08.2023
-2 ▲1 ответ.
Как спарсить данные с одинаковым классом id ,но с разным названием?
Не судите строго,я новичок и многого не знаю.(Изображение прикрепил) Дан класс "bigline" в нем есть "id" записи к которой мне надо обратиться ,но я не знаю как…
Создано: 07.08.2023
1 ▲1 ответ.
Ошибка при парсинге на bs4
Код: import requests from bs4 import BeautifulSoup URL = "https://www.rbc.ru/politics/" page = requests.get(URL) soup = BeautifulSoup(page.content, "html.parser") title = soup.fin…
Создано: 30.07.2023
-1 ▲1 ответ.
Не могу правильно спарсить данные с сайта
from bs4 import BeautifulSoup from urllib import request, error import ssl from urllib.parse import quote import time headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win6…
Создано: 30.07.2023
0 ▲1 ответ.
Object of type Tag is not JSON serializable
Имеется код, который берет адреса. При выполнении выдает ошибку Object of type Tag is not JSON serializable from bs4 import BeautifulSoup import requests import json JSON = 'locat…
Создано: 28.07.2023
0 ▲1 ответ.
Перекодировка HTML кода Вк
Пишу парсер для Вк, и при попытке запросить ссылки из html кода, # и кирилица превращаются в не понятно что, код: from bs4 import BeautifulSoup as bs import requests cookies = { '…
Создано: 18.07.2023
2 ▲1 ответ.
Парсинг сайта и перевод текста
Столкнулся с такой задачей: Необходимо спарсить сайт и перевести полученный текст на русский язык, с сохранением структуры текста Вот HTML, который нужно спарсить: <div> &lt…
Создано: 16.07.2023
-1 ▲1 ответ.
Использую python и BeautifulSoup для парсинга вк. Нужно вытащить имя человека из следующего кода
Нужно с помощью BeautifulSoup вытащить имя и фамилию (Саша; Гори-Боль). Я пытался таким образом ProfileName = BSFile.find_all(attrs={"class": "ProfileInfo"}) В…
Создано: 05.07.2023
0 ▲1 ответ.
Список выводиться в одну строчку python
Изучая библиотеку bs4, я пыталась спарсить недостатки и сам отзыв, где их описывают пользователи. Получился такой код: minus = soap.find_all("div", class_="review-m…
Создано: 03.07.2023
0 ▲1 ответ.
Как спарсить текст из тега, вложенного в другой тег с помощью BS4
Задача состоит в том, чтобы спарсить карточку товара с сайта https://vedro.pro/oils_catalog?viewMode=tile&goods_group=oils&start=0. При работе у меня возникло несколько пр…
Создано: 27.06.2023
1 ▲1 ответ.
Не удается получить данные с сайта
Пишу парсер для сайта https://www.shibor.org/shibor/dataservicesen/ Необходимо получить данные с фрейма Shibor Имеется код import requests from bs4 import BeautifulSoup import re …
Создано: 26.06.2023
0 ▲1 ответ.
Как сделать правильно парсер?
Помогите, пожалуйста, решить проблему: никак не работает парсинг с авторизацией. Посмотрел все видео, правда, их там не так много, ничего не помогает. Просто каждый раз отдает мне…
Создано: 21.06.2023
0 ▲1 ответ.
BS4 парсинг html
Помогите спарсить информацию в ячейках следующего html кода: <tr style="font-weight:bold;"> <td width="450px" style="border-top:2px solid black;f…
Создано: 10.06.2023
0 ▲1 ответ.
Трансляция динамического элемента со страницы в файл
Как транслировать в txt файл или в Excel быстро изменяющийся элемент на странице? возможно ли это сделать при помощи Selenium или быть может это правильнее реализовать какими-то д…
Создано: 02.06.2023
0 ▲1 ответ.
Не работает парсер python
Всем привет. я делал парсер python и при выводе текста в консоль он пишет "None", как это можно исправить? вот код: import requests from bs4 import BeautifulSoup URL = &…
Создано: 31.05.2023
0 ▲1 ответ.
Парсинг сайта с динамической типизацией без использования Selenium
Попал в какой-то тупик на самом деле, либо не до конца все просмотрел. Больше склоняюсь к первому конечно) import requests url = 'https://store.steampowered.com/specials' s = requ…
Создано: 28.05.2023
0 ▲0 ответ.
soup.find_all находит не все классы
Использую Суп soup.find_all("div", class_="ticket-title") в DOM дереве наблюдаю как минимум 20 нужных мне классов.Но Суп упорно отбирает только 10.Почему? К XP…
Создано: 27.05.2023
0 ▲1 ответ.
Python Beautiful Soup Помогиту удалить "<tr></tr>"
Вот сам код: with open('index.html') as file: src = file.read() soup = BeautifulSoup(src, 'lxml') tram_schedule = soup.find('div', class_='column working-days').find_all('tr') for…
Создано: 10.05.2023
0 ▲1 ответ.
Переход между страничками таблицы
Необходимо достать данные с сайта. Табличку можно переключать кнопкой, всего 6000+ страниц import pandas as pd from selenium import webdriver from selenium.webdriver.chrome.option…
Создано: 09.05.2023
0 ▲2 ответ.
Как использовать условный оператор, если позиция отсутствует?
import requests from bs4 import BeautifulSoup import csv import openpyxl import pandas as pd import xlsxwriter import xlrd from openpyxl import load_workbook import numpy as np fr…
Создано: 08.05.2023
0 ▲1 ответ.
Python. Парсинг. Как сделать парсинг всех страниц сайта?
import requests from bs4 import BeautifulSoup import csv import openpyxl import pandas as pd import xlsxwriter import xlrd from openpyxl import load_workbook import numpy as np fr…
Создано: 07.05.2023
0 ▲0 ответ.
не могу получить ссылку методом get('href')
Всем добрый день. Пытаюсь спарсить сайт, но не могу получить ссылку из href (получаю ответ None) по второй строке. Поставил сообщалку print, чтоб проанализировать строки супа и по…
Создано: 21.04.2023
2 ▲1 ответ.
При парсинге берется английская версия сайта
Пишу парсер, который должен брать дату окончания скидки, но почему-то берется именно английская версия сайта, хотя accept-language указан в headers. Помогите пожалуйста парсить ру…
Создано: 19.04.2023
0 ▲1 ответ.
Python скачивание изображений с BS4
Код скачивает картинку и она занимает место, но при попытке открыть изображение становится 'ничем'... import requests import re from bs4 import BeautifulSoup as bs link = input(&q…
Создано: 18.04.2023