Помогите с пагинацией
Есть сайт https://www.houzz.ru/ideabooks с очень странной пагинацией. Страницы указаны как везде.... но по факту ссылки на страницы следующего формата Cтраница 1-https://www.houzz…
Есть сайт https://www.houzz.ru/ideabooks с очень странной пагинацией. Страницы указаны как везде.... но по факту ссылки на страницы следующего формата Cтраница 1-https://www.houzz…
Кто нибудь, подскажите реализацию объединения одинаковых HTML тегов на Python. Есть строка: <b>Т</b><b><i>е</i></b><b><i>с</i>…
Провожу парсинг онлайн магазина. from bs4 import BeautifulSoup import re import lxml bookInfo = [] with open("C:/Users/user/Desktop/Alib.html") as file: src = file.read(…
Не получается залезть в этот тег, выдает None <app-root urlvalue="//search.worldbank.org/api/v2/procnotices?format=json&amp;apilang=en&amp;fl=*&amp;id=OP002314…
Есть вот такой html: <div class="section"> <div class="catalog-music inline_player_playlist"> <div class="music-popular-wrapper"> &…
Доброго времени суток всем. Осваиваю python и в качестве практики и надобности решил написать парсер, который по введенному тегу(запросу поисковика на сайте), собирал бесплатные к…
import bs4 import requests import xlsxwriter main_url = 'https://www.21vek.by/' headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like…
Не судите строго,я новичок и многого не знаю.(Изображение прикрепил) Дан класс "bigline" в нем есть "id" записи к которой мне надо обратиться ,но я не знаю как…
Код: import requests from bs4 import BeautifulSoup URL = "https://www.rbc.ru/politics/" page = requests.get(URL) soup = BeautifulSoup(page.content, "html.parser") title = soup.fin…
from bs4 import BeautifulSoup from urllib import request, error import ssl from urllib.parse import quote import time headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win6…
Имеется код, который берет адреса. При выполнении выдает ошибку Object of type Tag is not JSON serializable from bs4 import BeautifulSoup import requests import json JSON = 'locat…
Пишу парсер для Вк, и при попытке запросить ссылки из html кода, # и кирилица превращаются в не понятно что, код: from bs4 import BeautifulSoup as bs import requests cookies = { '…
Столкнулся с такой задачей: Необходимо спарсить сайт и перевести полученный текст на русский язык, с сохранением структуры текста Вот HTML, который нужно спарсить: <div> <…
Нужно с помощью BeautifulSoup вытащить имя и фамилию (Саша; Гори-Боль). Я пытался таким образом ProfileName = BSFile.find_all(attrs={"class": "ProfileInfo"}) В…
Изучая библиотеку bs4, я пыталась спарсить недостатки и сам отзыв, где их описывают пользователи. Получился такой код: minus = soap.find_all("div", class_="review-m…
Задача состоит в том, чтобы спарсить карточку товара с сайта https://vedro.pro/oils_catalog?viewMode=tile&goods_group=oils&start=0. При работе у меня возникло несколько пр…
Пишу парсер для сайта https://www.shibor.org/shibor/dataservicesen/ Необходимо получить данные с фрейма Shibor Имеется код import requests from bs4 import BeautifulSoup import re …
Помогите, пожалуйста, решить проблему: никак не работает парсинг с авторизацией. Посмотрел все видео, правда, их там не так много, ничего не помогает. Просто каждый раз отдает мне…
Помогите спарсить информацию в ячейках следующего html кода: <tr style="font-weight:bold;"> <td width="450px" style="border-top:2px solid black;f…
Как транслировать в txt файл или в Excel быстро изменяющийся элемент на странице? возможно ли это сделать при помощи Selenium или быть может это правильнее реализовать какими-то д…
Всем привет. я делал парсер python и при выводе текста в консоль он пишет "None", как это можно исправить? вот код: import requests from bs4 import BeautifulSoup URL = &…
Попал в какой-то тупик на самом деле, либо не до конца все просмотрел. Больше склоняюсь к первому конечно) import requests url = 'https://store.steampowered.com/specials' s = requ…
Использую Суп soup.find_all("div", class_="ticket-title") в DOM дереве наблюдаю как минимум 20 нужных мне классов.Но Суп упорно отбирает только 10.Почему? К XP…
Вот сам код: with open('index.html') as file: src = file.read() soup = BeautifulSoup(src, 'lxml') tram_schedule = soup.find('div', class_='column working-days').find_all('tr') for…
Необходимо достать данные с сайта. Табличку можно переключать кнопкой, всего 6000+ страниц import pandas as pd from selenium import webdriver from selenium.webdriver.chrome.option…
import requests from bs4 import BeautifulSoup import csv import openpyxl import pandas as pd import xlsxwriter import xlrd from openpyxl import load_workbook import numpy as np fr…
import requests from bs4 import BeautifulSoup import csv import openpyxl import pandas as pd import xlsxwriter import xlrd from openpyxl import load_workbook import numpy as np fr…
Всем добрый день. Пытаюсь спарсить сайт, но не могу получить ссылку из href (получаю ответ None) по второй строке. Поставил сообщалку print, чтоб проанализировать строки супа и по…
Пишу парсер, который должен брать дату окончания скидки, но почему-то берется именно английская версия сайта, хотя accept-language указан в headers. Помогите пожалуйста парсить ру…
Код скачивает картинку и она занимает место, но при попытке открыть изображение становится 'ничем'... import requests import re from bs4 import BeautifulSoup as bs link = input(&q…