Проблемы с параллельным парсингом
Нет понимания по какой причине при запуске программы происходит моментальное завершение. Смысл заключается в том, что есть базовые ссылки, которые дают данные с локального + ещё р…
Нет понимания по какой причине при запуске программы происходит моментальное завершение. Смысл заключается в том, что есть базовые ссылки, которые дают данные с локального + ещё р…
Есть код import lxml import requests import json import csv url = "https://pilomaterialov.net/catalog/" r = requests.get(url) src = r.text soup = BeautifulSoup(src, &quo…
Подскажите, как при помощи xpath выдернуть текстовое значение title? Вот кусок сайта для примера. <a id="bx_3966226736_564931_pict" href="/catalog/polubotinki_i_…
Ситуация следующая: пишу бота рассыльщика для Авито. Суть простая - Передаем название запроса Бот парсит страницу поиска и записывает в коллекцию ссылки на объявления Переходим на…
Всем привет. Не могу понять, почему возникает ошибка с экселевскими файлами, которые скачаны с помощью requests, если при скачивании вручную никаких проблем нет. Скачиваю следующи…
Помогите авторизоваться на олкс, перепробовал подставлять уже все параметры не помогает, может есть у кого решение, буду очень признателен?) import requests from requests import S…
У меня задание: взять данные из базы, (состоит из отчётов, выгруженных по Wildberries API) - база Prost(изменено) HOST=89.108.115.211(хост изменен) PORT=5433 DATABASE=u115241_resy…
Пишу парсер, который должен брать дату окончания скидки, но почему-то берется именно английская версия сайта, хотя accept-language указан в headers. Помогите пожалуйста парсить ру…
Написал скриптец на питоне, использую undetected chrome browser библиотеку. На сайт заходит, проходит капчу, все тип-топ вроде, но как только запускается скрипт сбора инфы - сразу…
import requests from bs4 import BeautifulSoup import json JSON = 'cards.json' HOST = 'https://catalog.onliner.by/' URL = 'https://catalog.onliner.by/conditioners?mfr%5B0%5D=gree&a…
Пишу парсер цен с ТП Steam, и столкнулся с такой проблемой: когда я начинаю парсить страницу https://steamcommunity.com/market/listings/730/M249%20%7C%20Deep%20Relief%20%28Well-Wo…
Не могу понять следующую ошибку: l = self.find_all(name, attrs, recursive, string, 1, _stacklevel=3, ^^^^^^^^^^^^^ AttributeError: 'str' object has no attribute 'find_all' import …
Как мне можно получить текст написанный в моем репозитории в .txt файле? У меня в репозитории в .txt файле написан следующий текст - "Тест1". Как мне через код на c# пол…
Начал изучать библиотеку Selenium на Python версии 4.8 и встретил первую ошибку непонятно связанную с чем. Вот код: from selenium import webdriver driver = webdriver.Chrome(execut…
Есть задача спарсить остатки товара с помощью только requests. Selenium, bs4 и пр. библиотеки использовать нельзя. В ручном режиме остатки можно увидеть на странице корзины, если …
Создайте функцию – контекст менеджер, которая будет получать на вход ID валюты и возвращать информацию о ней в виде: (1 шт.) Австралийский доллар стоит(ят) 49,2779 руб. Если такой…
Делаю парсинг текста. Текст представляет из себя Ip-адреса и порты. Мне нужно получить каждые Ip-адреса и порты в отдельности, чтобы их потом сохранить отдельно в базу. Примерно: …
Как правильно это реализовать, в выводе получаю ошибку AttributeError: 'NoneType' object has no attribute 'find_all' import requests from bs4 import BeautifulSoup url = 'https://w…
Совсем не понимаю, как мне выбирать значения для парсера, в следствии дальше чем сейчас продвинуться сложно. У меня есть страница сайта например: https://www.wildberries.ru/catalo…
Мне нужно спарсить эту страничку https://www.flashscore.com/match/ETiJbUxd/#/h2h/overall Скачал html сайта но там нет нужных данных ( голы, прошлые игры итд) Вместо них какой то j…
Мне дан API ЦБ РФ (https://cbr.ru/scripts/XML_daily.asp?date_req=10.04.2023). И мне нужно используя метод .find модуля BeautifulSoap4, зная лишь CharCode валюты, спарсить ее Value…
Я делаю парсер сайта ВКонтакте, вывожу текст поста и сколько на нём просмотров. При закуске скрипта выводятся значения последнего поста и всё, хотелось бы выводить значения всех п…
Я делаю парсер .vox файлов У меня есть поле palette И в нём находятся числа: [853769,2230549,3999000,11343896,14241548,16750606,16775513,14087784,9435703,1482278,1858858,866338,85…
Есть парсер, на python scrapy. Парсит все товары с магазина. Все работает, все ништяк, парситься каждая страница, НО медленно. Каждый товар парсился примерно 3-4 секунды (там пере…
Пытаюсь написать парсер, где нужна собрать цены на продукты, программа ничего не выводит
В результате print(r) в консоль выводит <Response [403]> , из-за чего это происходит? Как к нему подключится? from requests_html import HTMLSession from fake_useragent impor…
Почему при парсинге сайта программа не может найти b-page__container? Вместо этого программа выдаёт None. Как это исправить? https://yandex.ru/pogoda/region/225 import requests fr…
Пишу интерпретатор PHP на C# (чисто для себя как open source). Застряла на парсинге выражений. Что пробовала: Написала функцию через рекурсию, но криво обрабатывались ошибки синта…
Есть следующие строки: `GUID={f3f459b9-597a-4f0a-9e46-71642eff8048} (Microphone) Path={0.0.1.00000000} {e5979f07-3b2d-4d10-8302-7078372cbc5b} Stations Mask=0xffff Effective Statio…
Я установил для selenium расширение vpn-free.pro. Браузер загружает и включает расширение сразу. Как мне открыть автоматически расширение и поставить другую страну? Сразу включает…