Вопросы по тегу: парсер

0 ▲1 ответ.
Проблемы с параллельным парсингом
Нет понимания по какой причине при запуске программы происходит моментальное завершение. Смысл заключается в том, что есть базовые ссылки, которые дают данные с локального + ещё р…
Создано: 24.04.2023
0 ▲0 ответ.
Не парсятся ссылки
Есть код import lxml import requests import json import csv url = "https://pilomaterialov.net/catalog/" r = requests.get(url) src = r.text soup = BeautifulSoup(src, &quo…
Создано: 24.04.2023
0 ▲1 ответ.
Парсер на Python. Как вытащить значение title с помощью xpath
Подскажите, как при помощи xpath выдернуть текстовое значение title? Вот кусок сайта для примера. <a id="bx_3966226736_564931_pict" href="/catalog/polubotinki_i_…
Создано: 23.04.2023
1 ▲0 ответ.
Как настроить webdriver так, чтобы при его запуске в браузере были авторизированны аккаунты на сайтах?
Ситуация следующая: пишу бота рассыльщика для Авито. Суть простая - Передаем название запроса Бот парсит страницу поиска и записывает в коллекцию ссылки на объявления Переходим на…
Создано: 22.04.2023
0 ▲0 ответ.
Ошибка при чтении xlsx-файла, скачанного с помощью requests
Всем привет. Не могу понять, почему возникает ошибка с экселевскими файлами, которые скачаны с помощью requests, если при скачивании вручную никаких проблем нет. Скачиваю следующи…
Создано: 22.04.2023
0 ▲0 ответ.
Авторизация на олкс
Помогите авторизоваться на олкс, перепробовал подставлять уже все параметры не помогает, может есть у кого решение, буду очень признателен?) import requests from requests import S…
Создано: 20.04.2023
0 ▲1 ответ.
Python составить адресную строку имея параметры из задания
У меня задание: взять данные из базы, (состоит из отчётов, выгруженных по Wildberries API) - база Prost(изменено) HOST=89.108.115.211(хост изменен) PORT=5433 DATABASE=u115241_resy…
Создано: 20.04.2023
2 ▲1 ответ.
При парсинге берется английская версия сайта
Пишу парсер, который должен брать дату окончания скидки, но почему-то берется именно английская версия сайта, хотя accept-language указан в headers. Помогите пожалуйста парсить ру…
Создано: 19.04.2023
-4 ▲1 ответ.
Парсинг сайтов, защищенных cloudfare
Написал скриптец на питоне, использую undetected chrome browser библиотеку. На сайт заходит, проходит капчу, все тип-топ вроде, но как только запускается скрипт сбора инфы - сразу…
Создано: 19.04.2023
0 ▲0 ответ.
Добрый день! Начала недавно знакомиться с парсерами и столкнулась с такой проблемой. Див класс на сайте есть, а у меня в данных не отображается
import requests from bs4 import BeautifulSoup import json JSON = 'cards.json' HOST = 'https://catalog.onliner.by/' URL = 'https://catalog.onliner.by/conditioners?mfr%5B0%5D=gree&a…
Создано: 18.04.2023
0 ▲0 ответ.
Парсер ТП Steam получает цены в разных валютах
Пишу парсер цен с ТП Steam, и столкнулся с такой проблемой: когда я начинаю парсить страницу https://steamcommunity.com/market/listings/730/M249%20%7C%20Deep%20Relief%20%28Well-Wo…
Создано: 17.04.2023
0 ▲1 ответ.
python парсинг заголовка на сайте
Не могу понять следующую ошибку: l = self.find_all(name, attrs, recursive, string, 1, _stacklevel=3, ^^^^^^^^^^^^^ AttributeError: 'str' object has no attribute 'find_all' import …
Создано: 16.04.2023
0 ▲0 ответ.
Спарсить данные с .txt файла из github репозитория на c#
Как мне можно получить текст написанный в моем репозитории в .txt файле? У меня в репозитории в .txt файле написан следующий текст - "Тест1". Как мне через код на c# пол…
Создано: 15.04.2023
0 ▲2 ответ.
Selenium Python ошибка
Начал изучать библиотеку Selenium на Python версии 4.8 и встретил первую ошибку непонятно связанную с чем. Вот код: from selenium import webdriver driver = webdriver.Chrome(execut…
Создано: 14.04.2023
5 ▲2 ответ.
Парсинг количества товара на Wildberries
Есть задача спарсить остатки товара с помощью только requests. Selenium, bs4 и пр. библиотеки использовать нельзя. В ручном режиме остатки можно увидеть на странице корзины, если …
Создано: 14.04.2023
-5 ▲1 ответ.
Как избавиться от ошибки?
Создайте функцию – контекст менеджер, которая будет получать на вход ID валюты и возвращать информацию о ней в виде: (1 шт.) Австралийский доллар стоит(ят) 49,2779 руб. Если такой…
Создано: 14.04.2023
-1 ▲1 ответ.
Вырезка числового значения до (после) символа ":"
Делаю парсинг текста. Текст представляет из себя Ip-адреса и порты. Мне нужно получить каждые Ip-адреса и порты в отдельности, чтобы их потом сохранить отдельно в базу. Примерно: …
Создано: 13.04.2023
0 ▲2 ответ.
нужна помощь в парсере
Как правильно это реализовать, в выводе получаю ошибку AttributeError: 'NoneType' object has no attribute 'find_all' import requests from bs4 import BeautifulSoup url = 'https://w…
Создано: 12.04.2023
0 ▲1 ответ.
Как правильно выбирать значения для парсинга на Wildberries?
Совсем не понимаю, как мне выбирать значения для парсера, в следствии дальше чем сейчас продвинуться сложно. У меня есть страница сайта например: https://www.wildberries.ru/catalo…
Создано: 10.04.2023
0 ▲1 ответ.
Как спарсить данные если их нет в html?
Мне нужно спарсить эту страничку https://www.flashscore.com/match/ETiJbUxd/#/h2h/overall Скачал html сайта но там нет нужных данных ( голы, прошлые игры итд) Вместо них какой то j…
Создано: 10.04.2023
0 ▲1 ответ.
Метод .find() в библиотеке bs4
Мне дан API ЦБ РФ (https://cbr.ru/scripts/XML_daily.asp?date_req=10.04.2023). И мне нужно используя метод .find модуля BeautifulSoap4, зная лишь CharCode валюты, спарсить ее Value…
Создано: 10.04.2023
0 ▲1 ответ.
Как сделать чтобы выводилось несколько значений, а не одно?
Я делаю парсер сайта ВКонтакте, вывожу текст поста и сколько на нём просмотров. При закуске скрипта выводятся значения последнего поста и всё, хотелось бы выводить значения всех п…
Создано: 08.04.2023
1 ▲1 ответ.
Как перевести число в цвет
Я делаю парсер .vox файлов У меня есть поле palette И в нём находятся числа: [853769,2230549,3999000,11343896,14241548,16750606,16775513,14087784,9435703,1482278,1858858,866338,85…
Создано: 07.04.2023
0 ▲1 ответ.
Какой прокси выбрать
Есть парсер, на python scrapy. Парсит все товары с магазина. Все работает, все ништяк, парситься каждая страница, НО медленно. Каждый товар парсился примерно 3-4 секунды (там пере…
Создано: 07.04.2023
0 ▲1 ответ.
beautifulsoup не видит span
Пытаюсь написать парсер, где нужна собрать цены на продукты, программа ничего не выводит
Создано: 06.04.2023
0 ▲0 ответ.
При попытке подключиться к сайту для парсинга происходит ошибка 403
В результате print(r) в консоль выводит <Response [403]> , из-за чего это происходит? Как к нему подключится? from requests_html import HTMLSession from fake_useragent impor…
Создано: 05.04.2023
-1 ▲1 ответ.
Почему при парсинге сайта выдаёт None (bs4)
Почему при парсинге сайта программа не может найти b-page__container? Вместо этого программа выдаёт None. Как это исправить? https://yandex.ru/pogoda/region/225 import requests fr…
Создано: 04.04.2023
0 ▲1 ответ.
Парсинг PHP кода в дерево
Пишу интерпретатор PHP на C# (чисто для себя как open source). Застряла на парсинге выражений. Что пробовала: Написала функцию через рекурсию, но криво обрабатывались ошибки синта…
Создано: 04.04.2023
0 ▲0 ответ.
Как извлечь массив подстрок из строки
Есть следующие строки: `GUID={f3f459b9-597a-4f0a-9e46-71642eff8048} (Microphone) Path={0.0.1.00000000} {e5979f07-3b2d-4d10-8302-7078372cbc5b} Stations Mask=0xffff Effective Statio…
Создано: 03.04.2023
1 ▲0 ответ.
Как работать с расширением для браузера selenium?
Я установил для selenium расширение vpn-free.pro. Браузер загружает и включает расширение сразу. Как мне открыть автоматически расширение и поставить другую страну? Сразу включает…
Создано: 02.04.2023