Не получается определить кодировку ответа сервера

Рейтинг: 1Ответов: 2Опубликовано: 15.03.2023

Пытаюсь спарсить данный сайт - https://footballprediction365.com/football-predictions/ Но в ответе он отдает что-то непонятное: �^]�9w��h�D�� �w�{�H3:mp���

Пытался использовать этот код для определения кодировки

    import chardet
    import urllib.request

    url = 'https://footballprediction365.com/football-predictions/'

    data = urllib.request.urlopen(url)
    print(chardet.detect(data.read())['encoding'])

Выходит ошибка:

urllib.error.HTTPError: HTTP Error 403: Forbidden

также использовал этот сайт для декодирования - https://2cyr.com/decode/?lang=ru но все равно не получается узнать правильную кодировку

Ответы

▲ 0Принят

Проблема решилась, когда я удалил headers

resp = requests.get(url)
▲ 0

Все отлично парситься.

from bs4 import BeautifulSoup
import requests

url = 'https://footballprediction365.com/football-predictions/'

page = requests.get(url)
soup = BeautifulSoup(page.text, 'lxml')

print(soup.find('p'))

ответ

<p id="site-description">Football prediction today with 1×2 betting tips, football predictions for BTTS, over/under 2.5 goals and correct score for today’s matches.</p>