Регулярное выражение для извлечения кодировки из meta-тега (Delphi, TRegExpr)

Рейтинг: 0Ответов: 2Опубликовано: 18.03.2015

День добрый!

Как правильно составить регулярное выражение, чтобы получить из следующих строк кодировку UTF-8?

<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<meta charset="UTF-8" />
<meta charset="UTF-8">
<meta http-equiv="Content-Type" charset=UTF-8" />

Используется Delphi > TRegExpr.

Спасибо!

Ответы

▲ 0Принят

Сама регулярка:

charset=("|)(.{1,9})"

Тебе нужно отлавливать 2-ю группу. В регулярке используется то, что в конце всегда кавычки и они одни. Тестировать регулярки можно тут http://regexr.com/


PS. моя регулярка не строгая, в некоторых случаях будет работать неправильно, например если закрывающих кавычек будет 2 или не будет вовсе.

▲ 0

charset="?(.*)" группа №1 будет содержать искомое значение.

Regexper Вам в помощь.