Регулярное выражение онлайн php: Мастер регулярного выражения для PHP
азы для новичков / Блог компании OTUS. Онлайн-образование / Хабр
В преддверии старта нового потока по курсу «Backend-разработчик на PHP», а также смежного с ним курса «Framework Laravel», хотим поделиться статьей, которую подготовил наш внештатный автор.
Внимание! данная статья не имеет отношения к программе курса и будет полезна только для новичков. Для получения более углубленных знаний приглашаем вас посетить бесплатный двухдневный онлайн интенсив по теме: «Создание Telegram-бота для заказа кофе в заведении и оплаты онлайн». Второй день интенсива будет проходить тут.
Всем привет! Всех с наступившим [20]{2,}0
годом. Сегодня я хочу затронуть тему, которая иногда является темой для шуток от «Да зачем тебе все это учить, если есть уже есть готовые решения» до «может тебе еще и весь Perl выучить?». Однако время идет, множество программистов начинают осваивать регулярные выражения, а на Хабре нет ни одной свежей (хоть регулярные выражения не слишком изменились за последнее время) статьи на этой тематику. Пришло время написать ещё одну!
Регулярные выражения в отрыве от их конкретной реализации
Регулярные выражения (обозначаемые в английском как RegEx или как regex) являются инструментальным средством, которое применяется для различных вариантов изучения и обработки текста: поиска, проверки, поиска и замены того или иного элемента, состоящего из букв или цифр (или любых других символов, в том числе специальных символов и символов пунктуации). Изначально регулярные выражения пришли в мир программирования из среды научных исследований, которые проводились в 50-е годы в области математики.
Спустя десятилетия принципы и идеи были перенесены в среду операционной системы UNIX (в частности вошли в утилиту grep
) и были реализованы в языке программирования Perl, который на заре интернета широко использовался на бэкенде (и по сей день используется, но уже меньше) для такой задачи, как, например, валидация форм.
Если они вроде простые, тогда почему такие страшные на первый взгляд?
На самом деле любое выражение может быть «регулярным» и применяться для проверки или поиска каких-либо символов. Например, слова Pavel или [email protected] тоже могут использоваться как регулярки, только, понятное дело, в довольно узком ключе. Для проверки работы регулярных выражений в среде PHP без запуска своего сервера или хостинга вы можете воспользоваться следующим онлайн сервисом (вот только на нем у меня не работала обработка русских символов). Для начала в качестве регулярного выражения мы используем просто Pavel.
Положим у нас есть следующий текст:
Pavel knows too much. Pavel using nginx and he’s not rambler.
Сейчас регулярные выражения нашли оба вхождения слова Pavel. Здорово, но звучит не очень полезно (разве что только вы зачем-то пытаетесь проанализировать что-то вроде количества упоминания слова сударь в Войне и Мире через Vim и Python, но тогда у меня к вам вопросов нет).
Вариативность выражения
Если ваше регулярное выражение вариативно (например, вам известна только некоторая его часть и нужно найти количество вхождений годов, начиная от 2000 и заканчивая 2099), то мы можем использовать следующее регулярное выражение: 20..
Текст: Молодые писатели пишут много чего. Например писатель 2002 года рождения очень отличается от 2008 и 2012
Здесь у нас с помощью регулярного выражения найдутся все годы, но пока в этом нет никакого смысла. Скорее всего нам не нужны годы дальше 2012 (хотя молодые писатели младше 8 лет могут обидеться, но не об этом сейчас). Стоит изучить наборы символов, но об этом попозже, потому как сейчас поговорим про другую важную часть регулярных выражений: экранирование метасимволов.
Представим, что нам нужно найти количество вхождений файлов с расширением .doc
(допустим, мы экспортируем только определенные файлы загруженные в нашу базу данных). Но ведь точка обозначает просто любой символ? Так как же быть?
Тут к нам на помощь приходит экранирование метасимволов обратным слешем \
. Теперь выражение \.doc
будет достаточно успешно искать любой текстовое упоминание с расширением .doc
:
Регулярное выражение: \.doc
Текст: kursach.doc , nepodozritelneyfail.exe
, work.doc, shaprgalka.rtf doc
Как видите, мы успешно можем найти количество файлов с расширением .doc
в списке. Однако мы не сможем вытащить полные имена файлов с помощью данного регулярного выражения, например, в массив. Пришло время взглянуть на наборы символов.
Совпадение с целым набором символов
В регулярных выражениях совпадения с набором обеспечивается с помощью метасимволов — квадратных скобочек [ ]
. Любые два символа ASII могут быть указаны в качестве начала и конца диапазона. Для простой реализации, положим, мы хотим найти все пронумерованные файлы от 0 до 9 с расширением .jpg
.
Регулярное выражение: [0-9]\.jpg
Текст: 1.jpg, 2.jpg, 3.jpg, photo.jpg, anime.jpg, 8.jpg, jkl.jpg
Стоит отметить, что имя файлов из более 1 цифры наше регулярное выражение не охватит. Про множественный выбор будет чуть ниже, а пока представим, что нам вдруг понадобилось добиться обратного результата. Добавим метасимвол ^
(у которого, самое противное, в регулярных выражениях есть аж две функции). Чтобы воспользоваться им как исключением, нужно добавить его именно внутрь нашего набора:
Регулярное выражение: [^0-9]\.jpg
Текст: 1.jpg, 2.jpg, 3.jpg, photo.jpg , anime.jpg , 8.jpg, jkl.jpg
Но без множественного выбора это конечно неполноценные выражения.
Полезные таблицы
Приведем таблицу метасимволов:
Таблица пробельных метасимволов
Множественный выбор: делаем простую валидацию
Вооружившись полученными знаниями, попробуем сделать регулярное выражение, которое находит, например, слова короче 3 букв (стандартная задача для антиспама). Если мы попробуем использовать следующее регулярное выражение — \w{1,3}
(в котором метасимвол \w
указывает на любой символ, а фигурные скобки обозначают количество символов от сколько до скольки, то у нас выделятся все символы подряд — нужно как-то обозначить начало и конец слов в тексте. Для этого нам потребуется метасимвол \b
.
Регулярное выражение: \b\w{1,3}\b:
Текст: good word
not
egg
Неплохо! Теперь слова короче трех букв не смогут попадать в нашу базу данных. Посмотрим на валидацию почтового адреса:
Регулярное выражение: \w+@\w+\.\w+
Требования: в электронной почте в начале должен быть любой символ (цифры или буквы, ведь электронная почта, которая состоит только из цифр в начале, встречается довольно часто). Потом идет символ @
, затем — сколько угодно символов, после чего экранированная точка (т.е. просто точка) и домен первого уровня.
Подробнее рассмотрим повторение символов
Теперь давайте поподробнее разберем, как можно в регулярных выражениях задать повторение символов. К примеру вы хотите найти любые комбинации цифр от 2-6 в тексте:
Регулярное выражение: [2-6]+
Текст: Here are come’s 89 different 234 digits 24 .
Давайте я приведу таблицу всех квантификаторов метасимволов:
В применении квантификаторов нет ничего сложного. Кроме одного нюанса: жадные и ленивые квантификаторы. Приведем таблицу:
Ленивые квантификаторы отличаются от жадных тем, что они выхватывают минимальное, а не максимальное количество символов. Представим, что есть у нас задача найти все теги заголовков h2-h6 и их контент, а весь остальной текст не должен быть затронут (я умышленно ввел несуществующий тэг h7, чтобы не мучаться с экранированием хабровских тэгов):
Регулярное выражение: <h[1-7]>.*?<\/h[1-7]>
Текст: <
h7
>
hello </
h7
>
lorem ipsum avada kedavra <
h7
> buy<
/h7
>
Все сработало успешно, однако только благодаря ленивому квантификатору. В случае применения жадного квантификатора у нас выделился бы весь текст между тегами (полагаю, в иллюстрации это не нуждается).
Границы символьных строк
Границы символьных строк мы уже использовали выше. Приведем здесь более подробную таблицу:
Работа с подвыражениями
Подвыражения в регулярных выражениях делаются с помощью метасимвола группировки ()
.
Приведем пример регулярного выражения, которое универсально может находить различные вариации IP — адресов.
Регулярное выражение: (((25[0-5])|(2[0-4]\d)|(1\d{2})|(\d{1,2}))\.){3}(((25[0-5]|(2[0-4]\d)|(1\d{2})|(\d{1,2}))))
Текст: 255.255.255.255 просто адрес
191.198.174.192 wikipedia
87.240.190.67 vk
31.13.72.36 facebook
Здесь используется логический оператор |
(или), который позволяет нам составить регулярное выражение, которое соответствует правилу, по которому составляются IP- адреса. В IP адресе должно быть от 1 и до 3 цифр, в котором число из трех чисел может начинаться с 1, с 2 (или тогда вторая цифра должна быть в пределах от 0 и до 4), или начинаться с 25, и тогда 3 цифра оказывается в пределах от 0 и до 5. Также между каждой комбинацией цифр должна стоять точка. Используя приведенные выше таблицы, постарайтесь сами расшифровать регулярное выражение сверху. Регулярные выражения в начале пугают своей длинной, но длинные не значит сложные.
Просмотр вперед
Для просмотра выражения на любую комбинацию определенных символов указывается шаблон по которому обнаруживается, но не возвращается, совпадение. По существу, просмотр вперед определяет подвыражение и поэтому он формируется соответствующим образом. Синтаксический шаблон для просмотра вперед состоит из подвыражения, перед которым стоит ?=, а после равно следует сопоставляемый текст.
Приведем конкретную задачу: есть пароль, который должен состоят не менее чем из 7 символов и должен обязательно включать как минимум одну заглавную букву и цифру. Здесь все будет несколько сложнее, потому как пользователь должен иметь возможность поставить заглавную букву как в начале, так и в середине предложения (и тоже самое должно повторяться с буквой).
Следовательно, нам потребуется просмотр выражения вперед. Кроме того, нам нужно разбить на группы знаки. И я хочу ограничить его размеры от 8 и до 22 знаков:
Регулярное выражение: /^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)[a-zA-Z\d]{8,}$/
Текст: Qwerty123
Im789098
weakpassword
Особенности работы регулярных выражений именно в PHP
Для изучения работы регулярных выражений в PHP, изучите функции в официальной документации PCRE (Perl Compatible Regular Expressions) которая доступна на официальном сайте. Выражение должно быть заключено в разделители, например, в прямые слеши.
Разделителем могут выступать произвольные символы, кроме буквенно-цифровых, обратного слеша ‘\’ и нулевого байта. Если символ разделителя встречается в шаблоне, его необходимо экранировать \. В качестве разделителей доступны комбинации, пришедшие из Perl: (), {}, [].
Какие функции используются в php? В пакете PCRE предоставляются следующие функции для поддержки регулярных выражений:
- preg_grep() — выполняет поиск и возвращает массив совпадений.
- preg_match() — выполняет поиск первого совпадения с помощью регулярных выражений
- preg_match_all() — выполняет глобальный поиск с помощью регулярных выражений
- preg_quote() — принимает шаблон и возвращает его экранированную версию
- preg_replace() — выполняет операцию поиска и замены
- preg_replace_callback() — тоже выполняет операцию поиска и замены, но используют callback – функцию для любой конкретной замены
- preg_split() — разбивает символьную строку на подстроки
Для организации совпадения без учета регистра букв служит модификатор i
.
С помощью модификатора m
можно активировать режим обработки многострочного текста.
Замещающие строки допускается вычислять в виде кода PHP. Для активизации данного режима служит модификатор e.
Во всех функциях preg_replace()
, preg_replace_callback()
и preg_split()
поддерживается дополнительный аргумент, который вводит ограничения на максимальное количество замен или разбиений.
Обратные ссылки могут обозначаться с помощью знака $ (например $1), а в более ранних версиях вместо знака $ применяются знаки \\.
Метасимволы \E, \l, \L, \u и \U не используются (поэтому они и не были упомянуты в этой статье).
Наша статья была бы неполной без классов символов POSIX, которые также работают в PHP (и в общем вполне могут повысить читабельность ваших регулярок, но не все их спешат учить, потому как часто ломают логику выражения).
Под конец приведу пример конкретной реализации регулярных выражений в PHP, используя упомянутые выше реализации. Также я добавил валидацию имени пользователя, чтобы он не смог вводить слишком короткие сочетания букв (ну, положим, это никнеймы, а не имена, имена бывают короче двух букв):
$pattern_name = '/\w{3,}/';
$pattern_mail = '/\w+@\w+\.\w+/';
$pattern_password = '/^(?=.*[a-z])(?=.*[A-Z])(?=.*\d)[a-zA-Z\d]{8,}$/';
if (preg_match($pattern_name, $name) &&
preg_match($pattern_mail, $mail) &&
preg_match($pattern_password, $_POST['password'])) {
# тут происходит, к примеру, регистрация нового пользователя, отправка ему письма, и внесение в базу данных
}
Всем спасибо за внимание! Конечно, сегодня мы затронули только часть регулярных выражений и о них можно написать ещё несколько статей. К примеру, мы не поговорили о реализации поиска повторений одинаковых слов в тексте. Но я надеюсь, что полученных знаний хватит, чтобы осмысленно написать свою первую валидацию формы и уже потом перейти к более зубодробительным вещам.
По традиции, несколько полезных ссылок:
Шпаргалка от MIT по регулярным выражениям
Официальная часть документации php по регулярным выражениям.
На этом все. До встречи на интенсиве!
Второй день интенсива пройдет тут
Выбираем конструктор регулярных выражений для PHP
От автора: дорогие товарищи, я попал! Мне редактура все подсыпает и подсыпает ТЗ на написание материалов по регулярным выражениям. А я их страх как не люблю. Но сегодня расслабимся немного – подберем для себя один из конструкторов регулярных выражений PHP и другие «облегчалки», чтоб потом меньше голова болела.
Варианты
Вот несколько сервисов, которые облегчают создание и тестирование регулярок: uvsoftium.ru
Сервис имеет простой и понятный интерфейс на русском, что во многом облегчает понимание всего «происходящего». Внизу находится напоминалка с описанием основного синтаксиса составления регулярных выражений. Рекомендую к использованию!
bl2.ru
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
В курсе 39 уроков | 15 часов видео | исходники для каждого урока
Получить курс сейчас!
Еще один для регулярных выражений PHP онлайн конструктор с русскоязычным интерфейсом. Кроме функции, с помощью которой следует обрабатывать регулярку, здесь можно установить кодировку строки: utf-8 или cp1251.
regex101.com
Специализированный сервис для работы, тестирования и обучения обращению с регулярками. На нем вы сможете найти множество справочных материалов, но, к сожалению, все они на английском, как и весь пользовательский интерфейс.
Также на этой платформе имеется несколько дополнительных инструментов. Среди них удобный конструктор для PHP скриптов, который генерирует программный код «по мотивам» введенного регулярного выражения.
uiregex.com
Самый правильный для русского человека сервис обращения с регулярками. По сравнению со своими «собратьями» он имеет целый ряд преимуществ. Его интерфейс поддерживает русский язык. Кроме этого, если вы не знаете ничего о регулярных выражениях, то можете пополнить свой багаж знаний, пройдя короткий интерактивный курс.
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
В курсе 39 уроков | 15 часов видео | исходники для каждого урока
Получить курс сейчас!
Конструктор снабжен правильными примерами, на основе которых легко составить свое регулярное выражение для валидации. Поэтому с применением этого PHP конструктора у вас не должно возникнуть никаких затруднений. Однозначно рекомендую данный сервис для новичков!
regexpres.narod.ru
Конструктор немного «не в тему», поскольку заточен только под создания регулярок для JavaScript. Но так как эта технология тесно сплетается с PHP, то его тоже можно рекомендовать к применению.
Кроме онлайн-сервисов для создания регулярных выражений существует несколько десктопных вариантов. Вот несколько из них:
The Regex Coach
Expresso
Другие облегчалки
Если речь уж зашла об инструментах, облегчающих нелегкий труд PHP-разработчика, то стоит перечислить и другие популярные специализированные онлайн-сервисы:
Google Сайты
Мало кто знает, что глобальный поисковик предлагает для использования свой бесплатный конструктор сайтов PHP. Сервис имеет простой интерфейс и сопровождает создание ресурса интерактивными подсказками.
Site scan
Позволяет проверить сайт на наличие устаревших библиотек, выявить проблемы компоновки и другие недочеты. Сервис предоставляется Microsoft, так что «зачетный» инструмент для сайтостроителей.
Кстати, если кто знает о хорошем конструкторе классов PHP, буду признателен. Если вам нужно подсказать какой сервис, обращайтесь в комментариях под материалом. Вот такая кооперация получается .
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
В курсе 39 уроков | 15 часов видео | исходники для каждого урока
Получить курс сейчас!
Хотите изучить регулярные выражения на PHP?
Посмотрите 12-ти часовой видео курс по регулярным выражениям на PHP!
Смотреть
Проверка регулярных выражений онлайн. Проверка логина
От автора: приветствую вас, друзья. Если вы не знаете как быстро и просто проверить ваше регулярное выражение онлайн, тогда эта статья как раз для вас. В статье вы найдете несколько онлайн сервисов для проверки регулярных выражений, которые позволят протестировать шаблон регулярного выражения буквально за считанные секунды. Приступим?
На самом деле подобных сервисов десятки, если не сотни в сети. Однако мне больше всего нравится два онлайн сервиса, которые можно найти по следующим адресам.
regexr.com
regexpal.com
Оба эти сервиса похожи друг на друга как визуально, так и функционально. Чаще всего я на практике пользуюсь первым и второй привел просто в качестве альтернативы.
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
В курсе 39 уроков | 15 часов видео | исходники для каждого урока
Получить курс сейчас!
Давайте теперь попробуем составить шаблон регулярного выражения и протестируем работу любого из предложенных сервисов. Например, пусть перед нами стоит задача проверить логин, в котором мы разрешаем только латинские буквы, цифры, символ подчеркивания и тире. Если в строке будет присутствовать любой другой символ, значит такой логин нам не подойдет.
Возможный вариант шаблона регулярного выражения будет таким:
Как видите, выделены только логины, которые нам подходят. Давайте теперь разберем данный шаблон. Как вы помните, шаблон должен быть обрамлен разделителями, в данном случае это слеши (//).
После слешей идут так называемые флаги (еще можно встретить названия: символы внутренних опций или модификаторы шаблона). Флаг i делает шаблон регистронезависимым, т.е. если в шаблоне мы укажем маленькую литеру a — она совпадет как с символом a в нижнем, так и в верхнем регистре.
Флаг g поддерживается в JavaScript. В PHP для регулярных выражений данного флага нет, но вместо него есть функция preg_match_all(). Данный флаг ищет все совпадения в строке. Без данного флага будет найдено только первое совпадение.
Ну и флаг m обеспечивает поиск в мультистрочном режиме. Без данного флага шаблон работал бы только с первой строкой текста.
Все эти флаги можно выбрать в меню flags в правом верхнем углу программы.
Идем дальше. Мы будем валидировать всю строку с логином от начала до конца. Этого можно добиться, указав якоря ^ (начало строки) и $ (конец строки). Таким образом, если во всей строке от начала до конца будет хоть один неразрешенный символ — вся строка не будет приниматься.
Квадратные скобки — [] — являются символьным классом в регулярных выражениях. В символьном классе можно указать набор символов, которые мы хотим найти в строке. В данном случае мы разрешаем латинские литеры от a до z (благодаря флагу i разрешаются также литеры A-Z верхнего регистра), цифры от 0 до 9, символ подчеркивания и тире.
Ну и метасимвол + после символьного класса указывает на допустимое количество перечисленных в символьном классе символов — это может быть 1 символ и более (до бесконечности).
Как видим, все достаточно просто. При желании мы можем сократить регулярное выражение, заменив его таким вариантом:
Как видим, результат не изменился. \w в новом шаблоне соответствует латинским буквам, цифрам и символу подчеркивания.
На этом будем завершать данную статью. Больше о регулярных выражениях вы можете узнать из нашего курса по регулярным выражениям. Удачи!
Бесплатный курс по PHP программированию
Освойте курс и узнайте, как создать динамичный сайт на PHP и MySQL с полного нуля, используя модель MVC
В курсе 39 уроков | 15 часов видео | исходники для каждого урока
Получить курс сейчас!
Хотите изучить регулярные выражения на PHP?
Посмотрите 12-ти часовой видео курс по регулярным выражениям на PHP!
Смотреть
онлайн сервис по работе с регулярными выражениями
Регулярные выражения прочно вошли в жизнь разработчиков и частенько приходят на помощь в тех ситуациях, когда необходимо осуществить специфический поиск или подстановку. Многие текстовые редакторы, программы и утилиты поддерживают поиск по регулярным выражениям (TotalCommander, Notepad++ и пр.), чем значительно облегчают жизнь тем, кто ищет.
Зачастую составление регулярного выражения у многих (не только начинающих разработчиков) вызывает проблемы, и отъем приличного куска времени. Онлайн-сервис easyregexp.ru призван помочь коллегам по цеху (программистам всех мастей и народов) или просто желающим освоить регулярные выражения.
Итак, чем располагает наш сервис:
- Быстрая проверка регулярных выражений
Проверка регулярного выражения с подсветкой синтаксиса. Поможет быстро проверить работоспособность выражения на конкретном примере, достаточно поместить текст в поле «Введите пример текста» и начать вводить регулярное выражение. - Конструктор регулярных выражений
Позволит Вам максимально просто и в кратчайшие сроки собрать регулярное выражение, пользуясь подсказками и проверяя его на реальных функциях поиска и подстановки в PHP и Javascript. На странице конструктора справа от формы для тестирования расположен блок метасимволов, разбитый по категориям. При наведении на символ будет показана краткая информации о нем и пример использования. - Оптимизатор регулярных выражений
Сократит Ваше выражение путем эквивалентных замен до минимального количества символов для повышения читабельности, простоты и понимания. - Сохраняйте Ваши регулярки и делитесь ссылкой с друзьями и коллегами. Сделать это достаточно просто: заполните поля «Введите регулярное выражение» и «Введите пример текста» на странице конструктора, и жмите кнопку «Сохранить». После сохранения Вы получаете ссылку.
- Весь интерфейс сервиса прост и интуитивно понятен, а если нет — то милости просим на страницу FAQ
Если у Вас возникают вопросы, предложения и пожелания, воспользуйтесь контактной формой для связи с администрацией сайта.
Помощники в создании регулярных выражений
В настоящее время сложно представить разработку сайтов и приложений без использования регулярных выражений (если только сайт или приложение простенькое). Ведь регулярные выражения представляют собой формальный язык поиска и осуществления манипуляций с подстроками в тексте, который основан на использовании метасимволов (wildcard characters).
Конструктор регулярных выражений
Интересный конструктор регулярных выражений (regexp online generator) для PHP и Javascript. На момент тестирования не корректно работал с регулярными выражениями для PHP, в которых используются русские символы (возникала ошибка в момент вывода результатов). А так, если откинуть данный момент, то вполне неплохой конструктор, в котором можно по практиковаться с составлением различных выражений.
Regular Expression Library
На сайте есть много интересных паттернов регулярных выражений, а также возможность их протестировать прямо на сайте. На данный момент свыше 6500+ регулярных выражений от разных участников проекта. Хорошая возможность подсмотреть или найти для себя нужное регулярное выражение.
PCRE
Еще один простой конструктор регулярных выражений, совместимых с Perl. Вариант для тех, кому не нужно ничего лишнего для создания регулярного выражения.
Генератор правил валидации
Под конец написании статьи нашел еще один интересный сервис для создания регулярных выражений из сопоставляемой строки. Для начала работы достаточно ввести значение в данное поле и нажать на кнопку «Генерировать». После чего вы сами увидите появившееся регулярное выражение в поле RegEx. А вот в тестовом поле можно ввести другое значение, если все правильно, то будет выдан результат о корректности заполнения в соответствии с регуляркой.
Конечно, ресурс не является панацеей при создании новых правил, но тем не менее порой помогает быстро создать новое выражение даже не опытному в этой области человеку.
Ну и еще один конструктор регулярных выражений — RegExr. Аналог PCRE, возможно покажется кому-то более удобным.
Regular Expressions 101
Вот недавно нашел еще одного интересного помощника при составлении регулярных выражений. В нем можно выбрать вид регулярных выражений для PHP, Python, JavaScript или Golang. Есть даже небольшая библиотека готовых выражений.
Хочется сказать, что подобных конструкторов много, но я привел самые наиболее интересные. Возможно вы используете какой-то другой — буду рад вашим комментариям. Следите за обновлениями на моем сайте.
30 примеров полезных регулярных выражений
Регулярные выражения — мощный инструмент, который должен быть в арсенале каждого разработчика. С их помощью можно находить совпадения в строках на основе довольно сложных шаблонах. Используя регулярные выражения при создании динамических веб-сайтов, разработчик экономит кучу времени.
Процесс разработки веб-приложений значительно отличается от разработки программного обеспечения, однако основные моменты при программировании одинаковы в обоих случаях, поэтому выгода от использования регулярных выражений будет видна всем.
Изучение регулярных выражений (regex) довольно сложный процесс, особенно для начинающих, но при правильном подходе, вы освоите чрезвычайно мощный и полезный инструмент.
Самым сложным этапом при обучении с нуля является понимание синтаксиса регулярных выражений. Чтобы не тратить время на написание своих собственных регулярных выражений, автор статьи собрал 30 различных примеров, которые чаще всего используются при работе над различными проектами.
Как известно, регулярные выражения не «привязаны» к какому-то определенному языку программирования, поэтому вы можете использовать приведенные ниже примеры выражений при разработке проектов на различных языках. Например, на JavaScript, PHP или Python.
Лучшее регулярное выражение для валидации email в web формах
/^[^@]+@[^@.]+\.[^@]+$/
Оговорка «на клиенте» сделана не просто так. Задача валидации на клиенте — подсказать пользователю, где он ошибся в написании email-а. Важно случайным образом не запретить пользователю с непредусмотренным емейлом воспользоваться формой. Учитывая то, какие варианты емейла могут быть (неожиданные домены, появляющиеся по пучку каждый месяц, ip адреса в качестве домена, и символы точки и симполы +, и другие неизвестные широкому обывателю вещи), напрашивается вывод, что лучшая валидация проверит емейл на наличие текста вида текст-собачка-текст-точка-текст.
Проверка надежности пароля
^(?=.*[A-Z].*[A-Z])(?=.*[!@#$&*])(?=.*[0-9].*[0-9])(?=.*[a-z].*[a-z].*[a-z]).{8}$
Надежность пароля — довольно субъективное понятие, поэтому не существует универсального решения для проверки. Однако, приведенный выше пример регулярного выражения может стать хорошей отправной точкой, если вы не желаете придумывать выражение для проверки пароля с нуля.
Код цвета в шестнадцатеричном формате
\#([a-fA-F]|[0-9]){3, 6}
Шестнадцатеричные коды цветов используются при веб-разработке очень часто. Это регулярное выражение может быть поможет сравнить: совпадает ли какая-либо строка с шаблоном шестнадцатеричного кода.
Проверка адреса электронной почты
/[A-Z0-9._%+-]+@[A-Z0-9-]+.+.[A-Z]{2,4}/igm
Одной из самых распространенных задач при разработке является проверка соответствия введенной пользователем строки формату адреса электронной почты. Существует множество различных вариантов выражений для решения этой задачи, автор этой статьи предлагает свой оригинальный вариант.
IP-адрес (v4)
/\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\b/
Как e-mail может использоваться для идентификации посетителя, так IP-адрес является идентификатором конкретного компьютера в сети. Приведенное регулярное выражение проверяет соответствие строки формату IP-адреса v4.
IP-адрес (v6)
(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4}){1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4}){1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4}){1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4}){1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4}){1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4}){0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:){0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:){1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\.){3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))
Вы также можете проверить строку на соответствие формату IP-адреса новой, шестой версии более продвинутым регулярным выражением.
Разделитель в больших числах
/\d{1,3}(?=(\d{3})+(?!\d))/g
Традиционными разделителями в больших числах являются запятые, точки или другие знаки, повторяющиеся в числе через каждые 3 символа. Приведенный код регулярного выражения работает с любым числом и любым определенными вами символами для разделения трехзначных частей в больших числах: тысячах, миллионах и т.п.
Добавление протокола перед гиперссылкой
if (!s.match(/^[a-zA-Z]+:\/\//))
{
s = 'http://' + s;
}
Независимо от того, с каким языком вы работаете: JavaScript, Ruby или PHP, это регулярное выражение может оказаться очень полезным. С его помощью проверяется любой URL-адрес на наличие в строке протокола, и если протокол отсутствует, указанный код добавляет его в начало строки.
«Вытягиваем» домен из URL-адреса.
/https?:\/\/(?:[-\w]+\.)?([-\w]+)\.\w+(?:\.\w+)?\/?.*/i
Как известно, любой URL-адрес состоит из нескольких частей: вначале указывается протокол (HTTP или HTTPS), иногда за ним идет субдомен, а в завершении добавляется путь к странице. Вы можете использовать это выражение, чтобы вернуть только доменное имя, исключив все остальные части адреса.
Сортировка ключевых фраз по количеству слов
^[^\s]*$ //соответствует одному ключевому слову
^[^\s]*\s[^\s]*$ //соответствует фразе из 2 ключевых слов
^[^\s]*\s[^\s]* //соответствует фразе, содержащей по крайней мере 2 кючевых слова
^([^\s]*\s){2}[^\s]*$ //соответствует фразе из 3 ключевых слов
^([^\s]*\s){4}[^\s]*$ //соответствует фразе из 5 и более ключевых слов
Это действительно полезные выражения для пользователей Google Analytics и инструмента для веб-мастеров. Ведь с помощью них можно отсортировать ключевые фразы, используемые посетителями при поиске по количеству слов, входящих в них.
Выражения могут проверять фразы, содержащие определенное количество слов (например, 5), а также фразы количество слов в которых более двух, трех и т.д. Одно из самых мощных выражений, используемое для сортировки данных аналитики.
Поиск валидной строки Base64 в PHP
\?php[ \t]eval\(base64_decode\(\'(([A-Za-z0-9+/]{4})*([A-Za-z0-9+/]{3}=|[A-Za-z0-9+/]{2}==)?){1}\'\)\)\;
Если вы являетесь PHP-разработчиком, то иногда вам может понадобиться найти объект, закодированный в формате Base64. Указанное выше выражение может использоваться для поиска закодированных строк в любом PHP-коде.
Проверка телефонного номера
^\+?\d{1,3}?[- .]?\(?(?:\d{2,3})\)?[- .]?\d\d\d[- .]?\d\d\d\d$
Это регулярное выражение применяется для проверки любого номера телефона, прежде всего, американского формата телефонных номеров.
Проверка телефонных номеров может стать довольно сложной задачей, поэтому автор статьи рекомендует детально ознакомиться с различными вариантами решения на сайте stackoverflow.com
Для проверки российских телефонных номеров используйте следующее выражение:
^((\+?7|8)[ \-] ?)?((\(\d{3}\))|(\d{3}))?([ \-])?(\d{3}[\- ]?\d{2}[\- ]?\d{2})$
Начальные и конечные пробелы
^[ \s]+|[ \s]+$
Используйте это регулярное выражение для того, чтобы избавиться от начальных и конечных пробелом в строке. Это не особо распространенная задача, но иногда это выражение может быть полезным. Например, при получении данных из БД или передачи строки скрипту в другой кодировке.
«Вытягиваем» HTML-код изображения
\< *[img][^\>]*[src] *= *[\"\']{0,1}([^\"\'\ >]*)
Если по какой-либо причине вам необходимо «вытянуть» HTML-код изображения прямо из кода страницы, это регулярное выражение станет для вас идеальным решением. Хотя оно может без проблем работать на стороне сервера, для фронтенд-разработчиков приоритетней будет использовать метод attr() библиотеки jQuery вместо указанного регулярного выражения.
Проверяем дату на соответствие формату DD/MM/YYYY
^(?:(?:31(\/|-|\.)(?:0?[13578]|1[02]))\1|(?:(?:29|30)(\/|-|\.)(?:0?[1,3-9]|1[0-2])\2))(?:(?:1[6-9]|[2-9]\d)?\d{2})$|^(?:29(\/|-|\.)0?2\3(?:(?:(?:1[6-9]|[2-9]\d)?(?:0[48]|[2468][048]|[13579][26])|(?:(?:16|[2468][048]|[3579][26])00))))$|^(?:0?[1-9]|1\d|2[0-8])(\/|-|\.)(?:(?:0?[1-9])|(?:1[0-2]))\4(?:(?:1[6-9]|[2-9]\d)?\d{2})$
Проверять даты сложно, потому что они могут быть представлены в различных форматах, в том числе содержащих и числа, и текст.
В PHP имеется отличная функция date(), но она не всегда подходит, ведь в нее может быть передана необработанная строка. Поэтому для проверки указанного формата даты нужно использовать приведенное выше регулярное выражение.
Совпадение строки с адресом видеоролика на YouTube
/http:\/\/(?:youtu\.be\/|(?:[a-z]{2,3}\.)?youtube\.com\/watch(?:\?|#\!)v=)([\w-]{11}).*/gi
На протяжении нескольких лет на Youtube не меняется структура URL-адресов. Youtube является самым популярным видео хостингом в Интернет, благодаря этому, видео с Youtube набирают наибольший трафик.
Если вам необходимо получить ID какого-либо видеоролика с Youtube, воспользуйтесь приведенным выше регулярным выражением. Это наилучшее выражение, подходящее для всех вариантов URL-адресов на этом видео-хостинге.
Проверка ISBN
/\b(?:ISBN(?:: ?| ))?((?:97[89])?\d{9}[\dx])\b/i
Информация обо всех печатные изданиях, хранится в системе, известной как ISBN, которая состоит из 2 систем: ISBN-10 и ISBN-13. Неспециалисту очень сложно увидеть различия между этими системами. Однако, представленное выше регулярное выражение позволяет проверять соответствие кода ISBN сразу обоим системам: будь то ISBN-10 или ISBN-13. Код написан на PHP, поэтому это решение подходит исключительно для веб-разработчиков.
Проверка почтового индекса (Zip Code)
^\d{5}(?:[-\s]\d{4})?$
Автор этого регулярного выражения не только придумал его, но и еще нашел время его описать. Это выражение будет полезно вам, если вы проверяете совпадение строки со стандартным пятизначным индексом или его удлиненным вариантом, содержащим 9 знаков. Обращаем ваше внимание, что это выражение подходит только для проверки американских почтовых индексов. Для индексов других стран необходима настройка.
Для проверки российских почтовых индексов используйте следующее выражение:
^\d{6}$
Проверка правильности имени пользователя Twitter
/@([A-Za-z0-9_]{1,15})/
Это небольшое регулярное выражение помогает найти имя пользователя Twitter внутри текста. Оно проверяет наличие имени в твитах по шаблону: @username.
Проверка номера кредитной карты
^(?:4[0-9]{12}(?:[0-9]{3})?|5[1-5][0-9]{14}|6(?:011|5[0-9][0-9])[0-9]{12}|3[47][0-9]{13}|3(?:0[0-5]|[68][0-9])[0-9]{11}|(?:2131|1800|35\d{3})\d{11})$
Проверка номера кредитной карты очень часто проводится при осуществлении платежей в различных платежных онлайн -системах. Однако, регулярное выражение обеспечивает минимальную проверку стандартной кредитной карты.
Вы можете ознакомиться с более полным списком кодов для детальной проверки карт. Список включает в себя такие системы как Visa, MasterCard, Discover и многие другие.
Поиск CSS-атрибутов
^\s*[a-zA-Z\-]+\s*[:]{1}\s[a-zA-Z0-9\s.#]+[;]{1}
Ситуация, когда придется воспользоваться указанным регулярным выражением, может сложиться очень редко, но не факт что не сложится никогда
Этот код можно использовать когда будет необходимо «вытянуть» какое-либо CSS-правило из списка правил для какого-нибудь селектора.
Удаление комментариев в HTML
<!--(.*?)-->
Если вам необходимо удалить все комментарии из блока HTML-кода, воспользуйтесь этим регулярным выражением. Чтобы получить желаемый результат, вы можете воспользоваться PHP-функцией preg_replace().
Проверка на соответствие ссылке на Facebook-аккаунт
/(?:http:\/\/)?(?:www\.)?facebook\.com\/(?:(?:\w)*#!\/)?(?:pages\/)?(?:[\w\-]*\/)*([\w\-]*)/
Если вам необходимо узнать у посетителя вашего сайта адрес его странички в Facebook, попробуйте это регулярное выражение. Оно поможет вам проверить правильность указанного пользователем URL. Этот код отлично подходит для проверки ссылок в этой соцсети.
Проверка версии Internet Explorer
^.*MSIE [5-8](?:\.[0-9]+)?(?!.*Trident\/[5-9]\.0).*$
Несмотря на то, что Microsoft выпустил новый браузер Edge, многие пользователи до сих пор пользуются Internet Explorer. Веб-разработчикам часто приходится проверять версию этого браузера, чтобы учитывать особенности разных версий при работе над своими проектами.
Вы можете использовать это регулярное выражения в JavaScript-коде чтобы узнать какая версия IE (5-11) используется.
«Вытягиваем» цену из строки
/(\$[0-9,]+(\.[0-9]{2})?)/
Цена какого-либо товара может быть указана в различных форматах: в ней могут встречаться запятые, знаки после запятой и символы валюты.
Указанное выше регулярное выражение учитывает различные форматы отображения цены, с его помощью вы сможете «вытянуть» цену из любой символьной строки.
Разбираем заголовки в e-mail
/\b[A-Z0-9._%+-]+@(?:[A-Z0-9-]+\.)+[A-Z]{2,6}\b/i
С помощью этого небольшого выражения вы сможете разобрать заголовок e-mail сообщения, чтобы извлечь оттуда список адресатов. Выражение может быть использовано и в случае, если адресатов несколько.
Вместо регулярных выражений, для разбора заголовков e-mail вы можете воспользуйтесь библиотекой на PHP.
Соответствие имени файла определенному типу
/^(.*\.(?!(htm|html|class|js)$))?[^.]*$/i
Если в вашем приложении существует возможность загрузки файлов на сервер, это регулярное выражение может помочь вам проверить файлы перед тем как посетитель их загрузит.
С помощью этого кода можно получить расширение загружаемого файла и проверить присутствует ли оно в списке разрешенных к загрузке.
Соответствие строки формату URL
/[-a-zA-Z0-9@:%_\+.~#?&//=]{2,256}\.[a-z]{2,4}\b(\/[-a-zA-Z0-9@:%_\+.~#?&//=]*)?/gi
Регулярное выражение может проверять URL-адреса с указанием протоколов HTTP и HTTPS на предмет соответствия синтаксису доменов TLD.
Существует простой способ проверки с использованием JavaScript RegExp.
Добавление атрибута rel=”nofollow” в теге ссылки
(<a\s*(?!.*\brel=)[^>]*)(href="/https?://)((?!(?:(?:www\.)?'.implode('|(?:www\.)?', $follow_list).'))[^"]+)"((?!.*\brel=)[^>]*)(?:[^>]*)>
Если вы много работаете с HTML-кодом, то вам захочется автоматизировать часто повторяющиеся действия. Регулярные выражения отлично подходят для решения этой задачи и сэкономят много вашего времени.
Используя приведенный код, например, совместно с PHP, вы сможете «вытянуть» код ссылок из блоков HTML-кода и добавить в каждую из них атрибут rel=”nofollow”.
Работа с media query
/@media([^{]+)\{([\s\S]+?})\s*}/g
Вы можете разбивать строки содержащие медиа-запросы на части, состоящие из параметров и свойств. Указанное выражение может быть полезно для анализа стороннего CSS-кода. Используя его вы сможете, например, более подробно понять как устроен чужой код.
Синтаксис поисковых выражений Google
/([+-]?(?:'.+?'|".+?"|[^+\- ]{1}[^ ]*))/g
Вы можете составить свои собственные регулярные выражения для манипулирования результатами поиска по вашим запросам в поисковой системе Google. Например, знак плюс (+) добавляет дополнительные ключевые слова, а минус (-) означает, что слова должны быть проигнорированы и удалены из результатов.
Это довольно сложное выражение, но если разобраться как использовать его должным образом, приведенный код может стать основой для построения собственного алгоритма поиска.
Заключение
Путь к пониманию регулярных выражений довольно труден, однако, если вы будете его придерживаться, результат вас не разочарует. Попробуйте использовать приведенные в статье регулярные выражения при создании своего веб-приложения. Таким образом вы сможете понять как работают выражения из примеров, приведенных в статье, в реальности.
Голосов: 483 | Просмотров: 15942
$
\ A
\ z
. | Любой одиночный символ |
\ с | Любой пробельный символ |
\ S | Любой непробельный символ |
\ d | Любая цифра |
\ D | Любое нецифровое |
\ w | Любой символ слова (буква, цифра, подчеркивание) |
\ Вт | Любой символ, не являющийся словом |
\ b | Любая граница слова |
(...) | Захватить все замкнутое |
(а | б) | а или б |
а? | Ноль или один из |
а * | Ноль или более |
а + | Один или несколько из |
а {3} | Ровно 3 из |
а {3,} | 3 или более из |
а {3,6} | Между 3 и 6 из |
.
Сопоставить элементы URL-адреса
Сопоставление элементов URL-адреса
Это регулярное выражение будет соответствовать элементам URL-адреса, включая протокол, поддомен, домен, путь, имя файла, параметры запроса и привязку.
Комментарии
Верхние регулярные выражения
Шпаргалка
Классы символов | |
---|---|
. | любой символ, кроме новой строки |
\ ш \ д \ с | слово, цифра, пробел |
\ W \ D \ S | не слово, цифра, пробел |
[abc] | любой из a, b или c |
[^ abc] | не a, b или c |
[а-г] | символ между a & g |
Анкеры | |
^ abc $ | начало / конец строки |
\ б | граница слова |
Экранированные символы | |
\.\ * \\ | экранированные специальные символы |
\ т \ п \ г | табуляция, перевод строки, возврат каретки |
\ u00A9 | Unicode сброшен © |
Группы и обзор | |
(abc) | группа захвата |
\ 1 | обратная ссылка на группу # 1 |
(?: Abc) | группа без захвата |
(? = Abc) | положительный взгляд вперед |
(?! Abc) | отрицательный прогноз вперед |
Квантификаторы и чередование | |
а * а + а? | 0 или более, 1 или более, 0 или 1 |
а {5} а {2,} | ровно пять, два или больше |
а {1,3} | между одним и тремя |
а +? а {2,}? | совпадений как можно меньше |
ab | cd | соответствует ab или cd |
.
Классы символов | |
---|---|
. | любой символ, кроме новой строки |
\ ш \ д \ с | слово, цифра, пробел |
\ W \ D \ S | не слово, цифра, пробел |
[abc] | любой из a, b или c |
[^ abc] | не a, b или c |
[а-г] | символ между a и g |
Анкеры | |
^ abc $ | начало / конец строки |
\ б | граница слова |
Экранированные символы | |
\.\ * \\ | экранированных специальных символов |
\ t \ n \ r | табуляция, перевод строки, возврат каретки |
\ u00A9 | Unicode сброшен © |
Группы и поиск | |
(abc) | группа захвата |
\ 1 | обратная ссылка на группу № 1 |
(?: Abc) | группа без захвата |
(? = Abc) | положительный прогноз |
(?! Abc) | негативный прогноз |
Квантификаторы и чередование | |
а * а + а? | 0 или более, 1 или более, 0 или 1 |
а {5} а {2,} | ровно пять, два или больше |
а {1,3} | между одним и тремя |
а +? а {2,}? | совпадений как можно меньше |
ab | cd | соответствует ab или cd |
.
Бесплатный онлайн-тестер регулярных выражений Java
Этот бесплатный тестер регулярных выражений Java позволяет проверять регулярные выражения на соответствие любой записи по вашему выбору и четко выделяет все совпадения. Он основан на классе Pattern Java 8.0.
За примерами обратитесь к документации по регулярным выражениям или к разделу решения общих проблем с использованием регулярных выражений на этой странице. Если вам нужны другие примеры или решения, свяжитесь со мной.
Регулярное выражение — Документация
Метасимволы
Персонаж | Что он делает? | |
---|---|---|
\ |
| |
$ | Соответствует концу ввода . В многострочном режиме он также соответствует перед символом разрыва строки , следовательно, каждым концом строки. | |
* | Соответствует предыдущему символу 0 или более раз . | |
+ | Соответствует предыдущему символу 1 или более раз . | |
? |
| |
. | Соответствует любому одиночному символу, кроме символа новой строки . | |
(х) | Соответствует ‘x’ и запоминает совпадение . Также известен как захватывающая скобка. | |
(?: X) | Соответствует ‘x’, но НЕ запоминает совпадение . Также известен как НЕ захватывающая скобка. | |
х (? = У) | Соответствует ‘x’ , только если за ‘x’ следует ‘y’ .Также известен как опережающий просмотр. | |
х (?! Y) | Соответствует ‘x’ , только если за ‘x’ НЕ следует ‘y’ . Также известен как отрицательный прогноз. | |
х | у | Соответствует ‘x’ OR ‘y’ . | |
{n} | Соответствует предыдущему символу ровно n раз . | |
{n, m} | Соответствует предыдущему символу не менее n раз и не более m раз.abc] | Соответствует всему, что НЕ заключено в скобки . Также известен как отрицательный набор символов. |
[\ b] | Соответствует пробелу . | |
\ б | Соответствует границе слова . Границы определяются, когда за символом слова НЕ следует или НЕ предшествует другой символ слова. | |
\ B | Соответствует границе БЕЗ слов .Границы определяются, когда два соседних символа являются символами слова ИЛИ символами, не являющимися словами. | |
\ cX | Соответствует управляющему символу . X должен быть от A до Z включительно. | |
\ д | Соответствует -значному символу . То же, что [0-9] или [0123456789]. | |
\ D | Соответствует НЕ-цифровому символу .0123456789]. | |
\ f | Соответствует подаче формы . | |
\ п | Соответствует переводу строки . | |
\ r | Соответствует возврату каретки . | |
\ с | Соответствует одиночному символу пробела . Это включает пробел, табуляцию, перевод страницы и перевод строки. | |
\ S | Соответствует чему-либо, кроме одиночного символа пробела . Все, что угодно, кроме пробела, табуляции, перевода страницы и перевода строки. | |
\ т | Соответствует вкладке . | |
\ в | Соответствует вертикальной табуляции . | |
\ w | Соответствует любому буквенно-цифровому символу, включая подчеркивание .A-Za-z0-9_]. | |
\ х | Обратная ссылка на подстроку, совпадающую с выражением в скобках x. x — целое положительное число. | |
\ 0 | Соответствует символу NULL . | |
\ ххх | Соответствует символу с двухзначным шестнадцатеричным кодом . | |
\ уххх | Соответствует символу с 4-значным шестнадцатеричным кодом . |
Регулярное выражение — решения общих проблем (рецепты)
Как я могу эмулировать DOTALL в JavaScript?
DOTALL — это флаг в самых последних библиотеках регулярных выражений, который делает расширение. метасимвол соответствует всему, ВКЛЮЧАЯ разрывы строк. JavaScript по умолчанию делает
не поддерживаю это с тех пор. метасимвол соответствует чему угодно, НО разрывы строк. Чтобы подражать такому поведению, просто заменяет все. метасимволы
автор [\ S \ s].Это означает соответствие всему, что является одиночным символом пробела ИЛИ всем, что не является символом пробела!
[\ S \ s]
Как проверить адрес EMAIL с помощью регулярного выражения?
Не существует 100% надежного решения, поскольку RFC слишком сложен. Это лучшее решение, которое должно работать в 99% случаев. Проконсультируйтесь на этой странице
подробнее об этой проблеме. Всегда отключайте чувствительность к регистру!
^ [- a-z0-9 ~! $% ^ & * _ = +} {\ '?] + (\.& * _ = +} {\ '?] +) * @ ([a-z0-9 _] [- a-z0-9 _] * (\. [- a-z0-9 _] +) * \. (aero | arpa | biz | com | coop | edu | gov | info | int | mil | museum | name | net | org | pro | travel | mobi | [az] [az]) | ([0-9] {1, 3} \. [0-9] {1,3} \. [0-9] {1,3} \. [0-9] {1,3})) (: [0-9] {1, 5})? $
Как проверить IP-адрес (IPV4) с помощью регулярного выражения?
Это гарантирует, что каждое число в IP-адресе находится в диапазоне от 0 до 255, в отличие от версии, использующей \ d {1,3}, которая допускает 999.999.999.999.
Если вы хотите сопоставить IP-адрес в строке, избавьтесь от начальных ^ и конечных $, чтобы вместо этого использовать \ b (границы слов).(? 🙁 ?: 25 [0-5] | 2 [0-4] [0-9] | [01]? [0-9] [0-9]?) \.) {3} (?: 25 [0-5] | 2 [0-4] [0-9] | [01]? [0-9] [0-9]?) $
Как проверить дату с помощью регулярного выражения?
Никогда не используйте регулярное выражение для проверки даты. Регулярное выражение полезно только для проверки формата даты, введенного пользователем. Для фактической даты действия,
вам следует полагаться на другой язык.
Следующие выражения будут проверять количество дней в месяце, но НЕ будут обрабатывать проверку високосного года; следовательно, в феврале может быть 29 дней в году, но не более.[ABCEGHJKLMNPRSTVXY] {1} \ d {1} [A – Z] {1} * \ d {1} [A – Z] {1} \ d {1} $
Как извлечь имя файла в пути Windows с помощью регулярного выражения?
Поскольку каждая часть пути разделена символом \, нам нужно найти только последнюю. Обратите внимание, что просто нет
способ проверить, является ли последняя часть пути файлом или каталогом, только по имени. Вы можете попытаться сопоставить
расширение, но файл не обязательно должен иметь расширение.\\] + $
Как проверить номер телефона в США или Канаде с помощью регулярного выражения?
Вероятно, существует множество способов отформатировать номер телефона. Ваш пользовательский интерфейс должен решить проблему форматирования
имея четкую документацию по формату и / или разделив телефон на части (область, телефонная линия, номер) и / или имея маску ввода.
Следующее выражение довольно мягко относится к формату и должно принимать 999-999-9999, 9999999999, (999) 999-9999.(?: 2131 | 1800 | 35 \ d {3}) \ d {11} $
Как удалить все теги HTML из строки?
Убедитесь, что вы находитесь в глобальном режиме (флаг g), регистр регистр не учитывается и опция точка все включена. Это регулярное выражение будет соответствовать всем тегам HTML.
и их атрибуты. Это оставит содержимое тегов внутри строки.
Как удалить все пустые строки из строки с помощью регулярного выражения?
Убедитесь, что вы находитесь в глобальном и многострочном режиме.\ s * \ r? \ n
.