Регулярное выражение для получения ссылок из plain-текста | OTUS
⚡ Подписка на курсы OTUS!
Интенсивная прокачка навыков для IT-специалистов!
Подробнее

Курсы

Программирование
Разработчик на Spring Framework
-5%
iOS Developer. Professional
-8%
Golang Developer. Professional
-6%
Базы данных
-12%
Agile Project Manager
-5%
C# ASP.NET Core разработчик
-6%
Android Developer. Basic
-10%
React.js Developer
-4%
MS SQL Server Developer
-8%
Scala-разработчик
-8%
Java Developer. Basic
-8%
Алгоритмы и структуры данных
-9%
Разработчик IoT
-13%
PostgreSQL
-8%
Подготовка к сертификации Oracle Java Programmer (OCAJP) Python Developer. Professional Разработчик программных роботов (RPA) на базе UiPath и PIX Unity Game Developer. Basic Разработчик голосовых ассистентов и чат-ботов Node.js Developer Интенсив «Оптимизация в Java» Супер - интенсив по паттернам проектирования Супер - интенсив по Kubernetes iOS Developer. Basic Супер-интенсив «СУБД в высоконагруженных системах» Супер-интенсив "Tarantool"
Инфраструктура
DevOps практики и инструменты
-12%
Базы данных
-12%
Network engineer. Basic
-10%
Network engineer
-4%
Инфраструктурная платформа на основе Kubernetes
-6%
Экспресс-курс по управлению миграциями (DBVC)
-10%
Мониторинг и логирование: Zabbix, Prometheus, ELK
-10%
Administrator Linux. Professional
-6%
Разработчик IoT
-13%
Основы Windows Server Cloud Solution Architecture Разработчик голосовых ассистентов и чат-ботов VOIP инженер Супер-практикум по работе с протоколом BGP NoSQL Супер-практикум по использованию и настройке GIT Супер-интенсив «СУБД в высоконагруженных системах» Экспресс-курс «IaC Ansible»
Специализации Курсы в разработке Подготовительные курсы
+7 499 938-92-02

Регулярное выражение для получения ссылок из plain-текста

Сегодня я хочу затронуть такую мозголомную тему, как регулярные выражения. Очень много статей написано по поводу того, как же вытащить любую ссылку из HTML, однако для обычного текста, где ссылка встречается в виде as is, примеров очень мало.

Приведу рабочее выражение для поставленной задачи.

Пусть нам надо вытащить из обычного текста ссылки на изображения. Итак: 1. Маркером вхождения будет объявление протокола: http, https, ftp или ftps ((http|https|ftp|ftps)). 2. После у нас идут два слеша, которые мы оставляем статично, не забыв их проэкранировать. 3. Далее, мы должны описать само тело ссылки: ([a-zA-Z0-9-.\/_]+). 4. И теперь у нас идет возможное расширение: ((jpg|png|gif|bmp|jpeg)).

В общем и целом регулярное выражение будет выглядеть вот так:

/(http|https|ftp|ftps)\:\/\/[a-zA-Z0-9\-\.\/\_]+(jpg|png|gif|bmp|jpeg)?/

Теперь интегрируем его в PHP

$out = array();
preg_match_all("/(http|https|ftp|ftps)\:\/\/[a-zA-Z0-9\-\.\/\_]+(jpg|png|gif|bmp|jpeg)?/", $rowsrc, $out, PREG_SET_ORDER);

В итоге в массиве $out будут находиться все совпадения, которые обнаружила функция поиска по регулярным выражениям preg_match_all().

За сим всё!

Безошибочного Вам кода!

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться