Регулярное выражение для получения ссылок из plain-текста | OTUS
🔥 Начинаем BLACK FRIDAY!
Максимальная скидка -25% на всё. Успейте начать обучение по самой выгодной цене.
Выбрать курс

Курсы

Программирование
iOS Developer. Basic
-25%
Python Developer. Professional
-25%
Разработчик на Spring Framework
-25%
Golang Developer. Professional
-25%
Python Developer. Basic
-25%
iOS Developer. Professional
-25%
Highload Architect
-25%
JavaScript Developer. Basic
-25%
Kotlin Backend Developer
-25%
JavaScript Developer. Professional
-25%
Android Developer. Basic
-25%
Unity Game Developer. Basic
-25%
Разработчик C#
-25%
Программист С Web-разработчик на Python Алгоритмы и структуры данных Framework Laravel PostgreSQL Reverse-Engineering. Professional CI/CD Vue.js разработчик VOIP инженер Программист 1С Flutter Mobile Developer Супер - интенсив по Kubernetes Symfony Framework Advanced Fullstack JavaScript developer Супер-интенсив "Azure для разработчиков"
Инфраструктура
Мониторинг и логирование: Zabbix, Prometheus, ELK
-25%
DevOps практики и инструменты
-25%
Архитектор сетей
-25%
Инфраструктурная платформа на основе Kubernetes
-25%
Супер-интенсив «ELK»
-16%
Супер-интенсив «IaC Ansible»
-16%
Супер-интенсив "SQL для анализа данных"
-16%
Базы данных Сетевой инженер AWS для разработчиков Cloud Solution Architecture Разработчик голосовых ассистентов и чат-ботов Внедрение и работа в DevSecOps Администратор Linux. Виртуализация и кластеризация Нереляционные базы данных Супер-практикум по использованию и настройке GIT IoT-разработчик Супер-интенсив «СУБД в высоконагруженных системах»
Специализации Курсы в разработке Подготовительные курсы
+7 499 938-92-02

Регулярное выражение для получения ссылок из plain-текста

Сегодня я хочу затронуть такую мозголомную тему, как регулярные выражения. Очень много статей написано по поводу того, как же вытащить любую ссылку из HTML, однако для обычного текста, где ссылка встречается в виде as is, примеров очень мало.

Приведу рабочее выражение для поставленной задачи.

Пусть нам надо вытащить из обычного текста ссылки на изображения. Итак: 1. Маркером вхождения будет объявление протокола: http, https, ftp или ftps ((http|https|ftp|ftps)). 2. После у нас идут два слеша, которые мы оставляем статично, не забыв их проэкранировать. 3. Далее, мы должны описать само тело ссылки: ([a-zA-Z0-9-.\/_]+). 4. И теперь у нас идет возможное расширение: ((jpg|png|gif|bmp|jpeg)).

В общем и целом регулярное выражение будет выглядеть вот так:

/(http|https|ftp|ftps)\:\/\/[a-zA-Z0-9\-\.\/\_]+(jpg|png|gif|bmp|jpeg)?/

Теперь интегрируем его в PHP

$out = array();
preg_match_all("/(http|https|ftp|ftps)\:\/\/[a-zA-Z0-9\-\.\/\_]+(jpg|png|gif|bmp|jpeg)?/", $rowsrc, $out, PREG_SET_ORDER);

В итоге в массиве $out будут находиться все совпадения, которые обнаружила функция поиска по регулярным выражениям preg_match_all().

За сим всё!

Безошибочного Вам кода!

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
🎁 Максимальная скидка!
Черная пятница уже в OTUS! Скидка -25% на всё!