Jak wyciągnąć adresy e-mail i numery telefonów z tekstu

Masz długi tekst – artykuł, CV, bazę klientów, treść e-maila – i musisz wyciągnąć z niego wszystkie adresy e-mail lub numery telefonów? Ręczne przeszukiwanie zajmuje czas i łatwo o przeoczenie. Narzędzie do wyciągania danych kontaktowych zrobi to w ułamku sekundy, korzystając z wyrażeń regularnych.

Kiedy potrzebujesz wyodrębniać dane kontaktowe z tekstu

Wyciąganie e-maili, telefonów i adresów URL z tekstu to zadanie, które pojawia się zaskakująco często:

  • Marketing i sprzedaż: zebranie adresów e-mail z bazy danych eksportowanej do pliku tekstowego
  • HR i rekrutacja: wyciągnięcie danych kontaktowych z wielu nadesłanych CV jednocześnie
  • Obsługa klienta: wyodrębnienie numerów telefonów z formularzy zgłoszeniowych lub komentarzy
  • Web scraping: zebranie adresów URL z pobranej zawartości strony
  • Analiza dokumentów: przeszukiwanie umów lub raportów w poszukiwaniu danych kontaktowych
  • Czyszczenie danych: znalezienie i weryfikacja wszystkich adresów e-mail w dużym zbiorze danych

Jak działają wyrażenia regularne w wyszukiwaniu danych

Za wyciąganiem danych kontaktowych z tekstu stoją wyrażenia regularne (ang. regular expressions, w skrócie regex). To język opisu wzorców tekstowych, który pozwala wyszukać "cokolwiek co wygląda jak adres e-mail" zamiast szukać konkretnego adresu.

Uproszczony wzorzec na adres e-mail:
[znaki]@[znaki].[domena]

Uproszczony wzorzec na numer telefonu (polski):
[3 cyfry]-[3 cyfry]-[3 cyfry] lub +48 [9 cyfr]

W praktyce wzorce są bardziej złożone – muszą obsłużyć myślniki, spacje, nawiasy i różne formaty zapisu. Dlatego gotowe narzędzie online jest wygodniejsze niż pisanie własnego kodu.

Wyciąganie adresów e-mail

Adres e-mail ma charakterystyczny format: lokalna-część@domena.tld. Narzędzie szuka w tekście wszystkich ciągów pasujących do tego wzorca, niezależnie od tego gdzie się znajdują – w środku akapitu, w tabeli czy w stopce dokumentu.

Tekst wejściowy:
"Skontaktuj się z nami: kontakt@firma.pl lub wysyłaj oferty na oferty@firma.com. Dział techniczny: it-support@firma.pl"

Wyodrębnione e-maile:
kontakt@firma.pl
oferty@firma.com
it-support@firma.pl

Warto pamiętać, że narzędzie wyodrębni każdy ciąg pasujący do wzorca e-mail – w tym adresy testowe czy zanonimizowane. Wyniki warto przejrzeć po wyodrębnieniu.

Wyciąganie numerów telefonów

Numery telefonów są trudniejsze do wyciągania, bo mają wiele formatów zapisu. Ten sam numer można zapisać na dziesiątki sposobów:

Ten sam numer w różnych formatach:
+48 123 456 789
+48123456789
123-456-789
123 456 789
(123) 456 789
0048 123 456 789

Dobre narzędzie obsługuje wszystkie popularne formaty – polskie numery 9-cyfrowe, numery z prefiksem krajowym +48 oraz numery zagraniczne z różnymi kodami krajów.

Wyciąganie adresów URL

Adresy internetowe w tekście można wyciągać zarówno w formacie pełnym (z https://) jak i skróconym (zaczynającym się od www.). Narzędzie wykrywa obie formy, co jest przydatne przy analizie treści kopiowanych z różnych źródeł.

Wyodrębnione adresy URL z tekstu:
https://www.przykład.pl/strona
http://blog.firma.com/artykul
www.skryptyonline.pl

Wyciąganie adresów IP

Narzędzie obsługuje też wyciąganie adresów IPv4 (w formacie czterech liczb oddzielonych kropkami, np. 192.168.1.1). Przydatne przy analizie logów serwerowych, raportów bezpieczeństwa czy plików konfiguracyjnych.

Praktyczne zastosowania w pracy biurowej

Wyodrębnianie danych kontaktowych z tekstu to jedno z tych zadań, które można zlecić narzędziu i zaoszczędzić godziny pracy. Kilka konkretnych scenariuszy:

  • Eksportujesz listę kontaktów z CRM-u do pliku CSV – ale e-maile są pomieszane z innymi danymi. Wklejasz tekst, klikasz "Szukaj e-maili", dostajesz czystą listę.
  • Dostajesz 50 CV w PDF, konwertujesz je do tekstu – i wyciągasz wszystkie numery telefonów jednym kliknięciem.
  • Analizujesz komentarze klientów w poszukiwaniu osób, które podały dane kontaktowe.
RODO i prywatność: Pamiętaj, że zbieranie i przetwarzanie danych kontaktowych podlega przepisom o ochronie danych osobowych. Wyciąganie e-maili i telefonów jest zgodne z prawem tylko gdy masz podstawę prawną do przetwarzania tych danych.

Chcesz wyciągnąć e-maile, telefony lub URL-e z tekstu jednym kliknięciem?

Otwórz narzędzie do wyciągania danych kontaktowych →

Podsumowanie

Wyciąganie adresów e-mail, numerów telefonów i URL-i z tekstu to zadanie, które pojawia się w marketingu, HR, obsłudze klienta i analizie danych. Ręczne przeszukiwanie jest czasochłonne i błędogenne – narzędzie online korzystające z wyrażeń regularnych wyodrębnia wszystkie dane kontaktowe w sekundy. Wystarczy wkleić tekst i wybrać jakie dane chcesz znaleźć: adresy e-mail, numery telefonów (polskie i zagraniczne), adresy URL lub adresy IP.