Jak wyciągnąć adresy e-mail i numery telefonów z tekstu
Masz długi tekst – artykuł, CV, bazę klientów, treść e-maila – i musisz wyciągnąć z niego wszystkie adresy e-mail lub numery telefonów? Ręczne przeszukiwanie zajmuje czas i łatwo o przeoczenie. Narzędzie do wyciągania danych kontaktowych zrobi to w ułamku sekundy, korzystając z wyrażeń regularnych.
Kiedy potrzebujesz wyodrębniać dane kontaktowe z tekstu
Wyciąganie e-maili, telefonów i adresów URL z tekstu to zadanie, które pojawia się zaskakująco często:
- Marketing i sprzedaż: zebranie adresów e-mail z bazy danych eksportowanej do pliku tekstowego
- HR i rekrutacja: wyciągnięcie danych kontaktowych z wielu nadesłanych CV jednocześnie
- Obsługa klienta: wyodrębnienie numerów telefonów z formularzy zgłoszeniowych lub komentarzy
- Web scraping: zebranie adresów URL z pobranej zawartości strony
- Analiza dokumentów: przeszukiwanie umów lub raportów w poszukiwaniu danych kontaktowych
- Czyszczenie danych: znalezienie i weryfikacja wszystkich adresów e-mail w dużym zbiorze danych
Jak działają wyrażenia regularne w wyszukiwaniu danych
Za wyciąganiem danych kontaktowych z tekstu stoją wyrażenia regularne (ang. regular expressions, w skrócie regex). To język opisu wzorców tekstowych, który pozwala wyszukać "cokolwiek co wygląda jak adres e-mail" zamiast szukać konkretnego adresu.
[znaki]@[znaki].[domena]
Uproszczony wzorzec na numer telefonu (polski):
[3 cyfry]-[3 cyfry]-[3 cyfry] lub +48 [9 cyfr]
W praktyce wzorce są bardziej złożone – muszą obsłużyć myślniki, spacje, nawiasy i różne formaty zapisu. Dlatego gotowe narzędzie online jest wygodniejsze niż pisanie własnego kodu.
Wyciąganie adresów e-mail
Adres e-mail ma charakterystyczny format: lokalna-część@domena.tld. Narzędzie szuka w tekście wszystkich ciągów pasujących do tego wzorca, niezależnie od tego gdzie się znajdują – w środku akapitu, w tabeli czy w stopce dokumentu.
"Skontaktuj się z nami: kontakt@firma.pl lub wysyłaj oferty na oferty@firma.com. Dział techniczny: it-support@firma.pl"
Wyodrębnione e-maile:
kontakt@firma.pl
oferty@firma.com
it-support@firma.pl
Warto pamiętać, że narzędzie wyodrębni każdy ciąg pasujący do wzorca e-mail – w tym adresy testowe czy zanonimizowane. Wyniki warto przejrzeć po wyodrębnieniu.
Wyciąganie numerów telefonów
Numery telefonów są trudniejsze do wyciągania, bo mają wiele formatów zapisu. Ten sam numer można zapisać na dziesiątki sposobów:
+48 123 456 789
+48123456789
123-456-789
123 456 789
(123) 456 789
0048 123 456 789
Dobre narzędzie obsługuje wszystkie popularne formaty – polskie numery 9-cyfrowe, numery z prefiksem krajowym +48 oraz numery zagraniczne z różnymi kodami krajów.
Wyciąganie adresów URL
Adresy internetowe w tekście można wyciągać zarówno w formacie pełnym (z https://) jak i skróconym (zaczynającym się od www.). Narzędzie wykrywa obie formy, co jest przydatne przy analizie treści kopiowanych z różnych źródeł.
https://www.przykład.pl/strona
http://blog.firma.com/artykul
www.skryptyonline.pl
Wyciąganie adresów IP
Narzędzie obsługuje też wyciąganie adresów IPv4 (w formacie czterech liczb oddzielonych kropkami, np. 192.168.1.1). Przydatne przy analizie logów serwerowych, raportów bezpieczeństwa czy plików konfiguracyjnych.
Praktyczne zastosowania w pracy biurowej
Wyodrębnianie danych kontaktowych z tekstu to jedno z tych zadań, które można zlecić narzędziu i zaoszczędzić godziny pracy. Kilka konkretnych scenariuszy:
- Eksportujesz listę kontaktów z CRM-u do pliku CSV – ale e-maile są pomieszane z innymi danymi. Wklejasz tekst, klikasz "Szukaj e-maili", dostajesz czystą listę.
- Dostajesz 50 CV w PDF, konwertujesz je do tekstu – i wyciągasz wszystkie numery telefonów jednym kliknięciem.
- Analizujesz komentarze klientów w poszukiwaniu osób, które podały dane kontaktowe.
Chcesz wyciągnąć e-maile, telefony lub URL-e z tekstu jednym kliknięciem?
Otwórz narzędzie do wyciągania danych kontaktowych →Podsumowanie
Wyciąganie adresów e-mail, numerów telefonów i URL-i z tekstu to zadanie, które pojawia się w marketingu, HR, obsłudze klienta i analizie danych. Ręczne przeszukiwanie jest czasochłonne i błędogenne – narzędzie online korzystające z wyrażeń regularnych wyodrębnia wszystkie dane kontaktowe w sekundy. Wystarczy wkleić tekst i wybrać jakie dane chcesz znaleźć: adresy e-mail, numery telefonów (polskie i zagraniczne), adresy URL lub adresy IP.