Jak przeszukiwać dokumenty z pomocą wyrażeń regularnych i Pythona3 – cz. 2.

W ostatnim wpisie opisane zostały różne możliwości wyszukiwania konkretnych znaków, grup znaków, powtarzanych jednokrotnie lub wielokrotnie. Dziś dwa proste przykłady konkretnego użycia wyrażeń regularnych w Pythonie 3.

Przede wszystkim aby skorzystać z wyrażeń regularnych w Pythonie musimy zaimportować moduł 're’
import re

Załóżmy, że chcemy znaleźć słowo 'kot’ w naszym dokumencie. Możemy to zrobić w następujący sposób


wersja1

import re

znalezione1 = re.search(’kot’, 'Wlazł kotek na płotek’)

print(znalezione1.group())
print(znalezione1.start())
print(znalezione1.end())
print(znalezione1.span())


wersja2

import re

wzorzec = 'kot’
do_znalezienia = re.compile(wzorzec)

do_przeszukania = 'Wlazł kotek na płotek’

znalezione1 = do_znalezienia.search(do_przeszukania)

print(znalezione1.group())
print(znalezione1.start())
print(znalezione1.end())
print(znalezione1.span())


Powyższe programy wypiszą nam czy znalezione zostanie dane wyrażenie, gdzie się ono zaczyna, gdzie się kończy i ile znaków zajmuje. Oba programy mają ten sam efekt. Różnica pomiędzy nimi polega na tym, że w drugim przypadku zarówno

W kolejnym wpisie bardziej praktyczne wyszukiwanie numeru telefonu w dokumencie.