22 299 53 69 biuro@jsystems.pl
Sprawdź 👉 GWARANTOWANE TERMINY SZKOLEŃ 👈 na rok 2026!


Scrapy: web scraping

by:
Czas trwania 3 dni

Najbliższe terminy tego szkolenia

Cena szkolenia 2400 PLN (netto)

Standardy JSystems

  1. Wszyscy nasi trenerzy muszą być praktykami i osiągać średnią z ankiet minimum 4.75 na 5. Nie ma wśród nas trenerów-teoretyków. Każdy trener JSystems ma bogate doświadczenie komercyjne w zakresie tematów z których prowadzi szkolenia.
  2. Wszystkie szkolenia mają format warszatowy. Każde zagadnienie teoretyczne jest poparte rzędem warsztatów w ściśle określonym formacie.
  3. Terminy gwarantowane na 100%. Jeśli jakiś termin jest oznaczony jako gwarantowany, oznacza to że odbędzie się nawet jeśli część grupy wycofa się z udziału. Ryzyko ponosimy my jako organizator.
  4. Do każdego szkolenia które wymaga jakiegokolwiek oprogramowania dostarczamy skonfigurowane, gotowe hosty w chmurze. Dzięki temu uczestnik nie musi nic instalować na swoim komputerze (i bić się z blokadami korporacyjnymi). Połączenie następuje przez zdalny pulpit lub SSH - w zależności od szkolenia.
Zapisz się
Program szkolenia
  1. Czym jest webscraping?
    • O Robots.txt
    • User-agent
    • Jak serwery rozpoznają boty?
    • Etyka
    • Ogólnie panujące zasady
    • Przykłady platform korzystających z webscrapingu
  2. Jak działa protokół HTTP?
    • Struktura HTML
    • Kody HTTP zwracane przez serwery
    • Nagłówki zwracane przez HTTP
    • Rodzaje typów zawartości zwracanych przez serwery http
  3. Najbardziej popularne narzędzia
    • Selenium
    • Requests
    • BeautifulSoup
    • Scrapy
  4. Użycie klasy scrapy.Spider
    • Konfiguracja bota - start_urls, custom_settings, allowed_domains
    • Jak generować listę URL do odwiedzenie
    • Metody klasy scrapy.Spider - jak używać
    • Definiowanie klas pobieranych danych
  5. Jak parsować XML/HTML
    • Wyszukiwanie elementów HTML po atrybutach
    • Xpath
  6. Przydatne narzędzia
    • Regexp101
    • Xpath helper
  7. Jak parsować JSON
    • Biblioteka json
  8. Jak parsować tekst - o wyrażeniach regularnych
    • Biblioteka re
    • Flagi w wyrażeniach regularnych
  9. Jak pobierać obrazy i inne typy plików
    • Zapisywanie wartości plików binarnych z użyciem biblioteki io
  10. Definiowanie klas pobieranych rekordów - scrapy.Item
    • Walidacja pobieranych rekordów
    • Standaryzacja pobieranych rekordów
    • Przetwarzanie pobieranych rekordów
  11. Łaćuchy wywołań metod
    • Czym jest callback? Jak działa?
    • Przekazywanie wartości pomiędzy zapytaniami
  12. Scrapowanie strony na przykładzie:
    • Pobieranie danych z użyciem xpath oraz regex
    • Łańcuchy zapytań
    • Warunkowe przerwanie scrapingu
  13. Zaawansowany scraping
    • Cookies
    • Formularze
    • Prosy
    • Inne przeszkody wymagające
    • Użycie scrape shell
  14. Web crawling
    • Crawling całych domen
    • Podążanie za znalezionymi linkami wewnątrz domeny
    • Filtrowanie znalezionych linków
  15. Problemy:
    • Javascript
  16. Obsługiwanie wyjątków
    • Captcha, bany, limity
  17. Uruchamianie scrapy na platformie zyte.com
    • Deployment za pomocą CLI
    • Deployment za pomocą klienta web
    • Scrapowanie za pomocą Cron
    • Statystyki
  18. Zapisywanie rezultatów scrapingu na przykładzie AWS S3 i lokalnie
    • Zapisywanie rezultatów z użyciem Item Pipeline w Scrapy

Opis szkolenia

Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!

O skoleniu w skrócie

Warsztatowe szkolenie z webscrapingu prowadzone przez trenera z komercyjnym doświadczeniem w tej dziedzinie.

Dla kogo?

Aby uczestniczyć w tym szkoleniu potrzebna jest podstawowa wiedza z programowania w języku Python - jak definiować klasy, pisać funkcje i uruchamiać skrypty w języku Python.

Charakter szkolenia

Szkolenie ma charakter warsztatowy. W trakcie szkolenia uczestnicy otrzymają praktyczną wiedzę na temat webscrapingu. Każde omówione zagadnienie podsumowane jest kilkoma następującymi po sobie ćwiczeniami o wzrastającym poziomie trudności. W ramach szkolenia napisane będą programy w języku Python pozwalające na cykliczne pobieranie danych z 5 stron.

Przebieg szkolenia

  1. Zajęcia rozpoczynamy omówieniem webscrapingu - jakie daje nam możliwości, jak przebiega.
  2. Zajęcia praktyczne rozpoczynamy instalacją i konfiguracją interpretera języka Python oraz IDE - Visual studio code. Uczestnicy szkolenia mogą pracować na dowolnym innym znanym sobie IDE.
  3. Po poznaniu podstaw zajmiemy się budową scrapera pobierającego listę aktualnie popularnych książek z przygotowanej strony.
  4. W kolejnym kroku pobierać będziemy dane umieszczone na powiązanych stronach takich jak podstrona zawierające szczegóły o książce czy zdjęcia.
  5. Poznamy bliżej narzędzia w przeglądarce Firefox umożliwiające sprawne pobieranie danych z witryn, rozpoznanie najlepszej metody pobierania danych i sprawdzania poprawności Xpath.
  6. Pobierzemy dane z kilku popularnych portali za pomocą różnych metod - poprzez API, HTML, RSS.
  7. Dowiemy się jak sprawnie przetwarzać dane po pobraniu ich, jak walidować, przetwarzać i zapisywać dane cyklicznie uruchamianych scraperów.
  8. Wdrożymy stworzone programy na platformę Zyte i dowiemy się jak korzystać z platformy by zarządzać scraperami.


Prowadzący szkolenie:
Łukasz Jaworowski



Zawodowo programista od 8 lat. Typowy praktyk lubiący rozwiązywanie problemów biznesowych od koncepcji do gotowego programu. Skupiony na technologiach backendowych. Zaczynał od Javy, większość czasu w pracy spędził programując systemy przetwarzania danych oraz aplikacji webowych z użyciem języka Python i AWS. Od 2021 roku pracuje jako lider techniczny w projektach Golang w firmie z obszaru security/crypto. Doświadczenie zdobywał w startupach, Fintechach, bankach oraz realizując projekty jako freelancer. W wolnym czasie poza programowaniem lubi sport i inne formy rywalizacji.


Środowisko robocze


Nie jest wymagane instalowanie żadnego oprogramowania przez Uczestnika. Dostęp do gotowego środowiska na potrzeby tego szkolenia jest zapewniany każdemu Uczestnikowi przez organizatora.
Terminy gwarantowane

Gdy na jakiś termin zgłosi się minimalna liczba osób, termin oznaczamy jako gwarantowany.

Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to, że na 100% się odbędzie we wskazanym czasie i miejscu.

Nawet gdyby część takiej grupy zrezygnowała lub przeniosła się na inny termin, raz ustalony termin gwarantowany takim pozostaje. Ewentualne ryzyko ponosimy my jako organizator.

Przejdź do terminów tego szkolenia

Szkolenia online Szkolenia online odbywają się na żywo z udziałem trenera. Uczestniczy łączą się na szkolenie za pomocą platfomy ZOOM (nie trzeba instalować, można połączyć się również przez przeglądarkę). Informacje organizacyjne Uczestnicy otrzymują na 7 dni przed datą rozpoczęcia szkolenia.
Nadal poszukujesz czegoś innego?

Sprawdź pozostałe szkolenia z kategorii:

Python Zobacz

Sprawdź, co mówią o nas ci, którzy nam zaufali

  • 5.0/5

    Programowanie w języku Python - podstawy

    13-12-2025 Bardzo polecam Jakub Tomaszewski, Towarzystwo Ubezpieczeń i Reasekuracji Warta S.A.
  • 5.0/5

    Uczenie maszynowe w Pythonie

    27-11-2025 Polecam szkolenia z JSystems - profesjonalne podejcie do tematu, dobra organizacja szkolenia Marta Kiszka, Ornsson Solutions Sp. z o.o.
  • 5.0/5

    Przetwarzanie danych w Apache Spark za pomocą PySpark i Spark SQL

    26-11-2025 Szkolenie bardzo profesjonalne z bardzo dużą ilością praktyki. Prowadzący bardzo dobrze przygotowany, szczerze polecam :) Adam Górski, BEST S.A.
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    15-11-2025 Szkolenie doskonale porządkuje posiadaną wiedzę i znacznie rozszerza znajomośc języka Python. Emil Kobyliński, OSOBA PRYWATNA
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    15-11-2025 Polecam, pomoże usystematyzować wiedzę, jak i dowiedzieć się nowych rzeczy. Dużo przykładów live jak i samodzielnych zadań do wykonania. Instruktor zawsze pomoże w rozwiązaniu problemu, jeśli taki wystąpi. Cezary Niebudek, Bacteromic Sp. z o.o.
  • 4.9/5

    Programowanie w języku Python - poziom średnio zaawansowany

    15-11-2025 Polecam wszystkim którzy zaczynają przygodę z pythonem jak i dla osób którzy chcą uporządkować swoją wiedze. Przemysław Romaszewski, PZU SA/PZU ŻYCIE SA
  • 5.0/5

    Python od podstaw, przez analizę danych, do machine learning

    08-11-2025 Świetne, kompleksowe szkolenie. Olga Siedlecka-Lamch, Politechnika Częstochowska
  • 5.0/5

    Python od podstaw, przez analizę danych, do machine learning

    08-11-2025 Rzeczywiście - (0:Hero:HugeStep) Krzysztof Kozłowski, Narodowy Bank Polski
  • 5.0/5

    Python od podstaw, przez analizę danych, do machine learning

    08-11-2025 Bardzo intensywne, ale wartościowe szkolenie. Polecam Elżbieta Gawrońska, Politechnika Częstochowska
  • 5.0/5

    Programowanie w języku Python - podstawy

    25-10-2025 Mega polecam kursy Jsystems - to miejsce tworzą ludzie, dziękuje Kacprze - ŚWIETNE I WARTOŚCIOWE SZKOLENIE!!! -- Python nie taki straszny :) Miłosz Mogielski, Ornsson Solutions Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - podstawy

    25-10-2025 Świetne szkolenie w przystępnej cenie, dużo zajęć praktycznych a nie tylko sucha teoria. Piotr Gąska, Santander Factoring Sp. z o.o.
  • 5.0/5

    Analiza danych w języku Python

    18-09-2025 jest ok, dla usystematyzowania wiedzy jak i dla osoby dopiero zaczynającej analizę danych Tomasz Jeżyk, EduBroker Sp. z o.o.
  • 4.9/5

    Python od podstaw, przez analizę danych, do machine learning

    02-08-2025 Szczerze polecam. Mateusz posiada ogromna wiedze i umie ja efektywnie przekazac. Magda Trzaska, WavEC Offshore Renewables - CENTRO DE ENERGIA OFFS
  • 5.0/5

    Python od podstaw, przez analizę danych, do machine learning

    02-08-2025 Polecam szkolenie ze względu na bardzo przydatne treści, doskonale przygotowane materiały treningowe i dydaktyczne. Jest to olbrzymia ilość wiedzy Pythonowej przekazanej w zwięzły, konkretny i zrozumiały sposób. Agnieszka Rusiecka, Uniwersytet Medyczny im. Piastów Śląskich we Wrocławiu
  • 4.9/5

    Uczenie maszynowe w Pythonie

    26-06-2025 Kompleksowy przegląd wiedzy z zakresu ML- zarówno teoretycznej, jak i praktycznej. Sprawne poruszanie się po tematach, omówienie jak największej ilości zagadnień, dających solidne podstawy do dalszego zgłębiania wiedzy. Polecam szkolenie z Mateuszem Zimochem :) Marcin Berezowski, Polskie Sieci Elektroenergetyczne Spółka Akcyjna
  • 5.0/5

    Analiza danych w języku Python

    12-06-2025 Bardzo dziękuje za szkolenie, zdobyta wiedza pozwoli mi pogłebić moją wiedzę z zakresu Pythona i analizy danych Rafał Grzelczak, EduBroker Sp. z o.o.
  • 5.0/5

    Analiza danych w języku Python

    12-06-2025 Materiału dużo, trener dostosowuje się z materiałem do Naszych postepów, tłumaczy Radosław Damazer, EduBroker Sp. z o.o.
  • 5.0/5

    Analiza danych w języku Python

    27-03-2025 Warto skorzystać z tego szkolenia. Dużo ciekawych informacji, podanych w przystępny sposób. Miła atmosfera, kompetentny i sympatyczny trener. Aleksandra Brzezińska, Credit Agricole Bank Polska S.A
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    20-03-2025 Bardzo fajne szkolenie, szczególnie dla osób, które już trochę programowały w pythonie albo znają już inny język programowania i chcą zobaczyć, jakie możliwości ma Python i jak w nim działać :) Anna Rokicka, Silky Coders Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - podstawy

    01-03-2025 Bardzo polecam, ogrom zdobytej wiedzy oraz wskazówek od prowadzącego Konrad Kowalski, EduBroker Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - podstawy

    14-12-2024 Bardzo merytoryczne szkolenie, dużo wiedzy, dużo zadań które pomagają w jej przyswojeniu i sprawdzeniu. Sławomir Kołbuk, Wiedza i Praktyka sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    05-12-2024 Bardzo dobre tempo, dużo merytorycznych treści i żywe zainteresowanie tematem prowadzącego szkolenie Dominik Stępień, Ornsson Solutions Sp. z o.o.
  • 5.0/5

    Uczenie maszynowe w Pythonie

    28-11-2024 Bradzo fajne szkolenie, "łagodnie" ale bardzo merytorycznie wprowadza w "świat AI". Duża liczba przykładów na rzeczywistych danych, każdy przykład dobrze omówiony i wyjaśniony. Dominik Rzeszowski, PSE INNOWACJE Sp. z o.o
  • 5.0/5

    Programowanie w języku Python - podstawy

    23-11-2024 Fajne szkolenie, dobrze poprowadzone, łatwe do nauki Agata Galant, Rossmann Supermarkety Drogeryjne Polska Sp. z o.o.
  • 5.0/5

    Analiza danych w języku Python

    31-10-2024 Bardzo fajne szkolenie. Prowadzący odpowiada na wszystkie zadawane pytania, ma duża wiedzę na temat prezentowanych treści. Duża ilość materiałów dodatkowych i przydatnych wskazówek. Polecam szkolenie! Anna Kotulska, Centralny Port Komunikacyjny Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    24-10-2024 Mogę polecić to szkolenie - dobre tempo szkolenia, dużo ćwiczeń praktycznych, prowadzący z dużą wiedzą i doświadczeniem. Na plus możliwość wymiany doświadczeń oraz swobodnej rozmowy o różnych aspektach programowania w Python. Marek Kocjan, Asseco Poland SA
  • 5.0/5

    Programowanie w języku Python - podstawy

    14-09-2024 Świetne szkolenie, polecam szczerze trenera Łukasza! Michał Mioduszewski, EduBroker Sp. z o.o.
  • 5.0/5

    Programowanie w języku Python - podstawy

    12-07-2024 Bardzo dobre szkolenie, świetny prowadzący. Tempo szkolenia dostosowane do uczestników. Szczerze polecam! Maciej Kijewski, Volkswagen Poznań Sp. z o.o.
  • 5.0/5

    Uczenie maszynowe w Pythonie

    27-06-2024 Bardzo fajne szkolenie, trener cierpliwy, wykazujący się bardzo dużą wiedzą, temat przedstawiony w sposób prosty ale rzeczowy i profesjonalny. Krzysztof Gołda, Tenneco Automotive Eastern Europe
  • 5.0/5

    Programowanie w języku Python - poziom średnio zaawansowany

    20-06-2024 Szkolenie było bardzo przyjemne, a także pozwalało na przećwiczenie niektórych zadań, a nie tylko słuchanie, co wpłynęło pozytywnie na skupienie. Trener był bardzo wyrozumiały, panowała miła atmosfera, a także potrafił przekazać wiele informacji w sposób zrozumiały dla osoby niedoświadczonej. Szkolenie pokazało mi z czym mogę się zmierzyć w przyszłości oraz jak obsługiwać inne rzeczy poza programowaniem np. testowanie kodów, które wykorzystywane jest w pracy zespołowej. Julia Zaręba, Wojskowa Akademia Techniczna im. Jarosława Dąbrowskiego

Trenerzy kategorii Python

Mateusz Zimoch
Paweł Stasiński
Wojciech Grzybek
Tomasz Wiliński
Tomasz Duniec
Patryk Palej
Tomasz Woźniak
Zapisz się

Masz jakieś pytania? Skontaktuj się z nami!

Odpowiadamy na telefony i maile w godzinach 9:00-17:00 od poniedziałku do piątku.

Telefon 22 299 53 69
Napisz do nas

Potrzebujesz więcej informacji?

Wiadomość wysłana

Przyjęliśmy Twoją wiadomość i skontaktujemy się z Tobą w tej sprawie

Klikając OK wrócisz do formularza