Tworzenie systemu RAG (Retrieval-Augmented Generation) za pomocą biblioteki LangChain i modeli LLM od OpenAI
by:
Najbliższe terminy tego szkolenia
Standardy JSystems
- Wszyscy nasi trenerzy muszą być praktykami i osiągać średnią z ankiet minimum 4.75 na 5. Nie ma wśród nas trenerów-teoretyków. Każdy trener JSystems ma bogate doświadczenie komercyjne w zakresie tematów z których prowadzi szkolenia.
- Wszystkie szkolenia mają format warszatowy. Każde zagadnienie teoretyczne jest poparte rzędem warsztatów w ściśle określonym formacie.
- Terminy gwarantowane na 100%. Jeśli jakiś termin jest oznaczony jako gwarantowany, oznacza to że odbędzie się nawet jeśli część grupy wycofa się z udziału. Ryzyko ponosimy my jako organizator.
- Do każdego szkolenia które wymaga jakiegokolwiek oprogramowania dostarczamy skonfigurowane, gotowe hosty w chmurze. Dzięki temu uczestnik nie musi nic instalować na swoim komputerze (i bić się z blokadami korporacyjnymi). Połączenie następuje przez zdalny pulpit lub SSH - w zależności od szkolenia.
Program szkolenia
Moduł 1: Wprowadzenie
- Komunikacja z dużymi modelami językowymi (LLM) poprzez API
- Wprowadzenie do API OpenAI
- Podstawowe zasady pracy z modelami LLM (prompty, okno kontekstowe, role)
- Koszty korzystania z API
- Biblioteka LangChain
- Przegląd funkcji i zastosowań LangChain w tworzeniu systemów RAG
- Podstawowe klasy i moduły w LangChain
- Przykłady użycia (pipelines, chains)
- Zasada działania systemu RAG
- Koncepcja Retrieval-Augmented Generation – jak działa połączenie wyszukiwania i generowania tekstu?
- Typowe komponenty: Retriever, Generator, Pipeline
- Zalety systemu RAG w porównaniu z samodzielnymi modelami LLM
Moduł 2: Przygotowanie danych
- Loadery dokumentów
- Korzystanie z loaderów w LangChain
- Obsługa różnych formatów danych (.txt, .pdf, .docx)
- Odczytywanie tekstu z obrazów z wykorzystaniem AI
- Podział na chunki
- Dlaczego dzielimy dokumenty na mniejsze fragmenty?
- Algorytmy podziału (np. na podstawie liczby tokenów, zdań, akapitów)
Moduł 3: Wektorowa reprezentacja dokumentów
- Embedding
- Czym są i jak działają embeddingi?
- Generowanie embeddingów za pomocą różnych modeli
- Wektorowa baza danych (Qdrant)
- Wprowadzenie do Qdrant i jej zastosowań w RAG
- Operacje zapisu i odczytu na bazie wektorowej
- Integracja LangChain z Qdrant
- Wyszukiwanie podobnych wektorów
- Mechanizmy wyszukiwania w przestrzeni wektorowej (cosine similarity, dot product)
Moduł 4: Retrieval
- Retrieval w LangChain
- Konfiguracja i optymalizacja retrievera
- Hybrid retrieval (połączenie podejść wektorowych i klasycznych)
- Reranking
- Integracja retrievera z modelem generacyjnym
- Przekazywanie wyników wyszukiwania do LLM
- Tworzenie promptów opartych na wynikach wyszukiwania
Moduł 5: Ewaluacja systemu RAG
- Biblioteka DeepEval
- Wprowadzenie do biblioteki DeepEval
- Zastosowanie w systemach RAG
- Metryki ewaluacji wyszukiwania (retrieval)
- ContextualPrecisionMetric
- ContextualRecallMetric
- ContextualRelevancyMetric
- Metryki ewaluacji generacji (generation)
- AnswerRelevancyMetric
- FaithfulnessMetric
Moduł 6: Praktyczne projekty
w zależności od tego ile będzie czasu
- Projekt systemu RAG do wyszukiwania ofert sprzedaży mieszkań
Inteligentny asystent pośrednika nieruchomości, który na podstawie zapytania klienta zaproponuje zestaw najbardziej dopasowanych ofert. - System do wyszukiwania informacji o wydarzeniach fabularnych w książkach
Zaawansowane narzędzie do przeszukiwania treści książek, które pozwoli użytkownikowi znaleźć szczegółowe informacje o wydarzeniach, postaciach i miejscach, występujących w określonych fragmentach akcji.
Opis szkolenia
Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!To szkolenie wprowadzi Cię od podstaw do technik pracy z dużymi modelami językowymi (LLM).
Skupimy się na wykorzystaniu tego narzędzia do tworzenia systemów RAG, czyli generacji tekstu w oparciu o wiedzę znajdującą się w dokumentach, do których dostęp ma model. Przejdziemy przez wszystkie najważniejsze elementy systemu RAG - od wczytania i przetworzenia danych, przez zapis embeddingów w bazie wektorowej aż po wyszukiwanie i generację w oparciu o znalezione informacje. Na koniec stworzymy jeden lub więcej praktyczny projekt, który pozwoli Ci zobaczyć jak wygląda cały proces tworzenia systemu RAG.
Prowadzący szkolenie:
Patryk Palej
Programista Pythona od 2018 roku z backgroundem w matematycznym modelowaniu procesów fizycznych. Specjalizuje się w obszarach związanych z pozyskiwaniem, przetwarzaniem i analizą danych. Jako data scientist pracował w projektach dla branż takich jak telekomunikacja, media czy finanse. Doświadczony szkoleniowiec, który lubi i potrafi przekazywać wiedzę. W wolnym czasie podróżuje lub pracuje nad nowymi szkoleniami.
Środowisko robocze
Nie jest wymagane instalowanie żadnego oprogramowania przez Uczestnika. Dostęp do gotowego środowiska na potrzeby tego szkolenia jest zapewniany każdemu Uczestnikowi przez organizatora.
Gdy na jakiś termin zgłosi się minimalna liczba osób, termin oznaczamy jako gwarantowany.
Jeśli jakiś termin oznaczony jest jako gwarantowany to oznacza to, że na 100% się odbędzie we wskazanym czasie i miejscu.
Nawet gdyby część takiej grupy zrezygnowała lub przeniosła się na inny termin, raz ustalony termin gwarantowany takim pozostaje.
Ewentualne ryzyko ponosimy my jako organizator.
Przejdź do terminów tego szkolenia
Sprawdź pozostałe szkolenia z kategorii:
AI - sztuczna inteligencja
Zobacz
Sprawdź, co mówią o nas ci, którzy nam zaufali
Trenerzy kategorii AI - sztuczna inteligencja
Sebastian Stasiak
Sebastian Stasiak
Paweł Wojtanek
Paweł Wojtanek
Przedsiębiorca, programista i konsultant technologiczny z 17-letnim doświadczeniem.
Łączy perspektywę menedżera prowadzącego globalne operacje z praktyczną wiedzą o ekosystemie AI - od LLM-ów po sprzęt obliczeniowy i centra danych.
Od 2022 r. koncentruje się na praktycznej sztucznej inteligencji: multi-agent systems, RAG, Voice AI.
Specjalizuje się w projektowaniu i wdrażaniu rozwiązań AI w Pythonie (LangChain, CrewAI, Hugging Face, Whisper, ElevenLabs).
Doradza firmom z energetyki, przemysłu i B2B, przekładając złożone trendy technologiczne na przewagi biznesowe.
Łukasz Matuszewski
Łukasz Matuszewski
Z Web Developmentem związany od 2003r, a z branżą szkoleń IT od 2010r. Pracował w wielu projektach dla globalnych korporacji (m.in. Roche, Fiji Water) oraz międzynarodowych startupów. Zarówno Full-Stack (TypeScript, React/Next, Node, Python, PHP, CI/CD, VPS, Cloud) i Desktop (Electron, Swift, Tauri, Rust).
Od lat wykorzystuje AI w swojej pracy (napierw Tabnine, potem Copilot, Cursor, Snyk i wiele innych), aplikacjach (od małych modeli dla IoT, po Voice AI i Avatary 3D) i automatyzacjach (RAG, OCR, itp.). Na szkoleniach stawia na praktyczne mini-projekty, ucząc jak AI może oszczędzić czas bez utraty jakości. Szkoli po polsku i angielsku, zarówno programistów jak i zespoły biznesowe.
Sebastian Koziatek
Sebastian Koziatek
Ostatnie miejsca!