Administracja bazami danych Cassandra

Czas trwania
3
dni
Najbliższe terminy tego szkolenia
Cena szkolenia
2100 PLN
(netto)
Skuteczność
Program szkolenia
- Wprowadzenie do technologii Cassandra
- Zakres szkolenia, sprawy organizacyjne, dlaczego warto
- Podstawowe własności technologii, omówienie architektury klastra oraz sposobu składowania danych
- nody
- klastry
- commitlog
- memtables
- sstables
- Główne zalety technologii Cassandra
- architektura peer to peer
- horyzontalna skalowalność infrastruktury
- stabilność klastra – replikacja pomiędzy centrami danych
- wsparcie dla analityki (Solr, Hadoop, Spark)
- Porównanie modeli ACID i BASE, teoria CAP
- Przykłady wdrożonych klastrów produkcyjnych na Świecie
- W jakich zastosowaniach Cassandra sprawdza się najlepiej
- Wykorzystanie Cassandra w obszarze BigData
- Datastax – produkt typu Enterprise zbudowany na Cassandrze
- Miejsce instalacji serwera - maszyny fizyczne, chmura, Kubernetes?
- Przygotowanie i optymalizacja – tuning systemu operacyjnego
- Aktualna wersja Java JDK
- Overcommit memory
- Ulimit
- nofile
- nproc
- memlock
- Sysctl
- net.core.rmem_max
- net.core.wmem_max
- net.core.rmem_default
- net.core.wmem_default
- net.core.optmem_max
- net.ipv4.tcp_rmem
- net.ipv4.tcp_wmem
- vm.zone_reclaim_mode
- vm.max_map_count
- Transparent HugePages
- HugePages
- Swap
- Non-Uniform Memory Access Architecture (NUMA)
- Odczyt z urządzenia blokowego: blockdev -set readahead
- queue/rotational
- queue/read_ahead_kb
- queue/nomerges
- trim
- Opcje montowania systemu plików – xfs, ext4, zfs, cfs (wielkość bloku, noatime, ...)
- IO Scheduler (deadline, noop) – optymalizacja zapisu na dysku
- Raid, Jbod, Lvm
- Selinux
- NTP daemon – synchronizacja czasu
- Tuning heap size – Java garbage collector
- Jaki sprzęt fizyczny
- Instalacja serwera
- Wydajność i optymalizacja serwera
- Całościowe spojrzenie na proces i zasoby
- Określenie wydajności – Cassandra-stress
- Konfiguracja serwera
- Główny plik konfiguracyjny - cassandra.yaml
- cassandra-env.sh – ustawianie zmiennych środowiskowych
- cassandra-rackdc.properties/cassandra-topology.properties – ustawienia data center i rac dla klastra
- logback.xml – ustawienia poziomów logowania
- Pliki jvm-* - konfiguracje JVM dla klientów, serwera
- commitlog_archiving.properties – ustawienia archiwizacji dla zapisu danych
- Praca z danymi
- Zaawansowane operacje na danych
- Replikacja i konsystencja danych w klastrze oraz zarządzanie współczynnikiem replikacji
- podejście last-write-wins
- wersjonowanie danych
- Operacje mapreduce – zastosowanie w obszarze Big Data
- Quorum
- Użycie indeksów
- Kompresja danych
- Tworzenie skryptów w powłoce cqlsh
- Kontrola czasu życia kluczy/danych – ustawienia TTL na tabelach
- Bulk loading
- nodetool
- sstableloader
- Partycjonowanie danych
- hash rings
- tokeny
- Obsługa transakcji
- Interfejsy programistyczne
- Cql
- Python
- Java
- Narzędzia GUI, klienci, monitoring, wspomaganie pracy
- Dbeaver
- Cassandra Gui Client
- Nagios
- Prometheus
- Keepalive script
- Administracja klastrem
- Przygotowanie środowiska
- Dodawanie, przenoszenie, usuwanie nodów z klastra
- Autoryzacja i uwierzytelnianie użytkowników
- Audyt zmian
- Narzędzie nodetool
- decommission
- removenode
- move
- cleanup
- netstats
- repairs
- import
- Wykonywanie backupu i przywracania danych
- Snapshots
- Incremental backups
- Repairs
Opis szkolenia
Szkolenie odbywa się na żywo z udziałem trenera. Nie jest to forma kursu video!
Szkolenie przeznaczone jest dla osób posiadających już wiedzę z baz NoSQL
oraz systemu operacyjnego Linux i stanowi ono swoistą kontynuację szkolenia
„
Wprowadzeniu do technologii baz danych NoSQL
” w kontekście serwera
Cassandra. Nacisk szkolenia jest położony na praktyczne zapoznanie się
zarówno z zaawansowanymi operacjami na danych jak również administracją
klastra Cassandra. Szkolenie ma formę praktyczną, uczestnicy na bieżąco
wprowadzają wiedzę w życie rozwiązując przygotowane zadania oraz
naprawiając świadomie zepsutą infrastrukturę w formie „troubleshootingu”.
Szkolenie prowadzone jest przez wieloletniego administratora serwerów i baz
danych.
Prowadzący szkolenie: Jarosław Zdebik
Prowadzący szkolenie: Jarosław Zdebik
Administrator systemów Linux oraz baz danych z dwunastoletnim doświadczeniem zawodowym. Na co dzień administruje bazami danych MongoDB, Cassandra, Redis, PostgreSQL, MySQL, Oracle. Posiada certyfikaty zarówno z obszaru baz danych, jak i Linuxa. Obecnie jego wyzwania zawodowe związane są z technologiami DevOps. Z wykształcenia i zamiłowania fizyk jądrowy, w tej dziedzinie uzyskał stopień doktora na krakowskim uniwersytecie.

Sprawdź, co mówią o nas ci, którzy nam zaufali
Trenerzy kategorii NoSQL

