ADASTRA
BIG DATA
WORKSHOP
Pro koho je workshop určen
• Pro všechny, kteří se chtějí dozvědět více
a proniknout do problematiky Big Data.
• MIS, IS/IT, DW/BI specialisté, vývojáři,
administrátoři, analytici, data architekti.
Pro více informací o termínu,
místě a ceně kontaktujte
společnost Adastra s.r.o.
Adastra je mezinárodní konzultační
společnost, která synergicky propojuje svět
byznysu a technologického poradenství.
Své dominantní postavení v oblasti Information
Managementu rozvíjíme především v našich
klíčových kompetencích - Data Warehousingu,
Business Intelligence včetně Mobile BI, Master
Data Managementu, Enterprise Application
Integration a Big Data.
Big
Data
Praktická cvičení
Součástí workshopu je sada praktických cvičení, při
kterých si můžete ověřit své nabyté teoretické znalosti
na konkrétních příkladech. Je možné pracovat i ve
skupinách.
workshop
Diskuse
Interaktivní forma workshopu vám umožní diskutovat
o obecných i konkrétních problémech s odbornými
lektory i dalšími účastníky workshopu. Počet účastníků
je omezen tak, aby měl každý dostatek prostoru
k diskusi.
Unikátní workshop pokrývající problematiku Big Data
Proč Big Data?
Technické předpoklady
Hardware pro praktické ukázky
• Adastra zajistí HW pro Hadoop cluster,
předpokladem je použití vlastního notebooku
• V průběhu workshopu mají účastníci možnost
otestovat si integraci na ukázkový HW
• Zajistíme pro vás možnost připojení na přístupový
bod (WiFi nebo LAN)
Instalace aplikací (možnost předinstalace)
• Během workshopu mají účastníci možnost
instalovat řadu aplikací. Preferujeme jejich instalaci
na lokálních PC, ale není nutností.
Adastra s.r.o.
Nile House
Karolinská 654/2
186 00 Praha 8 - Karlín
Česká republika
Výhodou jsou znalosti v oblastech:
• Operační systémy Linux
• Relační databáze a dotazovací jazyky
• HW infrastruktura
• ETL , Data Warehousing, Business Intelligence
• Datová analýza a reporting
Tel.: (+420) 271 733 303
Fax: (+420) 271 735 296
e-mail: [email protected]
www.adastra.cz
Jakub Augustín | ADASTRA
Téma „Big Data“ se poprvé objevilo v oblasti High Performance
Computingu (HPC). Stále častěji se tento pojem začal objevovat
v prezentacích HPC dodavatelů v souvislosti s vizualizačními
platformami, cloudovými řešeními a úložišti.
S postupujícím časem se z „Big Data“ stává trend a stále více
diskutované téma pro společnosti s nároky na zpracovávání velkých
objemů dat.
Jak k tomuto tématu přistupuje společnost Adastra se můžete
dozvědět v rámci 2denního technického workshopu. Workshop
je koncipován nezávislým pohledem na jednotlivé dodavatelské
technologie.
Workshopem vás bude provázet Jakub Augustín. Jakub působí od roku 2011 jako konzultant v banking
divizi společnosti Adastra a má bohaté zkušenosti v oblasti datově orientovaných projektů (Data
Warehousing, datové migrace, Master Data Management, Data Governance). V loňském roce působil
u klienta v Rusku jako konzultant v rámci kompletního redesignu datového skladu. Oblasti Big Data se
věnuje se zaměřením na platformu Hadoop. Pravidelně se účastní klientských workshopů a publikuje
v odborných periodikách.
www.adastra.cz
den
1
den
2
Co se naučíte
Co se naučíte
• Co je to Hadoop a k čemu se typicky
používá.
• Jaké jsou součásti Hadoopu a podle čeho
vybrat tu správnou pro řešený problém.
• Co jsou to Hadoop distribuce.
• Jak probíha proces instalace Hadoopu,
co je k tomu potřebné a jak dlouho trvá.
• Jak nakonfigurovat nejdůležitější Hadoop
aplikace pro testovací použití.
• Jak nahrát do Hadoop clusteru jednoduchá
data.
• Základy práce s nástrojem Ataccama Big
Data Engine.
• Jaké analytické úlohy je možné provádět
v prostředí Hadoop.
• Typické případy užití Hadoopu.
• Specifika analytických úloh v prostředí
Hadoop.
• Jak používat vybrané analytické nástroje
v prostředí Hadoop.
• Byznys dopady platformy Hadoop na
vybraných příkladech: archivace dat,
rozšířené analytické možnosti, využití
v Data arehousingu, atd.
• Jak vizualizovat a reportovat data uložena
v Hadoop clusteru.
Program
Představení, agenda
• Rychlé představení účastníků a agendy
wokshopu, distribuce a instalace nástrojů
a dat, které budou použity v průběhu
workshopu.
• Ověření přístupů atd.
Co jsou to Big Data a co je to Hadoop?
Teoretické shrnutí všech oblastí, které budou
předmětem workshopu v detailních blocích:
• Představení konceptu Big Data.
• Představení Hadoop ekosystému (Hadoop
Core – HDFS a Map/Reduce, dotazování,
workflow, analytické aplikace a další).
• Představení Hadoop distribucí.
• Technické aspekty Hadoopu.
• Byznys řešení na Hadoopu.
Technologické aspekty Hadoopu a proces
instalace Hadoop clusteru
• Popis a praktická ukázka technologií, které
jsou potřebné k provozování Hadoop clusteru.
• Ukázka kompletní instalace Hadoop
distribuce Cloudera.
• Konfigurace core Hadoop technologií (HDFS,
Map/Reduce).
• Konfigurace databázových a dotazovacích
Hadoop technologií (Hive: Warehousing,
Impala:in-memory, Hbase: key-value).
Program
Analytické aplikace nad Hadoopem – Ataccama Big Data Engine
• Představení Ataccama nástrojů s důrazem
na Big Data Engine.
• Reálné ukázky nástroje pro řešení
vybraných problémů, Data Profilingu
a Data Discovery.
• Řízení wokflow a datových transformací
v prostředí Hadoopu.
Případy užití I:
Diskuse
Data Mining a Machine Learning
Text mining a sentiment analýza nad Hadoopem
• Možnosti využití Hadoopu pro zpracování
a analýzu nestrukturovaných textů
• Analytické úlohy pro data mimo
organizace (sociální sítě, web) i uvnitř
organizace (emaily, CRM, transakce).
Případy užití II:
• Představení dalších analytických nástrojů
v prostředí Hadoop s důrazem zejména na
řešení: Machine Learning a Data Mining
Vizualizace dat a reporting v prostředí Hadoop,
self-service BI
• Ukázka vizualizace dat z Hadoop clusteru
v nástrojích pro self-service BI
• MS Excel 2013, načítání dat a reporting.
Praktický blok:
Vytvoření end-to-end datové aplikace nad
Hadoopem
• Praktická ukázka aplikace od datové
akvizice, přes uložení/zpracování až po
vizualizaci a self-service BI report.
Diskuse
Download

Unikátní workshop pokrývající problematiku Big Data