Business Analysis Body of Knowledge (BABOK) v3
Durasi Pelatihan : 4 Hari
Apache Spark saat ini merupakan salah satu sistem populer untuk memproses data dalam skala besar, dengan dukungan API untuk berbagai bahasa pemrograman dan berbagai dukungan pustaka yang melimpah, Apache Spark menyediakan banyak fitur untuk menyelesaikan berbagai masalah pemrosesan data.
Pelatihan Apache Spark ini ditujukan agar dapat membantu engineer dan data scientist dengan aktivitas rutin seperti query data untuk menjawab berbagai pertanyaan bisnis dan membangun model serta persiapan data untuk analisis lebih lanjut maupun membuat data ingestion pipeline.
Mengapa mengikuti pelatihan di Eduparx?
Kami berpengalaman dalam pelatihan IT sejak 1991 dan terus berkembang menjadi lembaga pelatihan terbaik di Indonesia
Instruktur berpengalaman
Pemateri yang ahli dibidangnya dan diakui secara internasional
Kelas Interaktif
Kelas pelatihan dengan porsi 70% praktek dan 30% teori
Sertifikat Pelatihan
Dapatkan pengakuan kemampuan anda yang bisa dibuktikan
Platform Pembelajaran
Materi dan kebutuhan dapat anda akses dari mana saja
Apa yang akan anda pelajari?
Dengan mengikuti pelatihan ini anda akan mempelajari:
- Pengenalan Spark
Masalah Big Data
Sejarah Spark
Menjalankan spark - Struktur Apache Spark
Arsitektur Spark
API Spark
Sesi Spark
Data Frame
Transformasi
Aksi - API data terstruktur
Operasi data terstruktur
Menggunakan beragai tipe data
Agregasi
Join
Sumber Data
Spark SQL
Dataset - API dasar
RDD
Variabel Bersama terdistribusi - Steaming
Dasar proses stream
Struktur Streaming
Event berbasis waktu dan pemrosessan statefull - Analitik lanjutan dan Machine Learning
Tentang analitik lanjutan dan machine learning
Preprocessing dan feature engineering
Klasifikasi
Regresi
Rekomendasi
Unsupervised learning
Analisis graph
Deep Learning