Business Analysis Body of Knowledge (BABOK) v3

Durasi Pelatihan : 4 Hari

Minta Penawaran

Apache Spark saat ini merupakan salah satu sistem populer untuk memproses data dalam skala besar, dengan dukungan API untuk berbagai bahasa pemrograman dan berbagai dukungan pustaka yang melimpah, Apache Spark menyediakan banyak fitur untuk menyelesaikan berbagai masalah pemrosesan data.

Pelatihan Apache Spark ini ditujukan agar dapat membantu engineer dan data scientist dengan aktivitas rutin seperti query data untuk menjawab berbagai pertanyaan bisnis dan membangun model serta persiapan data  untuk analisis lebih lanjut maupun membuat data ingestion pipeline.

Mengapa mengikuti pelatihan di Eduparx?

Kami berpengalaman dalam pelatihan IT sejak 1991 dan terus berkembang menjadi lembaga pelatihan terbaik di Indonesia

Instruktur berpengalaman

Pemateri yang ahli dibidangnya dan diakui secara internasional

Kelas Interaktif

Kelas pelatihan dengan porsi 70% praktek dan 30% teori

Sertifikat Pelatihan

Dapatkan pengakuan kemampuan anda yang bisa dibuktikan

Platform Pembelajaran

Materi dan kebutuhan dapat anda akses dari mana saja

Apa yang akan anda pelajari?

Dengan mengikuti pelatihan ini anda akan mempelajari:

  1. Pengenalan Spark
    Masalah Big Data
    Sejarah Spark
    Menjalankan spark
  2. Struktur Apache Spark
    Arsitektur Spark
    API Spark
    Sesi Spark
    Data Frame
    Transformasi
    Aksi
  3. API data terstruktur
    Operasi data terstruktur
    Menggunakan beragai tipe data
    Agregasi
    Join
    Sumber Data
    Spark SQL
    Dataset
  4. API dasar
    RDD
    Variabel Bersama terdistribusi
  5. Steaming
    Dasar proses stream
    Struktur Streaming
    Event berbasis waktu dan pemrosessan statefull
  6. Analitik lanjutan dan Machine Learning
    Tentang analitik lanjutan dan machine learning
    Preprocessing dan feature engineering
    Klasifikasi
    Regresi
    Rekomendasi
    Unsupervised learning
    Analisis graph
    Deep Learning