This course introduces beginners to the foundational and intermediate concepts of distributed data processing using Apache Spark, one of the most powerful engines for large-scale analytics. Through two progressively structured modules, learners will identify Spark’s architecture, describe its core components, and demonstrate key programming constructs such as Resilient Distributed Datasets (RDDs).

Découvrez de nouvelles compétences avec 30 % de réduction sur les cours dispensés par des experts du secteur. Économisez maintenant.


Apache Spark: Apply & Evaluate Big Data Workflows
Ce cours fait partie de Spécialisation Spark and Python for Big Data with PySpark

Instructeur : EDUCBA
Inclus avec
Ce que vous apprendrez
Describe Spark architecture, core components, and RDD programming constructs.
Apply transformations, persistence, and handle multiple file formats in Spark.
Develop scalable workflows and evaluate Spark applications for optimization.
Compétences que vous acquerrez
- Catégorie : Distributed Computing
- Catégorie : Data Manipulation
- Catégorie : Apache Spark
- Catégorie : PySpark
- Catégorie : Data Store
- Catégorie : Data Processing
- Catégorie : Performance Tuning
- Catégorie : Big Data
- Catégorie : Data Transformation
- Catégorie : JSON
Détails à connaître

Ajouter à votre profil LinkedIn
septembre 2025
6 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable

Il y a 2 modules dans ce cours
This module introduces learners to the foundational concepts of Apache Spark, a powerful open-source engine designed for big data processing and analytics. Through a series of structured lessons, learners explore the Spark architecture, its core components, and essential programming constructs. The module builds a conceptual understanding of how Spark leverages distributed computing and in-memory processing, followed by a practical introduction to working with Resilient Distributed Datasets (RDDs), Spark’s core abstraction for handling data. By the end of the module, learners will be equipped with the knowledge needed to initiate basic data operations in Spark and understand its high-level architecture.
Inclus
5 vidéos3 devoirs
This module deepens the learner’s understanding of Apache Spark by focusing on advanced RDD transformations, persistence strategies, operations on key-value (Pair) RDDs, and the efficient handling of diverse data formats. Learners will explore how to apply transformations like map, flatMap, and reduceByKey, understand the role and configuration of persistence levels in Spark, manipulate Pair RDDs using sorting and grouping actions, and work with commonly used file formats including CSV, JSON, Parquet, and Avro. The module equips learners with the ability to optimize Spark applications both computationally and in terms of data storage and processing.
Inclus
6 vidéos3 devoirs
Obtenez un certificat professionnel
Ajoutez ce titre à votre profil LinkedIn, à votre curriculum vitae ou à votre CV. Partagez-le sur les médias sociaux et dans votre évaluation des performances.
En savoir plus sur Data Analysis
- Statut : Essai gratuit
École Polytechnique Fédérale de Lausanne
- Statut : Prévisualisation
École Polytechnique Fédérale de Lausanne
- Statut : Essai gratuit
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?





Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
To access the course materials, assignments and to earn a Certificate, you will need to purchase the Certificate experience when you enroll in a course. You can try a Free Trial instead, or apply for Financial Aid. The course may offer 'Full Course, No Certificate' instead. This option lets you see all course materials, submit required assessments, and get a final grade. This also means that you will not be able to purchase a Certificate experience.
When you enroll in the course, you get access to all of the courses in the Specialization, and you earn a certificate when you complete the work. Your electronic Certificate will be added to your Accomplishments page - from there, you can print your Certificate or add it to your LinkedIn profile.
If you subscribed, you get a 7-day free trial during which you can cancel at no penalty. After that, we don’t give refunds, but you can cancel your subscription at any time. See our full refund policy.
Plus de questions
Aide financière disponible,