Building Batch Data Analytics Solutions on AWS

AWS

In this course, you will learn to build batch data analytics solutions using Amazon EMR, an enterprise-grade Apache Spark and Apache Hadoop managed service. You will learn how Amazon EMR integrates with open-source projects such as Apache Hive, Hue, and HBase, and with AWS services such as AWS Glue and AWS Lake Formation.

Nästa start: 18 sep. (Live Online)

Kursplan

Kurskod

GK7378

Pris

11450 kr (exklusive moms)

Längd

1 dag

Ort & startdatum

Live Online

18 sep.

Live Online

30 okt.

Boka utbildning

Om utbildningen

The course addresses data collection, ingestion, cataloging, storage, and processing components in the context of Spark and Hadoop. You will learn to use EMR Notebooks to support both analytics and machine learning workloads. You will also learn to apply security, performance, and cost management best practices to the operation of Amazon EMR.

Target audience and prerequisites

This course is intended for:

Data platform engineers
Architects and operators who build and manage data analytics pipelines

We recommend that students of this course have a minimum of one-year experience managing open-source data frameworks such as Apache Spark or Apache Hadoop.

Detaljerad information

Module A: Overview of Data Analytics and the Data Pipeline

Data analytics use cases
Using the data pipeline for analytics

Module 1: Introduction to Amazon EMR

Using Amazon EMR in analytics solutions
Amazon EMR cluster architecture
Interactive Demo 1: Launching an Amazon EMR cluster
Cost management strategies

Module 2: Data Analytics Pipeline Using Amazon EMR: Ingestion and Storage

Storage optimization with Amazon EMR
Data ingestion techniques

Module 3: High-Performance Batch Data Analytics Using Apache Spark on Amazon EMR

Apache Spark on Amazon EMR use cases
Why Apache Spark on Amazon EMR
Spark concepts
Interactive Demo 2: Connect to an EMR cluster and perform Scala commands using the
Spark shell
Transformation, processing, and analytics
Using notebooks with Amazon EMR
Practice Lab 1: Low-latency data analytics using Apache Spark on Amazon EMR

Module 4: Processing and Analyzing Batch Data with Amazon EMR and Apache Hive

Using Amazon EMR with Hive to process batch data
Transformation, processing, and analytics
Practice Lab 2: Batch data processing using Amazon EMR with Hive
Introduction to Apache HBase on Amazon EMR

Module 5: Serverless Data Processing

Serverless data processing, transformation, and analytics
Using AWS Glue with Amazon EMR workloads
Practice Lab 3: Orchestrate data processing in Spark using AWS Step Functions

Module 6: Security and Monitoring of Amazon EMR Clusters

Securing EMR clusters
Interactive Demo 3: Client-side encryption with EMRFS
Monitoring and troubleshooting Amazon EMR clusters
Demo: Reviewing Apache Spark cluster history

Module 7: Designing Batch Data Analytics Solutions

Batch data analytics use cases
Activity: Designing a batch data analytics workflow

Module B: Developing Modern Data Architectures on AWS

Modern data architectures

Utforska relaterade utbildningsområden

AWS

Kursplan

Kurskod

GK7378

Pris

11450 kr (exklusive moms)

Längd

1 dag

Ort & startdatum

Live Online

18 sep.

Live Online

30 okt.

Boka utbildning

Ledarskapsprogram

Executive AI Leadership Program

Tre månader som förändrar hur er ledning fattar beslut om AI. Ett gemensamt ramverk, ett gemensamt språk och en konkret handlingsplan för er organisation. Byggt för dem som bär det övergripande ansvaret.

Relaterade kurser

Mer än en kurs

Ledarskapsprogram

Executive AI Leadership Program

Tre månader som förändrar hur er ledning fattar beslut om AI. Sju sessioner, tolv veckor. Byggt för dem som bär det övergripande ansvaret, inte för dem som ska lära sig verktygen.

Strategic Workforce Planning

Framtidssäkra er organisation

Vilken kompetens behöver ni om två år — och har ni den idag? Vi hjälper er planera för framtidens kompetensbehov innan luckorna blir ett problem.

Skills Mapping

Strategisk kompetensutveckling

Vet ni vilka kompetensgap som finns i er organisation idag? Vi hjälper er kartlägga nuläget och identifiera vad ni behöver bygga för att möta morgondagens krav.

Kompetenskort

Planera utbildningen smart

Ladda kortet med utbildningsdagar i förväg och säkra budgeten innan behovet uppstår. Ni får rabatterade priser, flexibel användning och enklare administration — för hela teamet.

Relaterat innehåll

Cisco Automation och Cybersecurity: DevNet och CyberOps byter namn

Cisco uppdaterar sina certifieringsspår, som får en tydligare och mer konsekvent namnstruktur. Här får du en tydlig sammanfattning av vad som händer, när det händer, hur du påverkas och vad just du behöver göra.

Windows Server 2025 - Nyheter, kurser och utbildning

Windows Server 2025 är den största uppdateringen av Windows Server på nästan ett decennium. På Cornerstone ar vi tagit fram ett brett och heltäckande spektrum av av kurser som snabbt får dig på banan med den senaste tekniken.

VMware Cloud Foundation 9 - vad betyder det för dig?

VCF 9 är Broadcoms plattform för privat moln – inte bara ”vSphere + NSX”, utan en sammanhållen stack med gemensam installation, drift och livscykel. Här är en enkel vägledning och kursöversikt för dig som arbetar med VMware-teknologier.

Building Batch Data Analytics Solutions on AWS

Kursplan

Om utbildningen

Target audience and prerequisites

Module A: Overview of Data Analytics and the Data Pipeline

Module 1: Introduction to Amazon EMR

Module 2: Data Analytics Pipeline Using Amazon EMR: Ingestion and Storage

Module 3: High-Performance Batch Data Analytics Using Apache Spark on Amazon EMR

Module 5: Serverless Data Processing

Module 6: Security and Monitoring of Amazon EMR Clusters

Module 7: Designing Batch Data Analytics Solutions

Module B: Developing Modern Data Architectures on AWS

Kursplan

Relaterade kurser

Building Streaming Data Analytics Solutions on AWS

Practical Data Science with Amazon SageMaker

MLOps Engineering on AWS

Machine Learning Engineering on AWS

Migrating to AWS

Mer än en kurs

Relaterat innehåll

Få inspiration & nyheter från oss