Doprava zdarma při nákupu nad 1 499 Kč přes Zásilkovnu nebo PPL Box.

Zjistit stav objednávky

Staňte se součástí komunity milovníků knih z celého světa a získejte hromadu výhod. Založit účet zdarma

Doprava zdarma se Zásilkovnou nad 1 499 Kč

Kurýr DPD 69 Kč PPL shop 49 Kč Balíkovna 69 Kč PPL kurýr 74 Kč PPL box 39 Kč Balíkovna 49 Kč Výdejní místo DPD 49 Kč Zásilkovna 39 Kč

Kontakt

Jak nakupovat

Pomoc

Můj účet

▸ Prázdný :-(

Doprava zdarma při nákupu nad 1 499 Kč přes Zásilkovnu nebo PPL Box.

IMPARA APACHE SPARK

Name: IMPARA APACHE SPARK
Brand: Independently published
SKU: 50660753
Price: 389 CZK
Availability: InStock
Author: Diego Rodrigues
ISBN: 9798244696011

Costruisci Pipeline Scalabili con PySpark e Ottimizzazione

Diego Rodrigues

StudioD21 Smart Tech Content

Jazyk

Italština

Kniha Brožovaná

Libristo kód: 50660753

Nakladatelství Independently published, leden 2026

IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e OttimizzazioneQuesto libro è rivolto... Celý popis

Libristo kód: 50660753

39 b

389 Kč

Skladem u dodavatele Odesíláme za 9-15 dnů

30 dní na vrácení zboží

IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e Ottimizzazione

Questo libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.

Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.

Include:
• Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame
• Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis
• Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI
• Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali
• Deploy su cluster gestiti in AWS, Azure e Google Cloud
• Machine learning applicato con MLlib, Delta Lake e Databricks
• Automazione delle routine, monitoraggio e scalabilità per Big Data

Al termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.