Nehodí se? Vůbec nevadí! U nás můžete do 30 dní vrátit
S dárkovým poukazem nešlápnete vedle. Obdarovaný si za dárkový poukaz může vybrat cokoliv z naší nabídky.
30 dní na vrácení zboží
IMPARA APACHE SPARK Costruisci Pipeline Scalabili con PySpark e Ottimizzazione
Questo libro è rivolto a studenti, sviluppatori, ingegneri dei dati, data scientist e professionisti IT che desiderano padroneggiare Apache Spark nella pratica, in ambienti aziendali, cloud pubblici e integrazioni moderne. Il lettore imparerà a progettare, implementare e gestire pipeline scalabili per l'elaborazione di dati su larga scala, orchestrando workload distribuiti su AWS EMR, Databricks, Azure Synapse e Google Cloud Dataproc.
Il contenuto copre l'integrazione con Hadoop, Hive, Kafka, SQL, Delta Lake, MongoDB e Python, oltre a tecniche avanzate di tuning, ottimizzazione dei job, analisi in tempo reale, machine learning con MLlib e automazione dei workflow orientati alla produzione.
Include:
• Implementazione di pipeline ETL ed ELT con Spark SQL e DataFrame
• Elaborazione di dati in streaming e integrazione con Kafka e AWS Kinesis
• Ottimizzazione dei job distribuiti, tuning delle prestazioni e utilizzo della Spark UI
• Integrazione di Spark con S3, Data Lake, NoSQL e database relazionali
• Deploy su cluster gestiti in AWS, Azure e Google Cloud
• Machine learning applicato con MLlib, Delta Lake e Databricks
• Automazione delle routine, monitoraggio e scalabilità per Big Data
Al termine, il lettore padroneggerà Apache Spark come soluzione professionale per l'analisi dei dati, l'automazione dei processi e il machine learning in ambienti complessi, distribuiti e ad alte prestazioni.
Ahoj! Jsem Libroamiko, tvůj knižní rádce.
Jak ti můžu pomoct?