Jobtome

Pubblicato il 15/06/2026
Genova (GE)
Da definire

Descrizione:

Experteer Overview

In questa posizione lavorerai all’interno dell’Area Cyber & Security Solutions per progettare e realizzare data pipeline robuste, scalabili e a bassa latenza. Collaborerai con team di analytics per trasformare grandi volumi di dati in insight operativi, unificando batch e streaming. Ti occuperai di orchestrazione, modellazione dati e integrazione con data lakehouse, contribuendo a soluzioni di sicurezza e intelligence. Un ruolo ideale per chi vuole plasmare l’analisi dati in contesti industriali ad alto livello tecnologico e di impatto.

Retribuzione / Benefits

Sviluppare data pipelines per ingestione, processamento e trasformazione di grandi volumi di dati
Implementare batch processing con Apache Spark (PySpark, Scala)
Sviluppare real-time data pipelines con Apache Kafka e Apache Flink
Realizzare stream processing per trasformazione, arricchimento e aggregazione di eventi
Orchestrare workflow complessi con Apache Airflow (DAG, dipendenze, scheduling)
Sviluppare trasformazioni analitiche con SQL avanzato e dbt per layers di analytics
Implementare streaming aggregations con windowing (tumbling, sliding, session)
Integrare streaming e batch (lambda architecture) per analytics unificati
Gestire exactly-once processing e state management in Flink
Sviluppare Kafka producers/consumers con configurazioni ottimizzate
Implementare data quality testing e validation frameworks
Integrazione con data lakehouse (Delta Lake, Iceberg) e object storage
Stream-to-lake integration per persistence in lakehouse
Data modeling (dimensional, star schema) per analytics e reporting
Collaborare con analytics teams per requisiti e data modeling
Ottimizzare performance di Spark e streaming per low-latency
Implementare pattern di incremental processing per efficienza
Monitoring e alerting per pipeline streaming
Gestione backpressure e recovery in streaming
Supportare integrazione con BI tools per reporting
Contribuire a DataOps e best practices per stream processing

Responsabilità

Data processing con Apache Spark (PySpark, Scala)
Stream processing con Apache Flink (DataStream API, Table API, SQL)
Apache Kafka per event streaming (consumers, producers, Kafka Connect)
Real-time data pipelines con windowing e event-time processing
State management e fault tolerance in streaming (checkpointing, savepoints)
Orchestration con Apache Airflow (DAG, custom operators)
SQL avanzato (window functions, CTE, ottimizzazione)
dbt per analytics transformations e data modeling
Data modeling (dimensional, star schema)
Data lakehouse platforms (Delta Lake, Apache Iceberg) con ACID
Integrazione con data lakehouse per stream-batch convergence
Data quality frameworks (Great Expectations, dbt tests)
Exactly-once semantics e watermarking
Performance tuning per low-latency e high-throughput
Python e/o Java/Scala per streaming e data engineering
Monitoring per streaming (Prometheus, Grafana)
Schema registry (Confluent, AWS Glue)
Containerizzazione (Docker, Kubernetes)
Git per version control
Disponibilità a brevi trasferte
Certificazioni rilevanti (Databricks, Snowflake, Confluent, Flink) sono preferenziali

#J-18808-Ljbffr

Il trattamento dei dati personali pervenuti si svolgera' in conformita' alle normative vigenti

Cys_data Engineer_tp

Descrizione: