Dimitrios M.

Big Data Engineer

Dimitrios er en Senior Big Data Engineer med over fem års erfaring med at designe og bygge store datamørledninger ved hjælp af Spark, Airflow, Python og AWS. Han har specialiseret sig i distribueret behandling, ETL optimering, og cloud-native analytics, leverer løsninger, der er både effektive og skalerbare.

Han har bidraget til dataplatforme på tværs af eCommerce, fintech, og virksomhedsmiljøer, der arbejder med virksomheder som Profitero+, EPAM, og EY. Hans projekter omfatter Spark performance tuning, høj volumen data indtagelse på AWS EMR, og orkestrere komplekse arbejdsgange med Airflow.

Kendt for hans stærke problemløsende færdigheder og klare kommunikation, Dimitrios understreger konsekvent pålidelighed, effektivitet og velstruktureret teknik praksis i hvert projekt, han påtager sig.

Hovedekspertise

  • SQL
    SQL 5 år
  • Data Engineering 5 år
  • AWS
    AWS 4 år

Andre færdigheder

  • AWS Athena
    AWS Athena 2 år
  • MySQL
    MySQL 1 år
  • Snowflake
    Snowflake 1 år
Dimitrios

Dimitrios M.

Germany

Match med udvikler her

Udvalgt oplevelse

Beskæftigelse

  • Senior Big Data Engineer

    Profitero+ - 4 måneder

    • Leads Spark-baserede ETL optimering initiativer, reducere beregne fodaftryk og sikre SLA-bundet ETAs for missionskritiske data produkter.
    • Ejer arkitektur og gennemførelse af store volumenindtagelsesrørledninger, der kører på AWS EMR og Databricks klynger.
    • Implementerer avanceret performance tuning, partitionering strategier, caching, og udførelse-plan raffinement på tværs af PySpark og Scala Spark arbejdsbyrder.
    • Design Airflow DAGs for fuldt orkestreret udvinding, transformation, model forberedelse, og levering processer.
    • Samarbejder med data forskere og analyseteams til at standardisere transformation logik til genanvendelige rammer.
    • Sikrer produktionens pålidelighed ved at forbedre overvågning, skovhugst og advarsel på tværs af EMR, Snowflake og GCP-arbejdsbyrder.
    • Understøtter cross-team integration og former engineering standarder for nye data produkter.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Big Data Engineer

    Profitero+ - 1 år 7 måneder

    • Bygget avancerede Spark job ved hjælp af en intern ramme til at behandle multi-source detaildatasæt i skala.
    • Udviklede komplette ETL-rørledninger — fra rå indtagelse (S3, API'er, leverandør feeds) til rengøring, tilberedning og datamart output.
    • Oprettet rekursive brugerdefinerede algoritmer til at optimere en flaskehals ETL trin, forbedre udførelsen hastighed og stabilitet.
    • Tunet CPU og hukommelsesforbrug, eksekverer konfigurationer og lagringsformater til at opfylde strenge ETA'er.
    • Oprettet og vedligeholdt Airflow DAGs orkester snesevis af indbyrdes afhængige opgaver.
    • Samarbejdet med produkt, data og klientteams om integration mønstre og krav tilpasning.
    • Sikret sikker distribution af endelige datasæt via SFTP-automatiseringer.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Senior Data Engineer

    Mantaro Brands - 3 måneder

    • Designet og optimeret ingestion og transformation pipelines understøtter markedspladsanalyser og brand operationer.
    • Implementerede Spark-baserede arbejdsgange til prognoser, efterspørgselsanalyse og indblik i produkternes ydeevne.
    • Oprettet luftstrøm DAGs til at orkestrere ETL trin og validering kontrol.
    • Forbedret Snowflake skema design og lagerpræstation til rapportering brug tilfælde.
    • Sikret datapparathed og kvalitet til interne analyser og eksterne markedsintegrationer.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
  • Big Data Developer

    EPAM Systems - 1 år 11 måneder

    • Bygget sofistikerede Spark job på en brugerdefineret intern ramme, udført på AWS EMR klynger.
    • Designet ETL strømmer fra heterogene datakilder, anvendt rengøring og kurationslogik, og leveret endelige datamarts.
    • Implementerede rekursive algoritmer til komplekse transformationer, væsentligt accelerere flaskehalsjob.
    • Performed Spark og EMR performance tuning, reducere jobløbstider for at opfylde faste ETAs.
    • Udviklet luftstrøm DAGs til at orkestrere flerlags rørledninger.
    • Kommunikeret med kunder og tværfunktionelle teams til dataintegration og behovsanalyse.

    Som Dev Lead:

    • Led task allokering, peer reviews, og onboarding for nye ingeniører.
    • Givet arkitektur vejledning og sikret tilpasning til virksomhedens tekniske standarder.
    • Understøttede hold med hands-on teknisk bistand på tværs af Spark, Airflow, og AWS EMR.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Scala Scala
    • Apache Airflow Apache Airflow
    • ETL ETL
    • Team Leading
    • AWS EMR AWS EMR
  • Data Engineer / BI Developer

    AbbVie - 1 år

    • Bidraget til gennemførelsen af Palantir Foundry for enterprise data governance, modellering og analytics.
    • Bygget kuraterede datasæt, operationelle arbejdsgange og regerede rørledninger inden for Foundry.
    • Udviklede analytiske borde og dashboards til støtte for kommercielle og regulerende operationer.
    • Samarbejdet tæt med business og data videnskab teams til at strukturere høj værdi datasæt.

    Teknologier:

    • Teknologier:
    • Python Python
    • SQL SQL
    • Data Modeling
    • Palantir Foundry Palantir Foundry

Uddannelse

  • MSc.Petroleum Engineering

    Heriot-Watt University · 2015 - 2017

  • BSc.Engineer's degree, Pipeline Network Design, Construction and Operation

    Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013

Find din næste udvikler inden for få dage, ikke måneder

Book en 25-minutters samtale, hvor vi:

  • udfører behovsafdækning med fokus på udviklingsopgaver
  • Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
  • beskriver de næste trin for at finde det perfekte match på få dage

Lad os snakke om det