Dimitrios M.

Big Data Engineer

Dimitrios is een Senior Big Data Engineer met meer dan vijf jaar ervaring in het ontwerpen en bouwen van grootschalige dataleidingen met behulp van Spark, Airflow, Python en AWS. Hij specialiseert zich in gedistribueerde verwerking, ETL-optimalisatie en cloud-native analytics, met oplossingen die zowel efficiënt als schaalbaar zijn.

Hij heeft bijgedragen aan dataplatformen in e-Commerce, fintech, en bedrijfsomgevingen, die samenwerken met bedrijven als Profitero+, EPAM en EY. Zijn projecten omvatten Spark performance tuning, high-volume data inname on AWS EMR, en het orkstreren van complexe werkstromen met Airflow.

Dimitrios staat bekend om zijn sterke vaardigheden om problemen op te lossen en duidelijke communicatie, benadrukt consequent betrouwbaarheid, efficiëntie en goed gestructureerde werkwijzen bij elk project dat hij uitvoert.

Hoofd expertise

  • SQL
    SQL 5 jaar
  • Data Engineering 5 jaar
  • AWS
    AWS 4 jaar

Andere vaardigheden

  • AWS Athena
    AWS Athena 2 jaar
  • MySQL
    MySQL 1 jaar
  • Snowflake
    Snowflake 1 jaar
Dimitrios

Dimitrios M.

Germany

Aan de slag

Geselecteerde ervaring

Dienstverband

  • Senior Big Data Engineer

    Profitero+ - 4 maanden

    • Leads gebaseerde ETL-optimaliseringsinitiatieven, het verminderen van de computervoetafdruk en het waarborgen van SLA-gebonden ETA's voor mission-kritische gegevensproducten.
    • Eigent over de architectuur en de uitvoering van hoge-volume innamepijpleidingen die op AWS EMR en databankclusters worden uitgevoerd.
    • Implementeert geavanceerde prestatieaanpassing, partitioneringsstrategieën, caching en uitvoeringsplannen voor PySpark en Scala park werkladen.
    • Ontwerp DAG's van de luchtstroom voor volledig georkestreerde extractie, transformatie, modelvoorbereiding en leveringsprocessen.
    • Werk samen met data-wetenschappers en analyseteams om de omzetlogica te standaardiseren naar herbruikbare kaders.
    • verzekert de betrouwbaarheid van de productie door het verbeteren van monitoring, houtkap en het waarschuwen voor alle werkzaamheden van EMR, Sneeuwvloke en GCP.
    • Ondersteunt teamintegratie en vormen van technische normen voor nieuwe gegevensproducten.

    Technologieën:

    • Technologieën:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Big Data Engineer

    Profitero+ - 1 jaar 7 maanden

    • Gebouwd geavanceerde Spark banen met behulp van een intern kader om multi-source retaildatasets op schaal te verwerken.
    • Volledige ETL-pijpleidingen ontwikkeld—van ruwe inname (S3, APIs, vendor feeds) tot schoonmaak-, preparatie- en datamart uitvoer.
    • recursieve aangepaste algoritmen gemaakt om een bottleneck ETL step te optimaliseren, waardoor de uitvoeringssnelheid en stabiliteit worden verbeterd.
    • Gecombineerd CPU- en geheugengebruik, uitvoerende configuraties en opslagformaten om te voldoen aan strikte ETA's.
    • VluchtelingenDAGs heeft tientallen interafhankelijke taken gecreëerd en gehandhaafd.
    • Samenwerken met product-, -data en klantenteams aan integratiepatronen en vereisten op afstand.
    • Verzekerde beveiligde distributie van definitieve datasets via SFTP automatiseringen.

    Technologieën:

    • Technologieën:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Senior Data Engineer

    Mantaro Brands - 3 maanden

    • Ontworpen en geoptimaliseerde inname en transformatie van pijpleidingen ter ondersteuning van marktplaatsanalyses en merkoperaties.
    • Uitgevoerde Spark-gebaseerde werkstromen voor prognoses, vraaganalyse en inzicht in de prestaties van producten.
    • Luchtstroom DAG's aangemaakt om ETL stappen en validatiecontroles te orchestreren.
    • Verbeterde uitvoering van Snowflake schema- en magazijnprestaties voor het melden van gebruikszaken.
    • Verzekerde gegevensgereedheid en kwaliteit voor interne analytics en externe marktconforme integraties.

    Technologieën:

    • Technologieën:
    • AWS AWS
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
  • Big Data Developer

    EPAM Systems - 1 jaar 11 maanden

    • Gebouwd geavanceerde Spark jobs op een aangepast intern kader, uitgevoerd op AWS-EMR-clusters.
    • Ontworpen ETL stroomt uit heterogene gegevensbronnen, toegepast reiniging en curatielogica en leverde einddatamarts.
    • Implementatie van recursieve algoritmes voor complexe transformaties, die de bottleneck jobs aanzienlijk versnellen.
    • Uitgevoerd Spark en EMR-prestatieafstemming, waardoor banentrades gereduceerd worden om vaste ETA's te ontmoeten.
    • Ontwikkelde luchtstroom DAGs om multi-laag-pijpleidingen te orchestreren.
    • Communiceerd met klanten en cross-functionele teams voor data-integratie en vereiste analyse.

    Als ontwikkelaar Leiding:

    • Led taaktoewijzing, peer reviews, en onboarding voor nieuwe ingenieurs.
    • Bezorgde begeleiding van de architectuur en verzekerde aanpassing aan normen voor de bedrijfstechniek.
    • Ondersteunde teams met hands-on technische hulp voor Spark, Airflow en AWS EMR.

    Technologieën:

    • Technologieën:
    • AWS AWS
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Scala Scala
    • Apache Airflow Apache Airflow
    • ETL ETL
    • Team Leading
    • AWS EMR AWS EMR
  • Data Engineer / BI Developer

    AbbVie - 1 jaar

    • Bijdragen aan de implementatie van Palantir Foundry voor het beheer van bedrijfsgegevens, modellen en analytics van ondernemingen.
    • Gebouwd beheerde datasets, operationele workflows en geregeerde pijpleidingen binnen Foundry.
    • Ontwikkelde analytische tabellen en dashboards ter ondersteuning van commerciële en regelgevende operaties.
    • Gezamenlijk samengewerkt met teams voor de ontwikkeling van datasets met een hoge waarde.

    Technologieën:

    • Technologieën:
    • Python Python
    • SQL SQL
    • Data Modeling
    • Palantir Foundry Palantir Foundry

Educatie

  • MSc.Petroleum Engineering

    Heriot-Watt University · 2015 - 2017

  • BSc.Engineer's degree, Pipeline Network Design, Construction and Operation

    Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013

Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden

In een kort gesprek van 25 minuten:

  • gaan we in op wat je nodig hebt om je product te ontwikkelen;
  • Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
  • delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.

Maak een afspraak