NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Dimitrios M.
Big Data Engineer
Dimitrios is een Senior Big Data Engineer met meer dan vijf jaar ervaring in het ontwerpen en bouwen van grootschalige dataleidingen met behulp van Spark, Airflow, Python en AWS. Hij specialiseert zich in gedistribueerde verwerking, ETL-optimalisatie en cloud-native analytics, met oplossingen die zowel efficiënt als schaalbaar zijn.
Hij heeft bijgedragen aan dataplatformen in e-Commerce, fintech, en bedrijfsomgevingen, die samenwerken met bedrijven als Profitero+, EPAM en EY. Zijn projecten omvatten Spark performance tuning, high-volume data inname on AWS EMR, en het orkstreren van complexe werkstromen met Airflow.
Dimitrios staat bekend om zijn sterke vaardigheden om problemen op te lossen en duidelijke communicatie, benadrukt consequent betrouwbaarheid, efficiëntie en goed gestructureerde werkwijzen bij elk project dat hij uitvoert.
Hoofd expertise
- SQL 5 jaar
- Data Engineering 5 jaar
- AWS 4 jaar
Andere vaardigheden
- AWS Athena 2 jaar
- MySQL 1 jaar
- Snowflake 1 jaar

Geselecteerde ervaring
Dienstverband
Senior Big Data Engineer
Profitero+ - 4 maanden
- Leads gebaseerde ETL-optimaliseringsinitiatieven, het verminderen van de computervoetafdruk en het waarborgen van SLA-gebonden ETA's voor mission-kritische gegevensproducten.
- Eigent over de architectuur en de uitvoering van hoge-volume innamepijpleidingen die op AWS EMR en databankclusters worden uitgevoerd.
- Implementeert geavanceerde prestatieaanpassing, partitioneringsstrategieën, caching en uitvoeringsplannen voor PySpark en Scala park werkladen.
- Ontwerp DAG's van de luchtstroom voor volledig georkestreerde extractie, transformatie, modelvoorbereiding en leveringsprocessen.
- Werk samen met data-wetenschappers en analyseteams om de omzetlogica te standaardiseren naar herbruikbare kaders.
- verzekert de betrouwbaarheid van de productie door het verbeteren van monitoring, houtkap en het waarschuwen voor alle werkzaamheden van EMR, Sneeuwvloke en GCP.
- Ondersteunt teamintegratie en vormen van technische normen voor nieuwe gegevensproducten.
Technologieën:
- Technologieën:
Apache Spark
Python
SQL
AWS S3
Scala
Google Cloud
Apache Airflow
Snowflake
ETL
AWS EMR
Big Data Engineer
Profitero+ - 1 jaar 7 maanden
- Gebouwd geavanceerde Spark banen met behulp van een intern kader om multi-source retaildatasets op schaal te verwerken.
- Volledige ETL-pijpleidingen ontwikkeld—van ruwe inname (S3, APIs, vendor feeds) tot schoonmaak-, preparatie- en datamart uitvoer.
- recursieve aangepaste algoritmen gemaakt om een bottleneck ETL step te optimaliseren, waardoor de uitvoeringssnelheid en stabiliteit worden verbeterd.
- Gecombineerd CPU- en geheugengebruik, uitvoerende configuraties en opslagformaten om te voldoen aan strikte ETA's.
- VluchtelingenDAGs heeft tientallen interafhankelijke taken gecreëerd en gehandhaafd.
- Samenwerken met product-, -data en klantenteams aan integratiepatronen en vereisten op afstand.
- Verzekerde beveiligde distributie van definitieve datasets via SFTP automatiseringen.
Technologieën:
- Technologieën:
Apache Spark
Python
SQL
AWS S3
Scala
Snowflake
ETL
AWS EMR
Senior Data Engineer
Mantaro Brands - 3 maanden
- Ontworpen en geoptimaliseerde inname en transformatie van pijpleidingen ter ondersteuning van marktplaatsanalyses en merkoperaties.
- Uitgevoerde Spark-gebaseerde werkstromen voor prognoses, vraaganalyse en inzicht in de prestaties van producten.
- Luchtstroom DAG's aangemaakt om ETL stappen en validatiecontroles te orchestreren.
- Verbeterde uitvoering van Snowflake schema- en magazijnprestaties voor het melden van gebruikszaken.
- Verzekerde gegevensgereedheid en kwaliteit voor interne analytics en externe marktconforme integraties.
Technologieën:
- Technologieën:
AWS
Python
SQL
Google Cloud
Apache Airflow
Snowflake
Big Data Developer
EPAM Systems - 1 jaar 11 maanden
- Gebouwd geavanceerde Spark jobs op een aangepast intern kader, uitgevoerd op AWS-EMR-clusters.
- Ontworpen ETL stroomt uit heterogene gegevensbronnen, toegepast reiniging en curatielogica en leverde einddatamarts.
- Implementatie van recursieve algoritmes voor complexe transformaties, die de bottleneck jobs aanzienlijk versnellen.
- Uitgevoerd Spark en EMR-prestatieafstemming, waardoor banentrades gereduceerd worden om vaste ETA's te ontmoeten.
- Ontwikkelde luchtstroom DAGs om multi-laag-pijpleidingen te orchestreren.
- Communiceerd met klanten en cross-functionele teams voor data-integratie en vereiste analyse.
Als ontwikkelaar Leiding:
- Led taaktoewijzing, peer reviews, en onboarding voor nieuwe ingenieurs.
- Bezorgde begeleiding van de architectuur en verzekerde aanpassing aan normen voor de bedrijfstechniek.
- Ondersteunde teams met hands-on technische hulp voor Spark, Airflow en AWS EMR.
Technologieën:
- Technologieën:
AWS
Apache Spark
Python
SQL
Scala
Apache Airflow
ETL
- Team Leading
AWS EMR
Data Engineer / BI Developer
AbbVie - 1 jaar
- Bijdragen aan de implementatie van Palantir Foundry voor het beheer van bedrijfsgegevens, modellen en analytics van ondernemingen.
- Gebouwd beheerde datasets, operationele workflows en geregeerde pijpleidingen binnen Foundry.
- Ontwikkelde analytische tabellen en dashboards ter ondersteuning van commerciële en regelgevende operaties.
- Gezamenlijk samengewerkt met teams voor de ontwikkeling van datasets met een hoge waarde.
Technologieën:
- Technologieën:
Python
SQL
- Data Modeling
Palantir Foundry
Educatie
MSc.Petroleum Engineering
Heriot-Watt University · 2015 - 2017
BSc.Engineer's degree, Pipeline Network Design, Construction and Operation
Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013
Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden
In een kort gesprek van 25 minuten:
- gaan we in op wat je nodig hebt om je product te ontwikkelen;
- Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
- delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.
