NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Dimitrios M.
Big Data Engineer
Dimitrios er en Senior Big Data Engineer med over fem års erfaring med at designe og bygge store datamørledninger ved hjælp af Spark, Airflow, Python og AWS. Han har specialiseret sig i distribueret behandling, ETL optimering, og cloud-native analytics, leverer løsninger, der er både effektive og skalerbare.
Han har bidraget til dataplatforme på tværs af eCommerce, fintech, og virksomhedsmiljøer, der arbejder med virksomheder som Profitero+, EPAM, og EY. Hans projekter omfatter Spark performance tuning, høj volumen data indtagelse på AWS EMR, og orkestrere komplekse arbejdsgange med Airflow.
Kendt for hans stærke problemløsende færdigheder og klare kommunikation, Dimitrios understreger konsekvent pålidelighed, effektivitet og velstruktureret teknik praksis i hvert projekt, han påtager sig.
Hovedekspertise
- SQL 5 år
- Data Engineering 5 år
- AWS 4 år
Andre færdigheder
- AWS Athena 2 år
- MySQL 1 år
- Snowflake 1 år

Udvalgt oplevelse
Beskæftigelse
Senior Big Data Engineer
Profitero+ - 4 måneder
- Leads Spark-baserede ETL optimering initiativer, reducere beregne fodaftryk og sikre SLA-bundet ETAs for missionskritiske data produkter.
- Ejer arkitektur og gennemførelse af store volumenindtagelsesrørledninger, der kører på AWS EMR og Databricks klynger.
- Implementerer avanceret performance tuning, partitionering strategier, caching, og udførelse-plan raffinement på tværs af PySpark og Scala Spark arbejdsbyrder.
- Design Airflow DAGs for fuldt orkestreret udvinding, transformation, model forberedelse, og levering processer.
- Samarbejder med data forskere og analyseteams til at standardisere transformation logik til genanvendelige rammer.
- Sikrer produktionens pålidelighed ved at forbedre overvågning, skovhugst og advarsel på tværs af EMR, Snowflake og GCP-arbejdsbyrder.
- Understøtter cross-team integration og former engineering standarder for nye data produkter.
Teknologier:
- Teknologier:
Apache Spark
Python
SQL
AWS S3
Scala
Google Cloud
Apache Airflow
Snowflake
ETL
AWS EMR
Big Data Engineer
Profitero+ - 1 år 7 måneder
- Bygget avancerede Spark job ved hjælp af en intern ramme til at behandle multi-source detaildatasæt i skala.
- Udviklede komplette ETL-rørledninger — fra rå indtagelse (S3, API'er, leverandør feeds) til rengøring, tilberedning og datamart output.
- Oprettet rekursive brugerdefinerede algoritmer til at optimere en flaskehals ETL trin, forbedre udførelsen hastighed og stabilitet.
- Tunet CPU og hukommelsesforbrug, eksekverer konfigurationer og lagringsformater til at opfylde strenge ETA'er.
- Oprettet og vedligeholdt Airflow DAGs orkester snesevis af indbyrdes afhængige opgaver.
- Samarbejdet med produkt, data og klientteams om integration mønstre og krav tilpasning.
- Sikret sikker distribution af endelige datasæt via SFTP-automatiseringer.
Teknologier:
- Teknologier:
Apache Spark
Python
SQL
AWS S3
Scala
Snowflake
ETL
AWS EMR
Senior Data Engineer
Mantaro Brands - 3 måneder
- Designet og optimeret ingestion og transformation pipelines understøtter markedspladsanalyser og brand operationer.
- Implementerede Spark-baserede arbejdsgange til prognoser, efterspørgselsanalyse og indblik i produkternes ydeevne.
- Oprettet luftstrøm DAGs til at orkestrere ETL trin og validering kontrol.
- Forbedret Snowflake skema design og lagerpræstation til rapportering brug tilfælde.
- Sikret datapparathed og kvalitet til interne analyser og eksterne markedsintegrationer.
Teknologier:
- Teknologier:
AWS
Python
SQL
Google Cloud
Apache Airflow
Snowflake
Big Data Developer
EPAM Systems - 1 år 11 måneder
- Bygget sofistikerede Spark job på en brugerdefineret intern ramme, udført på AWS EMR klynger.
- Designet ETL strømmer fra heterogene datakilder, anvendt rengøring og kurationslogik, og leveret endelige datamarts.
- Implementerede rekursive algoritmer til komplekse transformationer, væsentligt accelerere flaskehalsjob.
- Performed Spark og EMR performance tuning, reducere jobløbstider for at opfylde faste ETAs.
- Udviklet luftstrøm DAGs til at orkestrere flerlags rørledninger.
- Kommunikeret med kunder og tværfunktionelle teams til dataintegration og behovsanalyse.
Som Dev Lead:
- Led task allokering, peer reviews, og onboarding for nye ingeniører.
- Givet arkitektur vejledning og sikret tilpasning til virksomhedens tekniske standarder.
- Understøttede hold med hands-on teknisk bistand på tværs af Spark, Airflow, og AWS EMR.
Teknologier:
- Teknologier:
AWS
Apache Spark
Python
SQL
Scala
Apache Airflow
ETL
- Team Leading
AWS EMR
Data Engineer / BI Developer
AbbVie - 1 år
- Bidraget til gennemførelsen af Palantir Foundry for enterprise data governance, modellering og analytics.
- Bygget kuraterede datasæt, operationelle arbejdsgange og regerede rørledninger inden for Foundry.
- Udviklede analytiske borde og dashboards til støtte for kommercielle og regulerende operationer.
- Samarbejdet tæt med business og data videnskab teams til at strukturere høj værdi datasæt.
Teknologier:
- Teknologier:
Python
SQL
- Data Modeling
Palantir Foundry
Uddannelse
MSc.Petroleum Engineering
Heriot-Watt University · 2015 - 2017
BSc.Engineer's degree, Pipeline Network Design, Construction and Operation
Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage
