NYHET
Proxify ger dig full insyn i utvecklarnas prestationer – ett branschunikt erbjudande som är varje CTO:s dröm.
Läs mer
Dimitrios M.
Big Data Engineer
Dimitrios är en Senior Big Data Engineer med över fem års erfarenhet av att designa och bygga storskaliga datapipelines med hjälp av Spark, Airflow, Python och AWS. Han är specialiserad på distribuerad bearbetning, ETL-optimering och molnbaserad analys och levererar lösningar som är både effektiva och skalbara.
Han har bidragit till dataplattformar inom eCommerce, fintech och företagsmiljöer och arbetat med företag som Profitero+, EPAM och EY. Hans projekt inkluderar Spark performance tuning, hög volym data intestion på AWS EMR och orkestrera komplexa arbetsflöden med Airflow.
Dimitrios är känd för sin starka problemlösningsförmåga och tydliga kommunikation och betonar konsekvent tillförlitlighet, effektivitet och välstrukturerade ingenjörspraxis i alla projekt han utför.
Huvudsaklig expertis
- SQL 5 år
- Data Engineering 5 år
- AWS 4 år
Andra kompetenser
- AWS Athena 2 år
- MySQL 1 år
- Snowflake 1 år

Utvald erfarenhet
Anställningar
Senior Big Data Engineer
Profitero+ - 4 månader
- Leads Sparkbaserade ETL-optimeringsinitiativ, minskar beräkningen av fotavtryck och säkerställer SLA-bundna ETAs för verksamhetskritiska dataprodukter.
- Äger arkitekturen och genomförandet av stora volymer intag rörledningar som körs på AWS EMR och Databricks kluster.
- Implementerar avancerad prestandastämning, partitioneringsstrategier, caching och utförande-plan finslipning mellan PySpark och Scala Spark arbetsbelastning.
- Designar luftflödessystem för helt iscensatt extraktion, transformation, modellberedning och leveransprocesser.
- Samarbeta med datavetare och analysteam för att standardisera omvandlingen av logik till återanvändbara ramverk.
- Säkerställer produktionens tillförlitlighet genom att förbättra övervakning, loggning och varning över EMR, Snowflake och GCP arbetsbelastning.
- Stöder integrerings- och formtekniska standarder för nya dataprodukter.
Teknologier:
- Teknologier:
Apache Spark
Python
SQL
AWS S3
Scala
Google Cloud
Apache Airflow
Snowflake
ETL
AWS EMR
Big Data Engineer
Profitero+ - 1 år 7 månader
- Byggd avancerade Spark jobb med hjälp av ett internt ramverk för att bearbeta multi-source data i skala.
- Utvecklade kompletta ETL-rörledningar - från råintag (S3, API:er, leverantörsflöden) till rengöring, förberedelse och datamartutgångar.
- Skapade rekursiva anpassade algoritmer för att optimera en flaskhals ETL steg, förbättra exekveringshastighet och stabilitet.
- Tuned CPU och minnesanvändning, exekveringskonfigurationer och lagringsformat för att möta strikta ETA.
- Skapad och underhålls Luftflöde DAGs iscensätta dussintals ömsesidigt beroende uppgifter.
- Samarbete med produkt-, data- och kundteam kring integrationsmönster och kravanpassning.
- Garanterad säker distribution av slutdata via SFTP-automationer.
Teknologier:
- Teknologier:
Apache Spark
Python
SQL
AWS S3
Scala
Snowflake
ETL
AWS EMR
Senior Data Engineer
Mantaro Brands - 3 månader
- Konstruerade och optimerade pipelines för intag och omvandling som stödjer marknadsanalys och varumärkesverksamhet.
- Implementerade sparkbaserade arbetsflöden för prognostisering, behovsanalys och produktresultatinsikter.
- Skapade luftflödesdata för att iscensätta ETL-steg och valideringskontroller.
- Förbättrad design av snöflingor och lagerprestanda för rapportering av användningsfall.
- Säkerställt datakedja och kvalitet för intern analys och integrering av externa marknadsplatser.
Teknologier:
- Teknologier:
AWS
Python
SQL
Google Cloud
Apache Airflow
Snowflake
Big Data Developer
EPAM Systems - 1 år 11 månader
- Byggd sofistikerade Spark jobb på en egen intern ram, utförs på AWS EMR kluster.
- Designad ETL flöden från heterogena datakällor, applicerad rengöring och bota logik och levererade slutlig datamarts.
- Implementerade rekursiva algoritmer för komplexa omvandlingar, vilket avsevärt påskyndar flaskhalsjobb.
- Utförd Gnista och EMR prestanda tuning, vilket minskar jobbkörtider för att möta fasta ETAs.
- Utvecklade luftflödessystem för att iscensätta flerskiktsrörledningar.
- Kommunicerade med kunder och tvärfunktionella team för dataintegration och behovsanalys.
Som Dev Lead:
- Ledd uppgiftsfördelning, peer reviews, och onboarding för nya ingenjörer.
- Tillhandahöll arkitektur vägledning och säkerställd anpassning till företagets tekniska standarder.
- Stödda team med praktisk teknisk assistans över Spark, Airflow och AWS EMR.
Teknologier:
- Teknologier:
AWS
Apache Spark
Python
SQL
Scala
Apache Airflow
ETL
- Team Leading
AWS EMR
Data Engineer / BI Developer
AbbVie - 1 år
- Bidragit till genomförandet av Palantir Foundry för företagets data styrning, modellering och analys.
- Byggda kurerade datamängder, operativa arbetsflöden och styrda pipelines inom Foundry.
- Utvecklade analysklara tabeller och instrumentpaneler för att stödja kommersiell och regulatorisk verksamhet.
- Har ett nära samarbete med affärs- och datavetenskapsteam för att strukturera värdefulla datamängder.
Teknologier:
- Teknologier:
Python
SQL
- Data Modeling
Palantir Foundry
Utbildning
MSc.Petroleum Engineering
Heriot-Watt University · 2015 - 2017
BSc.Engineer's degree, Pipeline Network Design, Construction and Operation
Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013
Hitta din nästa utvecklare inom ett par dagar
Ge oss 25 minuter av din tid, så kommer vi att:
- Sätta oss in i dina utmaningar och behov
- Berätta om våra seniora och beprövade utvecklare
- Förklara hur vi kan matcha dig med precis rätt utvecklare
