Dimitrios M.

Big Data Engineer

Dimitrios är en Senior Big Data Engineer med över fem års erfarenhet av att designa och bygga storskaliga datapipelines med hjälp av Spark, Airflow, Python och AWS. Han är specialiserad på distribuerad bearbetning, ETL-optimering och molnbaserad analys och levererar lösningar som är både effektiva och skalbara.

Han har bidragit till dataplattformar inom eCommerce, fintech och företagsmiljöer och arbetat med företag som Profitero+, EPAM och EY. Hans projekt inkluderar Spark performance tuning, hög volym data intestion på AWS EMR och orkestrera komplexa arbetsflöden med Airflow.

Dimitrios är känd för sin starka problemlösningsförmåga och tydliga kommunikation och betonar konsekvent tillförlitlighet, effektivitet och välstrukturerade ingenjörspraxis i alla projekt han utför.

Huvudsaklig expertis

  • SQL
    SQL 5 år
  • Data Engineering 5 år
  • AWS
    AWS 4 år

Andra kompetenser

  • AWS Athena
    AWS Athena 2 år
  • MySQL
    MySQL 1 år
  • Snowflake
    Snowflake 1 år
Dimitrios

Dimitrios M.

Germany

Hitta en utvecklare

Utvald erfarenhet

Anställningar

  • Senior Big Data Engineer

    Profitero+ - 4 månader

    • Leads Sparkbaserade ETL-optimeringsinitiativ, minskar beräkningen av fotavtryck och säkerställer SLA-bundna ETAs för verksamhetskritiska dataprodukter.
    • Äger arkitekturen och genomförandet av stora volymer intag rörledningar som körs på AWS EMR och Databricks kluster.
    • Implementerar avancerad prestandastämning, partitioneringsstrategier, caching och utförande-plan finslipning mellan PySpark och Scala Spark arbetsbelastning.
    • Designar luftflödessystem för helt iscensatt extraktion, transformation, modellberedning och leveransprocesser.
    • Samarbeta med datavetare och analysteam för att standardisera omvandlingen av logik till återanvändbara ramverk.
    • Säkerställer produktionens tillförlitlighet genom att förbättra övervakning, loggning och varning över EMR, Snowflake och GCP arbetsbelastning.
    • Stöder integrerings- och formtekniska standarder för nya dataprodukter.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Big Data Engineer

    Profitero+ - 1 år 7 månader

    • Byggd avancerade Spark jobb med hjälp av ett internt ramverk för att bearbeta multi-source data i skala.
    • Utvecklade kompletta ETL-rörledningar - från råintag (S3, API:er, leverantörsflöden) till rengöring, förberedelse och datamartutgångar.
    • Skapade rekursiva anpassade algoritmer för att optimera en flaskhals ETL steg, förbättra exekveringshastighet och stabilitet.
    • Tuned CPU och minnesanvändning, exekveringskonfigurationer och lagringsformat för att möta strikta ETA.
    • Skapad och underhålls Luftflöde DAGs iscensätta dussintals ömsesidigt beroende uppgifter.
    • Samarbete med produkt-, data- och kundteam kring integrationsmönster och kravanpassning.
    • Garanterad säker distribution av slutdata via SFTP-automationer.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Senior Data Engineer

    Mantaro Brands - 3 månader

    • Konstruerade och optimerade pipelines för intag och omvandling som stödjer marknadsanalys och varumärkesverksamhet.
    • Implementerade sparkbaserade arbetsflöden för prognostisering, behovsanalys och produktresultatinsikter.
    • Skapade luftflödesdata för att iscensätta ETL-steg och valideringskontroller.
    • Förbättrad design av snöflingor och lagerprestanda för rapportering av användningsfall.
    • Säkerställt datakedja och kvalitet för intern analys och integrering av externa marknadsplatser.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
  • Big Data Developer

    EPAM Systems - 1 år 11 månader

    • Byggd sofistikerade Spark jobb på en egen intern ram, utförs på AWS EMR kluster.
    • Designad ETL flöden från heterogena datakällor, applicerad rengöring och bota logik och levererade slutlig datamarts.
    • Implementerade rekursiva algoritmer för komplexa omvandlingar, vilket avsevärt påskyndar flaskhalsjobb.
    • Utförd Gnista och EMR prestanda tuning, vilket minskar jobbkörtider för att möta fasta ETAs.
    • Utvecklade luftflödessystem för att iscensätta flerskiktsrörledningar.
    • Kommunicerade med kunder och tvärfunktionella team för dataintegration och behovsanalys.

    Som Dev Lead:

    • Ledd uppgiftsfördelning, peer reviews, och onboarding för nya ingenjörer.
    • Tillhandahöll arkitektur vägledning och säkerställd anpassning till företagets tekniska standarder.
    • Stödda team med praktisk teknisk assistans över Spark, Airflow och AWS EMR.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Scala Scala
    • Apache Airflow Apache Airflow
    • ETL ETL
    • Team Leading
    • AWS EMR AWS EMR
  • Data Engineer / BI Developer

    AbbVie - 1 år

    • Bidragit till genomförandet av Palantir Foundry för företagets data styrning, modellering och analys.
    • Byggda kurerade datamängder, operativa arbetsflöden och styrda pipelines inom Foundry.
    • Utvecklade analysklara tabeller och instrumentpaneler för att stödja kommersiell och regulatorisk verksamhet.
    • Har ett nära samarbete med affärs- och datavetenskapsteam för att strukturera värdefulla datamängder.

    Teknologier:

    • Teknologier:
    • Python Python
    • SQL SQL
    • Data Modeling
    • Palantir Foundry Palantir Foundry

Utbildning

  • MSc.Petroleum Engineering

    Heriot-Watt University · 2015 - 2017

  • BSc.Engineer's degree, Pipeline Network Design, Construction and Operation

    Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013

Hitta din nästa utvecklare inom ett par dagar

Ge oss 25 minuter av din tid, så kommer vi att:

  • Sätta oss in i dina utmaningar och behov
  • Berätta om våra seniora och beprövade utvecklare
  • Förklara hur vi kan matcha dig med precis rätt utvecklare

Låt oss ta ett kort digitalt möte.