Dimitrios M.

Big Data Engineer

Dimitrios er en Senior Big Data Engineer med over fem års erfaring i prosjektering og bygging av storskala data-rørledninger ved hjelp av Spark, Airflow, Python og AWS. Han spesialiserer seg på distribuert prosessering, ETL-optimalisering og sky-native analyser, som leverer løsninger som både er effektive og skalerbare både for detaljstyring.

Han har bidratt til data-plattformer på tvers av eCommerce, finktech, og arbeidsmiljøer, i samarbeid med selskaper som Profitero+, EPAM og EY. Blant hans prosjekter kan nevnes Spark performance Tuning, data med høy volum som inntar AWS EMR og orkestre komplekse arbeidsprosesser med Airflow.

Kjent for sin sterke problemløsing og klar kommunikasjon, legger Dimitrios konsekvent vekt på pålitelighet, effektivitet og velstrukturerte prosjekteringspraksis for hvert prosjekt.

Hovedekspertise

  • SQL
    SQL 5 år
  • Data Engineering 5 år
  • AWS
    AWS 4 år

Andre kunnskaper

  • AWS Athena
    AWS Athena 2 år
  • MySQL
    MySQL 1 år
  • Snowflake
    Snowflake 1 år
Dimitrios

Dimitrios M.

Germany

Kom i gang

Utvalgt opplevelse

Arbeidserfaring

  • Senior Big Data Engineer

    Profitero+ - 4 months

    • Leads Spark-baserte ETL-optimaliseringsinitiativ, redusere beregning av fotavtrykk og sikre en SLA-bundet ETA for mission-critical data produkter.
    • Egner arkitekturen og implementeringen av rør med stort volum inntaksrør som går på AWS EMR og Databricke-klynger.
    • Implementering av avanserte prestasjonshåndteringsstrategier, hurtiglagring og produksjons-planraffinering på tvers av PySpark og Spark arbeidsbelastninger.
    • Betegnelse på luftgjennomstrømningsDAGer for fullstendig orkesterutvinning, transformasjon, modellutarbeidelse og leveringsprosesser.
    • Jobber med datagrere og analysegrupper for å standardisere transformasjonslogikk til gjenbrukbare rammer.
    • Sikrer produksjonspålitelighet ved å forbedre overvåking, hogst og ved å varsle på tvers av EMR, Snowflak og GCP arbeidsmengder.
    • Støtter integrasjon på tvers av grupper og former tekniske standarder for nye dataprodukter.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Big Data Engineer

    Profitero+ - 1 year 7 months

    • Bygget avansert Spark jobber med et internt rammeverk for å prosessere datasett med flerkilde datasett i skala.
    • utviklet komplett ETL-rørledning – fra råvarer (S3, API-er, fôr) til rengjøring, bearbeiding og datamart.
    • Opprettet rekursive tilpassede algoritmer for å optimalisere et flaskehals-ETL-trinn, forbedre utførelseshastighet og stabilitet.
    • Innstilt CPU- og minnebruk, kjøre konfigurasjoner, og lagringsformater for å møte strenge elementer.
    • Laget og vedlikeholdt DAGs orkestermange titter med gjensidig avhengige oppgaver.
    • Samarbeid med produkter, data og klientgrupper om integreringsmønstre og krav tilpasses.
    • Forsikret sikker distribusjon av endelige datasett via SFTP automatiseringer.

    Teknologier:

    • Teknologier:
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • AWS S3 AWS S3
    • Scala Scala
    • Snowflake Snowflake
    • ETL ETL
    • AWS EMR AWS EMR
  • Senior Data Engineer

    Mantaro Brands - 3 months

    • Designet og optimalisert inntaks- og transformasjonsrørledninger som støtter analyser av markedsplassen og merkevareoperasjoner.
    • Implemented Spark-based workflows for forecasting, demand analysis and product performance insights.
    • Skapte Airflow DAGs til orkesterinnretninger og valideringskontroller.
    • Forbedret formidling av skjemadesign og lagerytelse for rapportering av tilfeller.
    • Forsikret dataløsitet og kvalitet for intern analyse og eksterne markedsplassintegreringer.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Python Python
    • SQL SQL
    • Google Cloud Google Cloud
    • Apache Airflow Apache Airflow
    • Snowflake Snowflake
  • Big Data Developer

    EPAM Systems - 1 year 11 months

    • Built sophisticated Spark jobber med en tilpasset intern ramme, henrettet med AWS EMR-klynger
    • Egendefinerte ETL-strømmer fra heterogene datakilder, anvendt rengjørings- og kurasjonslogikk og leverte endelige datamart.
    • Implementerte rekursive algoritmer for komplekse transformasjoner, noe som gir en betydelig akselerasjon av flaskehalser.
    • Utført Spark og EMR ytelsesjustering av arbeidsplasser, noe som reduserer driftstidene til faste ETA.
    • Utarbeidede DAG-er (Airflow-DAGs) til flerlagsledninger.
    • Kommunisert med kunder og på tvers av funksjonelle team for integrering av data og kravanalyse.

    Som utviklerledelse:

    • Oppgavetildeling, fagfellevurderinger og onboarding for nye ingeniører.
    • Gir arkitektveiledning og sørget for samordning av prosjekteringsstandarder for foretak.
    • Støttede team med praktisk assistanse på tvers av Spark, Airflow, og AWS EMR.

    Teknologier:

    • Teknologier:
    • AWS AWS
    • Apache Spark Apache Spark
    • Python Python
    • SQL SQL
    • Scala Scala
    • Apache Airflow Apache Airflow
    • ETL ETL
    • Team Leading
    • AWS EMR AWS EMR
  • Data Engineer / BI Developer

    AbbVie - 1 year

    • Bidratt til gjennomføring av palantir-grunntørt for virksomhetsstyring, modellering og analyse. – Bygget kurerte datasett, driftsarbeidsflyt og regulerte rørledninger i grunntørke.
    • Utviklet analysere-klare tabeller og dashbord for å støtte kommersiell og regulatorisk drift.
    • Samarbeidet tett med realfagsteam for å strukturere datasett med høy verdi.

    Teknologier:

    • Teknologier:
    • Python Python
    • SQL SQL
    • Data Modeling
    • Palantir Foundry Palantir Foundry

Utdannelse

  • MSc.Petroleum Engineering

    Heriot-Watt University · 2015 - 2017

  • BSc.Engineer's degree, Pipeline Network Design, Construction and Operation

    Gubkin Russian State University of Oil and Gas (National Research University) · 2008 - 2013

Finn din neste utvikler innen dager, ikke måneder

I løpet av en kort 25-minutters samtale ønsker vi å:

  • Forstå dine utviklingsbehov
  • Forklare prosessen vår der vi matcher deg med kvalifiserte, evaluerte utviklere fra vårt nettverk
  • Dele de neste stegene for å finne riktig match, ofte på mindre enn en uke

La oss ta en prat