Rihab B.
Data Engineer
Rihab er dataingeniør med over 7 års erfaring fra regulerede brancher som detailhandel, energi og fintech. Hun har stor teknisk ekspertise inden for Python og AWS og yderligere færdigheder inden for Scala, datatjenester og cloud-løsninger.
Ud over sine tekniske evner har Rihab bred erfaring med ledelse og projektstyring. En af hendes vigtigste præstationer er at opbygge en datakurateringstjeneste, samtidig med at hun fungerede som Scrum Master, hvor hun med succes ledede et team og implementerede en ny datatjeneste ved hjælp af Scala.
Rihabs blanding af stærke tekniske færdigheder og ledelseserfaring gør, at hun passer godt til projekter i regulerede industrier.
Hovedekspertise
- AWS S3 5 år
- ETL 5 år
- MLOps 2 år
Andre færdigheder
- Tableau 2 år
- Machine Learning 2 år
- Snowflake 1 år
Udvalgt oplevelse
Beskæftigelse
Senior Data Engineer
Data4Geeks - 2 flere år 8 måneder
Design og implementering af en prognoseplatform - Engie (fransk global energivirksomhed)
- Designede og implementerede en omfattende prognoseplatform, der var skræddersyet til den globale energisektor.
- Udviklet datapipelines ved hjælp af Python og PySpark, der sikrer effektiv og skalerbar databehandling.
- Orkestrerede job-workflows ved hjælp af Airflow og Databricks, optimering af opgavestyring og -udførelse.
- Implementeret datatekniske processer ved hjælp af Databricks' Delta Live Tables (DLT) til robust datastyring.
- Bygget og implementeret pipelines til behandling af datastrømme ved hjælp af DLT'er, hvilket muliggør databehandling i realtid.
- Udviklede Feature Store API'er til interaktion med komponenter og skabte genanvendelige skabeloner for at standardisere processer.
- Brugte MLflow til at opbygge, administrere og spore eksperimenter og maskinlæringsmodeller, hvilket sikrede streng eksperimentering.
- Administrerede livscyklussen for ML-modeller ved hjælp af MLOps-teknikker og implementerede genanvendelige skabeloner for at sikre konsistens og effektivitet.
- Oprettet dashboards til dataanalyse og visualisering, hvilket letter datadrevet beslutningstagning.
- Udviklet API'er ved hjælp af .NET/C# for at eksponere data og sikre problemfri integration og tilgængelighed på tværs af systemer.
- Anvendt værktøjer som Databricks, PySpark, Python, R, SQL, Glue, Athena, Kubernetes og Airflow til at levere en robust og skalerbar løsning.
Teknologier:
- Teknologier:
Machine Learning
Software Engineering Manager/Senior Data ENGINEER
Cognira - 6 måneder
- Udviklet generiske datapipelines til at omdanne rå kundedata til et format, der er kompatibelt med datamodellen i demosystemet til kampagneplanlægning;
- Skrev scripts til at generere meningsfulde forretningsdata og sikrede, at de var i overensstemmelse med applikationens behov;
- Samarbejde med videnskabsteamet for at forstå forretningskrav og bestemme de nødvendige datatransformationer for at forbedre dataanvendelsen;
- Designet og implementeret en generisk PySpark-kodebase, der effektivt transformerer data, så de passer til den krævede datamodel;
- Brugte værktøjer som PySpark, JupyterHub, Kubernetes og Azure Data Lake til at udføre og understøtte projektet.
Teknologier:
- Teknologier:
Azure Blob storage
AI/Data Engineer
Data4Geeks - 1 år 11 måneder
- Ledte projekter med fokus på at integrere Large Language Models (LLM) og AI-teknologier og drev innovation inden for organisationen;
- Hjalp med at designe og implementere datamigrationsløsninger og sikrede sømløse overgange for forskellige kunder;
- Udviklet integrationer og klienter til vektordatabaser ved at udnytte forskellige open source AI-værktøjer til at forbedre mulighederne;
- Kommunikerede aktivt med kunder for at indsamle krav og sikre tilpasning til deres specifikke behov;
- Brugte værktøjer som Python, Google Cloud Platform (GCP) og Datastax til at levere robuste løsninger.
Senior Data Engineer
Data4Geeks - 2 flere år 9 måneder
- Designet og implementeret datapipelines til både batch- og stream-behandling, optimeret dataflow og effektivitet;
- Udforsket og implementeret datapipelines ved hjælp af AWS Glue og PySpark for at sikre skalerbarhed og robusthed;
- Integreret Delta Lake i pipelines for at muliggøre deltabehandling og forbedre mulighederne for datahåndtering;
- Udviklet jobskabeloner ved hjælp af Jinja for at strømline oprettelsen og styringen af databehandlingsjobs;
- Opbygget og automatiseret datavalideringspipelines, der sikrer nøjagtigheden og pålideligheden af behandlede data;
- Implementeret og konfigureret Trino for at lette effektiv dataadgang og -forespørgsel på tværs af forskellige kilder;
- Forberedt omfattende dokumentation for hver komponent og hvert værktøj, der er udforsket, for at sikre vidensoverførsel og nem vedligeholdelse;
- Brugte værktøjer som Python, PySpark, Glue (Jobs, Crawlers, Catalogs), Athena, AWS, MWAA (Airflow), Kubernetes, Trino og Jinja til at nå projektets mål.
Software Engineering Manager/Senior Data ENGINEER
Cognira - 4 flere år 11 måneder
- Ledte teamet med at opbygge datapipelines til at understøtte en detailhandlers løsning til planlægning af kampagner;
- Deltog i møder med forretnings- og datavidenskabsteams for at forstå og identificere projektbehov;
- Samarbejdede med teamet om at oversætte forretningskrav til brugbare epics og stories;
- Designede og implementerede de identificerede forretningskrav og sikrede, at de var i overensstemmelse med projektets mål;
- Udviklet og udført enhedstests for at sikre implementeringernes funktionelle korrekthed;
- Oprettelse af en data loader-applikation ved hjælp af Scala Spark til at indlæse data fra Parquet-filer til Cosmos DB/Cassandra API;
- Implementeret en online forecaster API ved hjælp af Scala, Akka og Docker for at muliggøre prognoser for kampagner i realtid;
- Administrerede udrulningen af projektet på kundens Kubernetes-klynge og sørgede for problemfri drift og integration;
- Brugte værktøjer som Scala, Spark, Azure Databricks, Azure Data Lake og Kubernetes til at nå projektmålene.
Teknologier:
- Teknologier:
Azure Blob storage
Scala
Uddannelse
BSc.Computer Science
National School Of Computer Science · 2011 - 2014
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage