NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Samuel P.
Data Scientist
Samuel er en dygtig data- og business intelligence-professionel med fem års erfaring fra telekom-, konsulent- og biovidenskabssektoren. Han har en ph.d. i statistik og kombinerer avanceret modelleringsekspertise med praktisk brancheerfaring, hvilket effektivt bygger bro mellem komplekse analyser og brugbar forretningsindsigt.
Blandt hans vigtigste resultater er, at Samuel designede og implementerede et automatiseret dataworkflow ved hjælp af Snowflake, Python og Power BI, som reducerede den manuelle behandling med 90 %, forbedrede datakvaliteten med 20 % og understøttede over 10 vellykkede produktlanceringer inden for to år. Denne innovation forbedrede i høj grad datatilgængeligheden og beslutningstagningen i hele virksomheden.
Samuel er anerkendt for sin evne til at omsætte komplekse data til klare, virkningsfulde indsigter, og han fremmer et stærkt tværfunktionelt samarbejde og driver konsekvent datadrevet transformation på tværs af forretningsfunktioner.
Hovedekspertise
- R (programming language) 6 år

- SQL 8 år

- Data Science 6 år
Andre færdigheder
- dbt 4 år

- Data Engineering 3 år
- Oracle 3 år
Udvalgt oplevelse
Beskæftigelse
Data Scientist
Telenet, Belgium - 1 år 4 måneder
- Optimerede en adfærdsklassifikationsmodel i produktionsklassen på tværs af mere end 2 millioner enheder og identificerede og markerede brugerafvigelser med høj risiko, der havde en målbar økonomisk effekt.
- Udviklede reviderbare ETL/ELT-datapipelines ved hjælp af Snowflake, Python og dbt og opnåede en reduktion på 92 % i manuel datahåndtering, samtidig med at datakvalitet og overholdelse af lovgivningen blev sikret.
- Samarbejdede med produkt-, salgs- og marketingteams om at designe og implementere dashboards, der overvågede og evaluerede produktlanceringsresultater.
Teknologier:
- Teknologier:
Qlik Sense
Python
SQL
Oracle
Microsoft Power BI
- Data Science
Google Cloud
Pandas
- Data Engineering
Git
Scrapy
Scikit-learn
- ELT
- Data Analytics
PL/SQL
Snowflake
- Data Modeling
ETL
Machine Learning
Streamlit
dbt
Large Language Models (LLM)
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Engineer
Sopra Steria, Belgium - 1 år 2 måneder
- Designede og udviklede end-to-end-datapipelines i Azure og Databricks, integrerede tværfunktionelle datasæt i stor skala og reducerede analysetiden med 40 %.
- Designede og optimerede datamodeller til rapportering på virksomhedsniveau, hvilket sikrede robust datastyring og standardiserede KPI'er på tværs af flere geografiske områder.
- Forbedret konsistens i rapporteringen på tværs af lande, hvilket har reduceret dataafvigelser med 25 % og styrket rapporteringens pålidelighed.
Teknologier:
- Teknologier:
MongoDB
Databricks
Python
SQL
Azure
Azure Blob storage
Microsoft Power BI
- Data Science
Google Cloud
Azure Data Factory
NumPy
Pandas
- Data Engineering
BigQuery
Git
- ELT
Apache Airflow
- Data Analytics
Azure Synapse
Azure Cloud
- Data Modeling
ETL
Machine Learning
Tableau
Streamlit
- NoSQL
dbt
Microsoft Power Automate
Large Language Models (LLM)
Microsoft Fabric
PySpark
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Scientist
University of Trento, Italy - 1 år 9 måneder
- Betydeligt forbedrede datavalideringsprotokoller, der sikrer datasætintegritet for kritiske beslutningsstøttesystemer i overensstemmelse med etiske og ansvarlige AI-standarder.
- Trænede og validerede prædiktive AI/ML-modeller på komplekse biomedicinske datasæt, hvilket forbedrede den diagnostiske nøjagtighed med 5 %.
- Tilpassede analytiske arbejdsgange, så de var skalerbare og klar til skyen inden for Python- og R-frameworks, hvilket reducerede beregningstiden med 53 %.
Teknologier:
- Teknologier:
MongoDB
AWS
Python
SQL
Bash
- Data Science
NumPy
Pandas
R (programming language)
Git
SciPy
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Tableau
- NoSQL
- Data Quality
Microsoft Excel
PhD Statistician
University of Gothenburg, Sweden - 4 flere år 4 måneder
- Udviklet statistiske og maskinelle læringsrammer til højdimensionelle genom- og miljødata, hvilket har resulteret i fem peer-reviewed publikationer.
- Optimerede regressions-, bayesianske og maskinlæringsmodeller til biologiske datasæt, hvilket forbedrede forudsigelsesnøjagtigheden med 12 %.
Teknologier:
- Teknologier:
Python
SQL
Bash
- Data Science
NumPy
Pandas
- Data Engineering
R (programming language)
Git
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Microsoft Power Platform
PySpark
- Data Quality
Microsoft Excel
Uddannelse
Doctor Of PhilosophyStatistics
University of Gothenburg, Sweden · 2016 - 2021
MSc.Computer Science
Uppsala University, Sweden · 2014 - 2016
BSc.Biology
University of Padova, Italy · 2011 - 2014
Portefølje
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage





