NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Samuel P.
Data Scientist
Samuel is een ervaren Data en Business Intelligence professional met vijf jaar ervaring in de telecom, consulting en life sciences sectoren. Hij is gepromoveerd in de statistiek en combineert geavanceerde modelleringsexpertise met praktische branche-ervaring, waardoor hij op effectieve wijze de kloof overbrugt tussen complexe analyses en bruikbare zakelijke inzichten.
Samuel heeft onder andere een geautomatiseerde gegevensworkflow ontworpen en geïmplementeerd met Snowflake, Python en Power BI, waardoor handmatige verwerking met 90% is verminderd, de gegevenskwaliteit met 20% is verbeterd en meer dan 10 succesvolle productlanceringen binnen twee jaar zijn ondersteund. Deze innovatie heeft de toegankelijkheid van bedrijfsgegevens en de besluitvorming aanzienlijk verbeterd.
Samuel staat bekend om zijn vermogen om complexe gegevens om te zetten in duidelijke inzichten met een grote impact. Hij bevordert een sterke samenwerking tussen verschillende functies en stimuleert consequent datagestuurde transformatie binnen alle bedrijfsfuncties.
Hoofd expertise
- R (programming language) 6 jaar

- SQL 8 jaar

- Data Science 6 jaar
Andere vaardigheden
- dbt 4 jaar

- Data Engineering 3 jaar
- Oracle 3 jaar
Geselecteerde ervaring
Dienstverband
Data Scientist
Telenet, Belgium - 1 jaar 4 maanden
- Optimaliseerde een gedragsclassificatiemodel op productieniveau voor meer dan 2 miljoen entiteiten, waarbij anomalieën met een hoog risico voor gebruikers werden geïdentificeerd en gemarkeerd, wat een meetbare financiële impact had.
- Ontwikkelde controleerbare ETL/ELT-datapijplijnen met Snowflake, Python en dbt, waardoor de handmatige gegevensverwerking met 92% werd teruggebracht, terwijl de kwaliteit van de gegevens en de naleving van de regelgeving werden gewaarborgd.
- Werkte samen met de teams van Product, Sales en Marketing om dashboards te ontwerpen en te implementeren die de prestaties van de productlancering bewaakten en evalueerden.
Technologieën:
- Technologieën:
Qlik Sense
Python
SQL
Oracle
Microsoft Power BI
- Data Science
Google Cloud
Pandas
- Data Engineering
Git
Scrapy
Scikit-learn
- ELT
- Data Analytics
PL/SQL
Snowflake
- Data Modeling
ETL
Machine Learning
Streamlit
dbt
Large Language Models (LLM)
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Engineer
Sopra Steria, Belgium - 1 jaar 2 maanden
- Ontwierp en ontwikkelde end-to-end data pipelines in Azure en Databricks, integreerde cross-functionele datasets op schaal en verkortte de analysetijd met 40%.
- Ontwierp en optimaliseerde datamodellen voor rapportages op bedrijfsniveau, zorgde voor robuuste datagovernance en gestandaardiseerde KPI's in meerdere regio's.
- Verbeterde rapportageconsistentie tussen landen, waardoor gegevensdiscrepanties met 25% zijn verminderd en de betrouwbaarheid van de rapportage is verbeterd.
Technologieën:
- Technologieën:
MongoDB
Databricks
Python
SQL
Azure
Azure Blob storage
Microsoft Power BI
- Data Science
Google Cloud
Azure Data Factory
NumPy
Pandas
- Data Engineering
BigQuery
Git
- ELT
Apache Airflow
- Data Analytics
Azure Synapse
Azure Cloud
- Data Modeling
ETL
Machine Learning
Tableau
Streamlit
- NoSQL
dbt
Microsoft Power Automate
Large Language Models (LLM)
Microsoft Fabric
PySpark
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Scientist
University of Trento, Italy - 1 jaar 9 maanden
- Aanzienlijk verbeterde datavalidatieprotocollen, waardoor de integriteit van datasets voor kritieke beslissingsondersteunende systemen wordt gewaarborgd in overeenstemming met de normen voor ethische en verantwoorde AI.
- Getrainde en gevalideerde voorspellende AI/ML-modellen op complexe biomedische datasets, waardoor de diagnostische nauwkeurigheid met 5% verbeterde.
- Analytische workflows aangepast zodat ze schaalbaar en cloud-ready zijn binnen Python en R frameworks, waardoor de rekentijd met 53% is afgenomen.
Technologieën:
- Technologieën:
MongoDB
AWS
Python
SQL
Bash
- Data Science
NumPy
Pandas
R (programming language)
Git
SciPy
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Tableau
- NoSQL
- Data Quality
Microsoft Excel
PhD Statistician
University of Gothenburg, Sweden - 4 jaar 4 maanden
- Ontwikkelde statistische en machine learning raamwerken voor hoog-dimensionale genomische en omgevingsgegevens, wat resulteerde in vijf peer-reviewed publicaties.
- Geoptimaliseerde regressie-, Bayesiaanse en machine learning-modellen voor biologische datasets, waardoor de voorspellende nauwkeurigheid met 12% is verbeterd.
Technologieën:
- Technologieën:
Python
SQL
Bash
- Data Science
NumPy
Pandas
- Data Engineering
R (programming language)
Git
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Microsoft Power Platform
PySpark
- Data Quality
Microsoft Excel
Educatie
Doctor Of PhilosophyStatistics
University of Gothenburg, Sweden · 2016 - 2021
MSc.Computer Science
Uppsala University, Sweden · 2014 - 2016
BSc.Biology
University of Padova, Italy · 2011 - 2014
Portefeuille
Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden
In een kort gesprek van 25 minuten:
- gaan we in op wat je nodig hebt om je product te ontwikkelen;
- Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
- delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.





