NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Samuel P.
Data Scientist
Samuel est un professionnel compétent en matière de données et d'intelligence économique, avec cinq ans d'expérience dans les secteurs des télécommunications, du conseil et des sciences de la vie. Titulaire d'un doctorat en statistiques, il associe une expertise en modélisation avancée à une expérience pratique de l'industrie, comblant ainsi efficacement le fossé entre les analyses complexes et les informations commerciales exploitables.
Parmi ses principales réalisations, Samuel a conçu et mis en œuvre un flux de données automatisé utilisant Snowflake, Python et Power BI, qui a permis de réduire le traitement manuel de 90 %, d'améliorer la qualité des données de 20 % et de soutenir plus de 10 lancements de produits réussis en l'espace de deux ans. Cette innovation a considérablement amélioré l'accès aux données et la prise de décision à l'échelle de l'entreprise.
Reconnu pour sa capacité à traduire des données complexes en idées claires et percutantes, Samuel favorise une collaboration interfonctionnelle solide et conduit constamment des transformations basées sur les données dans toutes les fonctions de l'entreprise.
Principale expertise
- R (programming language) 6 ans

- SQL 8 ans

- Data Science 6 ans
Autres compétences
- dbt 4 ans

- Data Engineering 3 ans
- Oracle 3 ans
Expérience sélectionnée
Emploi
Data Scientist
Telenet, Belgium - 1 an 4 mois
- Optimisation d'un modèle de classification comportementale de niveau production sur plus de 2 millions d'entités, en identifiant et en signalant les anomalies des utilisateurs à haut risque qui ont eu un impact financier mesurable.
- Il a développé des pipelines de données ETL/ELT vérifiables en utilisant Snowflake, Python et dbt, ce qui a permis de réduire de 92 % le traitement manuel des données tout en garantissant la qualité des données et la conformité aux réglementations.
- Collaboration avec les équipes de produits, de ventes et de marketing pour concevoir et déployer des tableaux de bord permettant de contrôler et d'évaluer les performances de lancement des produits.
Les technologies:
- Les technologies:
Qlik Sense
Python
SQL
Oracle
Microsoft Power BI
- Data Science
Google Cloud
Pandas
- Data Engineering
Git
Scrapy
Scikit-learn
- ELT
- Data Analytics
PL/SQL
Snowflake
- Data Modeling
ETL
Machine Learning
Streamlit
dbt
Large Language Models (LLM)
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Engineer
Sopra Steria, Belgium - 1 an 2 mois
- Conception et développement de pipelines de données de bout en bout dans Azure et Databricks, intégrant des ensembles de données interfonctionnels à grande échelle et réduisant le temps d'analyse de 40 %.
- Conception et optimisation de modèles de données pour l'établissement de rapports au niveau de l'entreprise, garantissant une solide gouvernance des données et des indicateurs de performance standardisés dans plusieurs zones géographiques.
- Amélioration de la cohérence des rapports entre les pays, réduction de 25 % des divergences entre les données et renforcement de la fiabilité des rapports.
Les technologies:
- Les technologies:
MongoDB
Databricks
Python
SQL
Azure
Azure Blob storage
Microsoft Power BI
- Data Science
Google Cloud
Azure Data Factory
NumPy
Pandas
- Data Engineering
BigQuery
Git
- ELT
Apache Airflow
- Data Analytics
Azure Synapse
Azure Cloud
- Data Modeling
ETL
Machine Learning
Tableau
Streamlit
- NoSQL
dbt
Microsoft Power Automate
Large Language Models (LLM)
Microsoft Fabric
PySpark
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Scientist
University of Trento, Italy - 1 an 9 mois
- Amélioration significative des protocoles de validation des données, garantissant l'intégrité des ensembles de données pour les systèmes d'aide à la décision critiques, conformément aux normes de l'IA éthique et responsable.
- Formation et validation de modèles prédictifs d'IA/ML sur des ensembles de données biomédicales complexes, ce qui a permis d'améliorer la précision des diagnostics de 5 %.
- Adaptation des flux de travail analytiques pour qu'ils soient évolutifs et prêts pour le cloud dans les cadres Python et R, ce qui a permis de réduire le temps de calcul de 53 %.
Les technologies:
- Les technologies:
MongoDB
AWS
Python
SQL
Bash
- Data Science
NumPy
Pandas
R (programming language)
Git
SciPy
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Tableau
- NoSQL
- Data Quality
Microsoft Excel
PhD Statistician
University of Gothenburg, Sweden - 4 années 4 mois
- Il a développé des cadres statistiques et d'apprentissage automatique pour les données génomiques et environnementales de haute dimension, ce qui a donné lieu à cinq publications évaluées par des pairs.
- Optimisation des modèles de régression, bayésiens et d'apprentissage automatique pour les ensembles de données biologiques, améliorant la précision prédictive de 12 %.
Les technologies:
- Les technologies:
Python
SQL
Bash
- Data Science
NumPy
Pandas
- Data Engineering
R (programming language)
Git
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Microsoft Power Platform
PySpark
- Data Quality
Microsoft Excel
Éducation
DoctoratStatistics
University of Gothenburg, Sweden · 2016 - 2021
Maîtrise ès sciencesComputer Science
Uppsala University, Sweden · 2014 - 2016
License ès sciencesBiology
University of Padova, Italy · 2011 - 2014
Portefeuille
Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois
Dans un court appel de 25 minutes, nous voulons:
- Comprendre vos besoins en développement
- Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
- Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine





