Samuel P.

Data Scientist

Samuel est un professionnel compétent en matière de données et d'intelligence économique, avec cinq ans d'expérience dans les secteurs des télécommunications, du conseil et des sciences de la vie. Titulaire d'un doctorat en statistiques, il associe une expertise en modélisation avancée à une expérience pratique de l'industrie, comblant ainsi efficacement le fossé entre les analyses complexes et les informations commerciales exploitables.

Parmi ses principales réalisations, Samuel a conçu et mis en œuvre un flux de données automatisé utilisant Snowflake, Python et Power BI, qui a permis de réduire le traitement manuel de 90 %, d'améliorer la qualité des données de 20 % et de soutenir plus de 10 lancements de produits réussis en l'espace de deux ans. Cette innovation a considérablement amélioré l'accès aux données et la prise de décision à l'échelle de l'entreprise.

Reconnu pour sa capacité à traduire des données complexes en idées claires et percutantes, Samuel favorise une collaboration interfonctionnelle solide et conduit constamment des transformations basées sur les données dans toutes les fonctions de l'entreprise.

Principale expertise

  • R (programming language)
    R (programming language) 6 ans
  • SQL
    SQL 8 ans
  • Data Science 6 ans

Autres compétences

  • dbt
    dbt 4 ans
  • Data Engineering 3 ans
  • Oracle
    Oracle 3 ans
Samuel

Samuel P.

Italy

Commencer

Expérience sélectionnée

Emploi

  • Data Scientist

    Telenet, Belgium - 1 an 4 mois

    • Optimisation d'un modèle de classification comportementale de niveau production sur plus de 2 millions d'entités, en identifiant et en signalant les anomalies des utilisateurs à haut risque qui ont eu un impact financier mesurable.
    • Il a développé des pipelines de données ETL/ELT vérifiables en utilisant Snowflake, Python et dbt, ce qui a permis de réduire de 92 % le traitement manuel des données tout en garantissant la qualité des données et la conformité aux réglementations.
    • Collaboration avec les équipes de produits, de ventes et de marketing pour concevoir et déployer des tableaux de bord permettant de contrôler et d'évaluer les performances de lancement des produits.

    Les technologies:

    • Les technologies:
    • Qlik Sense Qlik Sense
    • Python Python
    • SQL SQL
    • Oracle Oracle
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Pandas Pandas
    • Data Engineering
    • Git Git
    • Scrapy Scrapy
    • Scikit-learn Scikit-learn
    • ELT
    • Data Analytics
    • PL/SQL PL/SQL
    • Snowflake Snowflake
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Streamlit Streamlit
    • dbt dbt
    • Large Language Models (LLM) Large Language Models (LLM)
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Engineer

    Sopra Steria, Belgium - 1 an 2 mois

    • Conception et développement de pipelines de données de bout en bout dans Azure et Databricks, intégrant des ensembles de données interfonctionnels à grande échelle et réduisant le temps d'analyse de 40 %.
    • Conception et optimisation de modèles de données pour l'établissement de rapports au niveau de l'entreprise, garantissant une solide gouvernance des données et des indicateurs de performance standardisés dans plusieurs zones géographiques.
    • Amélioration de la cohérence des rapports entre les pays, réduction de 25 % des divergences entre les données et renforcement de la fiabilité des rapports.

    Les technologies:

    • Les technologies:
    • MongoDB MongoDB
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Azure
    • Azure Blob storage Azure Blob storage
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Azure Data Factory Azure Data Factory
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • BigQuery BigQuery
    • Git Git
    • ELT
    • Apache Airflow Apache Airflow
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Azure Cloud Azure Cloud
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Tableau Tableau
    • Streamlit Streamlit
    • NoSQL
    • dbt dbt
    • Microsoft Power Automate Microsoft Power Automate
    • Large Language Models (LLM) Large Language Models (LLM)
    • Microsoft Fabric Microsoft Fabric
    • PySpark PySpark
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Scientist

    University of Trento, Italy - 1 an 9 mois

    • Amélioration significative des protocoles de validation des données, garantissant l'intégrité des ensembles de données pour les systèmes d'aide à la décision critiques, conformément aux normes de l'IA éthique et responsable.
    • Formation et validation de modèles prédictifs d'IA/ML sur des ensembles de données biomédicales complexes, ce qui a permis d'améliorer la précision des diagnostics de 5 %.
    • Adaptation des flux de travail analytiques pour qu'ils soient évolutifs et prêts pour le cloud dans les cadres Python et R, ce qui a permis de réduire le temps de calcul de 53 %.

    Les technologies:

    • Les technologies:
    • MongoDB MongoDB
    • AWS AWS
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Git Git
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Tableau Tableau
    • NoSQL
    • Data Quality
    • Microsoft Excel Microsoft Excel
  • PhD Statistician

    University of Gothenburg, Sweden - 4 années 4 mois

    • Il a développé des cadres statistiques et d'apprentissage automatique pour les données génomiques et environnementales de haute dimension, ce qui a donné lieu à cinq publications évaluées par des pairs.
    • Optimisation des modèles de régression, bayésiens et d'apprentissage automatique pour les ensembles de données biologiques, améliorant la précision prédictive de 12 %.

    Les technologies:

    • Les technologies:
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • R (programming language) R (programming language)
    • Git Git
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Microsoft Power Platform Microsoft Power Platform
    • PySpark PySpark
    • Data Quality
    • Microsoft Excel Microsoft Excel

Éducation

  • DoctoratStatistics

    University of Gothenburg, Sweden · 2016 - 2021

  • Maîtrise ès sciencesComputer Science

    Uppsala University, Sweden · 2014 - 2016

  • License ès sciencesBiology

    University of Padova, Italy · 2011 - 2014

Portefeuille

  • Breweries Go-To-Market - 1
  • Breweries Go-To-Market - 2
  • Telecom Initiative Performance Dashboard - 1
  • Telecom Initiative Performance Dashboard - 2
  • Outlook Calendar Notes - 1

Trouvez votre prochain développeur en quelques jours et non sur plusieurs mois

Dans un court appel de 25 minutes, nous voulons:

  • Comprendre vos besoins en développement
  • Vous expliquez comment nous allons vous mettre en relation avec le développeur le mieux qualifié pour votre projet, sélectionné avec soin
  • Vous indiquez nos prochaines démarches afin de vous trouver le meilleur développeur, souvent en moins d'une semaine

Contactez-nous