Samuel P.

Data Scientist

Samuel is een ervaren Data en Business Intelligence professional met vijf jaar ervaring in de telecom, consulting en life sciences sectoren. Hij is gepromoveerd in de statistiek en combineert geavanceerde modelleringsexpertise met praktische branche-ervaring, waardoor hij op effectieve wijze de kloof overbrugt tussen complexe analyses en bruikbare zakelijke inzichten.

Samuel heeft onder andere een geautomatiseerde gegevensworkflow ontworpen en geïmplementeerd met Snowflake, Python en Power BI, waardoor handmatige verwerking met 90% is verminderd, de gegevenskwaliteit met 20% is verbeterd en meer dan 10 succesvolle productlanceringen binnen twee jaar zijn ondersteund. Deze innovatie heeft de toegankelijkheid van bedrijfsgegevens en de besluitvorming aanzienlijk verbeterd.

Samuel staat bekend om zijn vermogen om complexe gegevens om te zetten in duidelijke inzichten met een grote impact. Hij bevordert een sterke samenwerking tussen verschillende functies en stimuleert consequent datagestuurde transformatie binnen alle bedrijfsfuncties.

Hoofd expertise

  • R (programming language)
    R (programming language) 6 jaar
  • SQL
    SQL 8 jaar
  • Data Science 6 jaar

Andere vaardigheden

  • dbt
    dbt 4 jaar
  • Data Engineering 3 jaar
  • Oracle
    Oracle 3 jaar
Samuel

Samuel P.

Italy

Aan de slag

Geselecteerde ervaring

Dienstverband

  • Data Scientist

    Telenet, Belgium - 1 jaar 4 maanden

    • Optimaliseerde een gedragsclassificatiemodel op productieniveau voor meer dan 2 miljoen entiteiten, waarbij anomalieën met een hoog risico voor gebruikers werden geïdentificeerd en gemarkeerd, wat een meetbare financiële impact had.
    • Ontwikkelde controleerbare ETL/ELT-datapijplijnen met Snowflake, Python en dbt, waardoor de handmatige gegevensverwerking met 92% werd teruggebracht, terwijl de kwaliteit van de gegevens en de naleving van de regelgeving werden gewaarborgd.
    • Werkte samen met de teams van Product, Sales en Marketing om dashboards te ontwerpen en te implementeren die de prestaties van de productlancering bewaakten en evalueerden.

    Technologieën:

    • Technologieën:
    • Qlik Sense Qlik Sense
    • Python Python
    • SQL SQL
    • Oracle Oracle
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Pandas Pandas
    • Data Engineering
    • Git Git
    • Scrapy Scrapy
    • Scikit-learn Scikit-learn
    • ELT
    • Data Analytics
    • PL/SQL PL/SQL
    • Snowflake Snowflake
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Streamlit Streamlit
    • dbt dbt
    • Large Language Models (LLM) Large Language Models (LLM)
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Engineer

    Sopra Steria, Belgium - 1 jaar 2 maanden

    • Ontwierp en ontwikkelde end-to-end data pipelines in Azure en Databricks, integreerde cross-functionele datasets op schaal en verkortte de analysetijd met 40%.
    • Ontwierp en optimaliseerde datamodellen voor rapportages op bedrijfsniveau, zorgde voor robuuste datagovernance en gestandaardiseerde KPI's in meerdere regio's.
    • Verbeterde rapportageconsistentie tussen landen, waardoor gegevensdiscrepanties met 25% zijn verminderd en de betrouwbaarheid van de rapportage is verbeterd.

    Technologieën:

    • Technologieën:
    • MongoDB MongoDB
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Azure
    • Azure Blob storage Azure Blob storage
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Azure Data Factory Azure Data Factory
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • BigQuery BigQuery
    • Git Git
    • ELT
    • Apache Airflow Apache Airflow
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Azure Cloud Azure Cloud
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Tableau Tableau
    • Streamlit Streamlit
    • NoSQL
    • dbt dbt
    • Microsoft Power Automate Microsoft Power Automate
    • Large Language Models (LLM) Large Language Models (LLM)
    • Microsoft Fabric Microsoft Fabric
    • PySpark PySpark
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Scientist

    University of Trento, Italy - 1 jaar 9 maanden

    • Aanzienlijk verbeterde datavalidatieprotocollen, waardoor de integriteit van datasets voor kritieke beslissingsondersteunende systemen wordt gewaarborgd in overeenstemming met de normen voor ethische en verantwoorde AI.
    • Getrainde en gevalideerde voorspellende AI/ML-modellen op complexe biomedische datasets, waardoor de diagnostische nauwkeurigheid met 5% verbeterde.
    • Analytische workflows aangepast zodat ze schaalbaar en cloud-ready zijn binnen Python en R frameworks, waardoor de rekentijd met 53% is afgenomen.

    Technologieën:

    • Technologieën:
    • MongoDB MongoDB
    • AWS AWS
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Git Git
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Tableau Tableau
    • NoSQL
    • Data Quality
    • Microsoft Excel Microsoft Excel
  • PhD Statistician

    University of Gothenburg, Sweden - 4 jaar 4 maanden

    • Ontwikkelde statistische en machine learning raamwerken voor hoog-dimensionale genomische en omgevingsgegevens, wat resulteerde in vijf peer-reviewed publicaties.
    • Geoptimaliseerde regressie-, Bayesiaanse en machine learning-modellen voor biologische datasets, waardoor de voorspellende nauwkeurigheid met 12% is verbeterd.

    Technologieën:

    • Technologieën:
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • R (programming language) R (programming language)
    • Git Git
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Microsoft Power Platform Microsoft Power Platform
    • PySpark PySpark
    • Data Quality
    • Microsoft Excel Microsoft Excel

Educatie

  • Doctor Of PhilosophyStatistics

    University of Gothenburg, Sweden · 2016 - 2021

  • MSc.Computer Science

    Uppsala University, Sweden · 2014 - 2016

  • BSc.Biology

    University of Padova, Italy · 2011 - 2014

Portefeuille

  • Breweries Go-To-Market - 1
  • Breweries Go-To-Market - 2
  • Telecom Initiative Performance Dashboard - 1
  • Telecom Initiative Performance Dashboard - 2
  • Outlook Calendar Notes - 1

Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden

In een kort gesprek van 25 minuten:

  • gaan we in op wat je nodig hebt om je product te ontwikkelen;
  • Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
  • delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.

Maak een afspraak