Samuel P.

Data Scientist

Samuel ist ein erfahrener Daten- und Business Intelligence-Experte mit fünf Jahren Erfahrung in den Bereichen Telekommunikation, Beratung und Biowissenschaften. Als promovierter Statistiker kombiniert er fortschrittliches Modellierungswissen mit praktischer Branchenerfahrung und schlägt so eine effektive Brücke zwischen komplexen Analysen und umsetzbaren Geschäftseinblicken.

Zu seinen wichtigsten Errungenschaften gehört die Entwicklung und Implementierung eines automatisierten Daten-Workflows mit Snowflake, Python und Power BI, der die manuelle Verarbeitung um 90 % reduzierte, die Datenqualität um 20 % verbesserte und innerhalb von zwei Jahren mehr als 10 erfolgreiche Produkteinführungen unterstützte. Diese Innovation verbesserte den unternehmensweiten Datenzugriff und die Entscheidungsfindung erheblich.

Samuel ist für seine Fähigkeit bekannt, komplexe Daten in klare, aussagekräftige Erkenntnisse zu übersetzen. Er fördert eine starke funktionsübergreifende Zusammenarbeit und treibt die datengesteuerte Transformation in allen Geschäftsbereichen konsequent voran.

Hauptkompetenz

  • R (programming language)
    R (programming language) 6 Jahre
  • SQL
    SQL 8 Jahre
  • Data Science 6 Jahre

Andere Fähigkeiten

  • dbt
    dbt 4 Jahre
  • Data Engineering 3 Jahre
  • Oracle
    Oracle 3 Jahre
Samuel

Samuel P.

Italy

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

  • Data Scientist

    Telenet, Belgium - 1 jahr 4 monate

    • Optimierung eines produktionsfähigen Verhaltensklassifizierungsmodells für mehr als 2 Millionen Unternehmen, Identifizierung und Kennzeichnung von Benutzeranomalien mit hohem Risiko, die zu messbaren finanziellen Auswirkungen führten.
    • Entwicklung auditierbarer ETL/ELT-Datenpipelines unter Verwendung von Snowflake, Python und dbt, wodurch die manuelle Datenverarbeitung um 92 % reduziert und gleichzeitig die Datenqualität und die Einhaltung gesetzlicher Vorschriften sichergestellt werden konnte.
    • Zusammenarbeit mit Produkt-, Vertriebs- und Marketingteams bei der Entwicklung und Bereitstellung von Dashboards zur Überwachung und Bewertung der Produkteinführungsleistung.

    Technologien:

    • Technologien:
    • Qlik Sense Qlik Sense
    • Python Python
    • SQL SQL
    • Oracle Oracle
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Pandas Pandas
    • Data Engineering
    • Git Git
    • Scrapy Scrapy
    • Scikit-learn Scikit-learn
    • ELT
    • Data Analytics
    • PL/SQL PL/SQL
    • Snowflake Snowflake
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Streamlit Streamlit
    • dbt dbt
    • Large Language Models (LLM) Large Language Models (LLM)
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Engineer

    Sopra Steria, Belgium - 1 jahr 2 monate

    • Entwurf und Entwicklung von End-to-End-Datenpipelines in Azure und Databricks, die funktionsübergreifende Datensätze in großem Umfang integrieren und die Analysezeit um 40 % reduzieren.
    • Er entwarf und optimierte Datenmodelle für die Berichterstattung auf Unternehmensebene und sorgte für eine solide Datenverwaltung und standardisierte KPIs in verschiedenen Regionen.
    • Verbesserte Konsistenz der länderübergreifenden Berichterstattung, Verringerung der Datendiskrepanzen um 25 % und Erhöhung der Zuverlässigkeit der Berichterstattung.

    Technologien:

    • Technologien:
    • MongoDB MongoDB
    • Databricks Databricks
    • Python Python
    • SQL SQL
    • Azure Azure
    • Azure Blob storage Azure Blob storage
    • Microsoft Power BI Microsoft Power BI
    • Data Science
    • Google Cloud Google Cloud
    • Azure Data Factory Azure Data Factory
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • BigQuery BigQuery
    • Git Git
    • ELT
    • Apache Airflow Apache Airflow
    • Data Analytics
    • Azure Synapse Azure Synapse
    • Azure Cloud Azure Cloud
    • Data Modeling
    • ETL ETL
    • Machine Learning Machine Learning
    • Tableau Tableau
    • Streamlit Streamlit
    • NoSQL
    • dbt dbt
    • Microsoft Power Automate Microsoft Power Automate
    • Large Language Models (LLM) Large Language Models (LLM)
    • Microsoft Fabric Microsoft Fabric
    • PySpark PySpark
    • Data Quality
    • GitHub Copilot GitHub Copilot
    • DAX
    • Microsoft Excel Microsoft Excel
  • Data Scientist

    University of Trento, Italy - 1 jahr 9 monate

    • Deutlich verbesserte Datenvalidierungsprotokolle, die die Integrität von Datensätzen für kritische Entscheidungsunterstützungssysteme in Übereinstimmung mit ethischen und verantwortungsvollen KI-Standards gewährleisten.
    • Trainierte und validierte prädiktive KI/ML-Modelle auf komplexen biomedizinischen Datensätzen und verbesserte die Diagnosegenauigkeit um 5 %.
    • Anpassung der Analyse-Workflows an die Skalierbarkeit und Cloud-Fähigkeit der Python- und R-Frameworks, wodurch die Rechenzeit um 53 % reduziert wurde.

    Technologien:

    • Technologien:
    • MongoDB MongoDB
    • AWS AWS
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • R (programming language) R (programming language)
    • Git Git
    • SciPy SciPy
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Tableau Tableau
    • NoSQL
    • Data Quality
    • Microsoft Excel Microsoft Excel
  • PhD Statistician

    University of Gothenburg, Sweden - 4 jahre 4 monate

    • Entwicklung von statistischen und maschinellen Lernverfahren für hochdimensionale Genom- und Umweltdaten, die zu fünf von Experten begutachteten Veröffentlichungen führten.
    • Optimierte Regressions-, Bayes'sche und maschinelle Lernmodelle für biologische Datensätze, die die Vorhersagegenauigkeit um 12 % verbessern.

    Technologien:

    • Technologien:
    • Python Python
    • SQL SQL
    • Bash Bash
    • Data Science
    • NumPy NumPy
    • Pandas Pandas
    • Data Engineering
    • R (programming language) R (programming language)
    • Git Git
    • Scikit-learn Scikit-learn
    • Data Analytics
    • Data Modeling
    • Machine Learning Machine Learning
    • Microsoft Power Platform Microsoft Power Platform
    • PySpark PySpark
    • Data Quality
    • Microsoft Excel Microsoft Excel

Ausbildung

  • Dr. Phil.Statistics

    University of Gothenburg, Sweden · 2016 - 2021

  • MSc.Computer Science

    Uppsala University, Sweden · 2014 - 2016

  • BSc.Biology

    University of Padova, Italy · 2011 - 2014

Portfolio

  • Breweries Go-To-Market - 1
  • Breweries Go-To-Market - 2
  • Telecom Initiative Performance Dashboard - 1
  • Telecom Initiative Performance Dashboard - 2
  • Outlook Calendar Notes - 1

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

  • Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
  • Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
  • Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Unterhalten wir uns