NEU
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Samuel P.
Data Scientist
Samuel ist ein erfahrener Daten- und Business Intelligence-Experte mit fünf Jahren Erfahrung in den Bereichen Telekommunikation, Beratung und Biowissenschaften. Als promovierter Statistiker kombiniert er fortschrittliches Modellierungswissen mit praktischer Branchenerfahrung und schlägt so eine effektive Brücke zwischen komplexen Analysen und umsetzbaren Geschäftseinblicken.
Zu seinen wichtigsten Errungenschaften gehört die Entwicklung und Implementierung eines automatisierten Daten-Workflows mit Snowflake, Python und Power BI, der die manuelle Verarbeitung um 90 % reduzierte, die Datenqualität um 20 % verbesserte und innerhalb von zwei Jahren mehr als 10 erfolgreiche Produkteinführungen unterstützte. Diese Innovation verbesserte den unternehmensweiten Datenzugriff und die Entscheidungsfindung erheblich.
Samuel ist für seine Fähigkeit bekannt, komplexe Daten in klare, aussagekräftige Erkenntnisse zu übersetzen. Er fördert eine starke funktionsübergreifende Zusammenarbeit und treibt die datengesteuerte Transformation in allen Geschäftsbereichen konsequent voran.
Hauptkompetenz
- R (programming language) 6 Jahre

- SQL 8 Jahre

- Data Science 6 Jahre
Andere Fähigkeiten
- dbt 4 Jahre

- Data Engineering 3 Jahre
- Oracle 3 Jahre
Ausgewählte Erfahrung
Beschäftigung
Data Scientist
Telenet, Belgium - 1 jahr 4 monate
- Optimierung eines produktionsfähigen Verhaltensklassifizierungsmodells für mehr als 2 Millionen Unternehmen, Identifizierung und Kennzeichnung von Benutzeranomalien mit hohem Risiko, die zu messbaren finanziellen Auswirkungen führten.
- Entwicklung auditierbarer ETL/ELT-Datenpipelines unter Verwendung von Snowflake, Python und dbt, wodurch die manuelle Datenverarbeitung um 92 % reduziert und gleichzeitig die Datenqualität und die Einhaltung gesetzlicher Vorschriften sichergestellt werden konnte.
- Zusammenarbeit mit Produkt-, Vertriebs- und Marketingteams bei der Entwicklung und Bereitstellung von Dashboards zur Überwachung und Bewertung der Produkteinführungsleistung.
Technologien:
- Technologien:
Qlik Sense
Python
SQL
Oracle
Microsoft Power BI
- Data Science
Google Cloud
Pandas
- Data Engineering
Git
Scrapy
Scikit-learn
- ELT
- Data Analytics
PL/SQL
Snowflake
- Data Modeling
ETL
Machine Learning
Streamlit
dbt
Large Language Models (LLM)
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Engineer
Sopra Steria, Belgium - 1 jahr 2 monate
- Entwurf und Entwicklung von End-to-End-Datenpipelines in Azure und Databricks, die funktionsübergreifende Datensätze in großem Umfang integrieren und die Analysezeit um 40 % reduzieren.
- Er entwarf und optimierte Datenmodelle für die Berichterstattung auf Unternehmensebene und sorgte für eine solide Datenverwaltung und standardisierte KPIs in verschiedenen Regionen.
- Verbesserte Konsistenz der länderübergreifenden Berichterstattung, Verringerung der Datendiskrepanzen um 25 % und Erhöhung der Zuverlässigkeit der Berichterstattung.
Technologien:
- Technologien:
MongoDB
Databricks
Python
SQL
Azure
Azure Blob storage
Microsoft Power BI
- Data Science
Google Cloud
Azure Data Factory
NumPy
Pandas
- Data Engineering
BigQuery
Git
- ELT
Apache Airflow
- Data Analytics
Azure Synapse
Azure Cloud
- Data Modeling
ETL
Machine Learning
Tableau
Streamlit
- NoSQL
dbt
Microsoft Power Automate
Large Language Models (LLM)
Microsoft Fabric
PySpark
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Scientist
University of Trento, Italy - 1 jahr 9 monate
- Deutlich verbesserte Datenvalidierungsprotokolle, die die Integrität von Datensätzen für kritische Entscheidungsunterstützungssysteme in Übereinstimmung mit ethischen und verantwortungsvollen KI-Standards gewährleisten.
- Trainierte und validierte prädiktive KI/ML-Modelle auf komplexen biomedizinischen Datensätzen und verbesserte die Diagnosegenauigkeit um 5 %.
- Anpassung der Analyse-Workflows an die Skalierbarkeit und Cloud-Fähigkeit der Python- und R-Frameworks, wodurch die Rechenzeit um 53 % reduziert wurde.
Technologien:
- Technologien:
MongoDB
AWS
Python
SQL
Bash
- Data Science
NumPy
Pandas
R (programming language)
Git
SciPy
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Tableau
- NoSQL
- Data Quality
Microsoft Excel
PhD Statistician
University of Gothenburg, Sweden - 4 jahre 4 monate
- Entwicklung von statistischen und maschinellen Lernverfahren für hochdimensionale Genom- und Umweltdaten, die zu fünf von Experten begutachteten Veröffentlichungen führten.
- Optimierte Regressions-, Bayes'sche und maschinelle Lernmodelle für biologische Datensätze, die die Vorhersagegenauigkeit um 12 % verbessern.
Technologien:
- Technologien:
Python
SQL
Bash
- Data Science
NumPy
Pandas
- Data Engineering
R (programming language)
Git
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Microsoft Power Platform
PySpark
- Data Quality
Microsoft Excel
Ausbildung
Dr. Phil.Statistics
University of Gothenburg, Sweden · 2016 - 2021
MSc.Computer Science
Uppsala University, Sweden · 2014 - 2016
BSc.Biology
University of Padova, Italy · 2011 - 2014
Portfolio
Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten
In einem kurzen 25-minütigen Gespräch würden wir gerne:
- Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
- Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
- Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche





