NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
Samuel P.
Data Scientist
Samuel on ammattitaitoinen data- ja Business Intelligence -asiantuntija, jolla on viiden vuoden kokemus telekommunikaatio-, konsultointi- ja biotieteiden aloilta. Tilastotieteen tohtorin tutkinnon suorittaneena hän yhdistää kehittyneen mallinnusosaamisen ja käytännön kokemuksen alalta ja kuroo tehokkaasti umpeen kuilun monimutkaisten analyysien ja käyttökelpoisten liiketoimintatietojen välillä.
Hänen tärkeimpiin saavutuksiinsa kuuluu, että Samuel suunnitteli ja toteutti Snowflakea, Pythonia ja Power BI:tä hyödyntävän automatisoidun datan työnkulun, joka vähensi manuaalista käsittelyä 90 %, paransi datan laatua 20 % ja tuki yli 10 onnistunutta tuotelanseerausta kahden vuoden aikana. Tämä innovaatio paransi merkittävästi koko yrityksen tietojen saatavuutta ja päätöksentekoa.
Samuel on saanut tunnustusta kyvystään muuntaa monimutkaiset tiedot selkeiksi ja vaikuttaviksi oivalluksiksi, ja hän edistää vahvaa monialaista yhteistyötä ja edistää johdonmukaisesti tietoon perustuvaa muutosta liiketoimintatoiminnoissa.
Tärkein asiantuntemus
- R (programming language) 6 vuotta

- SQL 8 vuotta

- Data Science 6 vuotta
Muut taidot
- dbt 4 vuotta

- Data Engineering 3 vuotta
- Oracle 3 vuotta
Valittu kokemus
Työllisyys
Data Scientist
Telenet, Belgium - 1 year 4 months
- Optimoitiin tuotantokelpoinen käyttäytymisen luokittelumalli yli 2 miljoonan yksikön osalta tunnistamalla ja merkitsemällä riskialttiit käyttäjäpoikkeamat, jotka johtivat mitattavissa oleviin taloudellisiin vaikutuksiin.
- Kehitti Snowflakea, Pythonia ja dbt:tä hyödyntäviä auditoitavia ETL/ELT-tietoputkia, joiden avulla manuaalista tietojenkäsittelyä vähennettiin 92 prosenttia ja samalla varmistettiin tietojen laatu ja säännösten noudattaminen.
- Yhteistyössä tuote-, myynti- ja markkinointitiimien kanssa suunnitteli ja otti käyttöön mittareita, joilla seurattiin ja arvioitiin tuotteen lanseerauksen suorituskykyä.
Tekniikat:
- Tekniikat:
Qlik Sense
Python
SQL
Oracle
Microsoft Power BI
- Data Science
Google Cloud
Pandas
- Data Engineering
Git
Scrapy
Scikit-learn
- ELT
- Data Analytics
PL/SQL
Snowflake
- Data Modeling
ETL
Machine Learning
Streamlit
dbt
Large Language Models (LLM)
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Engineer
Sopra Steria, Belgium - 1 year 2 months
- Suunnitteli ja kehitti kokonaisvaltaisia dataputkia Azuressa ja Databricksissa, integroi monialaisia tietokokonaisuuksia mittakaavassa ja lyhensi analyysiin kuluvaa aikaa 40 prosenttia.
- Suunnitteli ja optimoi tietomalleja yritystason raportointia varten varmistaen vankan tiedonhallinnan ja standardoidut tunnusluvut useilla eri maantieteellisillä alueilla.
- Parannettiin raportoinnin johdonmukaisuutta eri maiden välillä, vähennettiin tietojen eroavaisuuksia 25 prosentilla ja vahvistettiin raportoinnin luotettavuutta.
Tekniikat:
- Tekniikat:
MongoDB
Databricks
Python
SQL
Azure
Azure Blob storage
Microsoft Power BI
- Data Science
Google Cloud
Azure Data Factory
NumPy
Pandas
- Data Engineering
BigQuery
Git
- ELT
Apache Airflow
- Data Analytics
Azure Synapse
Azure Cloud
- Data Modeling
ETL
Machine Learning
Tableau
Streamlit
- NoSQL
dbt
Microsoft Power Automate
Large Language Models (LLM)
Microsoft Fabric
PySpark
- Data Quality
GitHub Copilot
- DAX
Microsoft Excel
Data Scientist
University of Trento, Italy - 1 year 9 months
- Tietojen validointiprotokollia on parannettu merkittävästi, mikä varmistaa kriittisten päätöksenteon tukijärjestelmien tietokokonaisuuksien eettisten ja vastuullisten tekoälystandardien mukaisesti.
- Koulutti ja validoi ennakoivia AI/ML-malleja monimutkaisissa biolääketieteellisissä tietokokonaisuuksissa, mikä paransi diagnoositarkkuutta 5 %.
- Mukauttamalla analyyttiset työnkulut skaalautuviksi ja pilvipalveluihin soveltuviksi Python- ja R-kehysten avulla, mikä lyhensi laskenta-aikaa 53 prosenttia.
Tekniikat:
- Tekniikat:
MongoDB
AWS
Python
SQL
Bash
- Data Science
NumPy
Pandas
R (programming language)
Git
SciPy
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Tableau
- NoSQL
- Data Quality
Microsoft Excel
PhD Statistician
University of Gothenburg, Sweden - 4 years 4 months
- Kehitti tilastollisia ja koneoppimisjärjestelmiä korkea-ulotteisia genomi- ja ympäristötietoja varten, minkä tuloksena syntyi viisi vertaisarvioitua julkaisua.
- Optimoi regressio-, Bayes- ja koneoppimismalleja biologisia tietokokonaisuuksia varten ja paransi ennustetarkkuutta 12 %.
Tekniikat:
- Tekniikat:
Python
SQL
Bash
- Data Science
NumPy
Pandas
- Data Engineering
R (programming language)
Git
Scikit-learn
- Data Analytics
- Data Modeling
Machine Learning
Microsoft Power Platform
PySpark
- Data Quality
Microsoft Excel
Koulutus
Doctor Of PhilosophyStatistics
University of Gothenburg, Sweden · 2016 - 2021
MSc.Computer Science
Uppsala University, Sweden · 2014 - 2016
BSc.Biology
University of Padova, Italy · 2011 - 2014
Portfolio
Löydä seuraava kehittäjäsi päivien, ei kuukausien sisällä
Kun otat yhteyttä, järjestämme lyhyen 25 minuuttia kestävän tapaamisen, jonka aikana:
- Kartoitamme yrityksenne kehitystarvetta
- Kertoa prosessimme, jolla löydämme teille pätevän, ennakkotarkastetun kehittäjän verkostostamme
- Käymme läpi askeleet, joilla oikea ehdokas pääsee aloittamaan – useimmiten viikon sisällä





