NEW
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
João M.
Deep Learning Research Engineer
João is een Deep Learning Engineer bij ASML met meer dan 10 jaar ervaring in kunstmatige intelligentie.
Hij is gespecialiseerd in het bouwen van geavanceerde modellen, waaronder large language models (LLM’s), die in staat zijn tot code-refactoring, bugdetectie en continual learning. João werkt intensief met PyTorch en implementeert modellen op cloudplatforms en high-performance computing-systemen.
Voor zijn tijd bij ASML leidde hij onderzoeksteams bij GAIPS Lab, publiceerde hij op toonaangevende AI-conferenties en verkreeg hij competitieve onderzoeksbeurzen van de U.S. Air Force en FCT. Daarnaast gaf hij AI-cursussen en ontving hij een Teaching Excellence Award voor zijn bijdragen aan het onderwijs.
João’s belangrijkste projecten omvatten het ontwikkelen van technieken voor continual learning, waarmee AI nieuwe kennis kan verwerven zonder eerdere taken te vergeten, en het toepassen van reinforcement learning om modellen efficiënter te trainen met minder data. Hij is gepassioneerd over het effectiever, praktischer en voortdurend verbeterend maken van AI-systemen.
Hoofd expertise
- Python 10 jaar

- Machine Learning 10 jaar

- Data Science 10 jaar
Andere vaardigheden
Geselecteerde ervaring
Dienstverband
AI Researcher
Utrecht University - 4 maanden
Developing a production-oriented AI system for personalised patient interventions in dementia care, combining reinforcement learning with large language models. Designed and built ToneRL, a hybrid architecture where a lightweight RL agent learns to control an LLM’s output in real time, adapting communication style to individual patients based on clinical feedback, without retraining or modifying the underlying model. Collaborating directly with clinicians and linguists to ensure outputs meet clinical communication standards. The architecture is designed for scalable deployment: one frozen base model serves all patients, with per-patient adaptation handled by lightweight policy instances requiring minimal compute.
Technologieën:
- Technologieën:
MongoDB
Docker
- Project Management
- Budget Management
Python
C
C++
- Data Science
TensorFlow
NumPy
OpenCV
Keras
Pandas
- MLOps
Open source
LaTeX
PyTorch
PyCharm
- Unit Testing
JUnit
Git
Unix
SciPy
Scikit-learn
Matplotlib
Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
Machine Learning
- Performance Testing
- Computer Vision
Cuda
OpenAI API
- Prompt Engineering
Ollama
- Neural Network
Security
Large Language Models (LLM)
Hugging Face Transformers
- JAX
- MLflow
PyTorch Lightning
Hugging Face
- LoRA
- QLoRA
AI
AI Engineering
vLLM
Agentic AI
Deep Learning Research Engineer
ASML - 1 jaar 2 maanden
- Led een onderzoeksteam over de "LM's for Software Engineering" project, gericht op technische schuldvermindering, foutopsporing en documentatie analyse met behulp van grote taalmodellen.
- Ontworpen, geïmplementeerd, getraind, getest en ingezette LLMs voor automatische code-refactoring en bug detectie.
- Gebruik van modellen om productie-omgevingen en HPC computerclusters te verdelen.
- Gevolgde de voortdurende prestaties van ingezette modellen met behulp van gereedschappen zoals MLFlow, Heilige en Gewichten & Biases.
- Verbonden de onderzoeksafdeling van het bedrijf met academische partners bij TU/e.
Technologieën:
- Technologieën:
Docker
Java
Flask
Python
C++
AWS S3
Azure
- Data Science
Google Cloud
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Caffe
Matlab
Pandas
Linux
- MLOps
Open source
LaTeX
PyTorch
PyCharm
- Unit Testing
Git
- Command-line interface
Unix
SciPy
Scikit-learn
Matplotlib
Azure ML
Random Forest
- Clustering
- SVM
- PCA
Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
Machine Learning
- Automation Testing
- Boost
Cuda
Pytest
Apache Flink
YAML
OpenAI API
- Prompt Engineering
Julia
- Mojo
Stable Diffusion
- Neural Network
Large Language Models (LLM)
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Deep Learning Research Engineer
GAIPS Research - 5 jaar 8 maanden
- Ontworpen en geïmplementeerd, getraind, getest en inzette de nieuwste architecturen voor diep leren, waaronder Actor-Critics, DQNs, en LLM's met behulp van convolutionele, herhalende en attentiegebaseerde mechanismen voor het extraheren van functies over een breed scala aan taken.
- Uitgezette modellen om productieomgevingen te cloud op platformen zoals Google Cloud, Amazon AWS en Slurm HPC gedistribueerde computerclusters.
- Gevolgde de voortdurende prestaties van ingezette modellen met behulp van gereedschappen als MLFlow, Heilige Stoelen, Gewichten & Biases.
- Verzamel het HPC Slurm-cluster van het bedrijf.
- Vijf onderzoeksteams als eerste auteur, publicatie van een onderzoeksdocument voor elke toptier AI locaties, inclusief AAI, IJCAI, ECAI, het Kunstmatige Intelligentie Journal en PLoS One Journal.
- Gepresenteerd AI onderzoek bij internationale topconferenties zoals AAAI, IJCAI en ECAI.
- Twee subsidies voor concurrerende concurrentie werden veiliggesteld, één van de Amerikaanse subsidies. De oprichting van een luchtmacht voor wetenschappelijk onderzoek en een andere organisatie van de Portugese Stichting voor Wetenschap en Technologie (FCT).
- De beste Papier beloning ontvangen voor het project "Mensen helpen in de Fly: Advertentie Hoc Teamwork voor teams voor Human-Robot."
Technologieën:
- Technologieën:
Docker
Python
- Data Science
Joomla
NumPy
OpenCV
XGBoost
Keras
- MLOps
Open source
PyTorch
PyCharm
Git
- Command-line interface
SciPy
Scikit-learn
Matplotlib
Azure ML
Convolutional neural network
- Recurrent neural network
- Transformer Network
Machine Learning
- Computer Vision
- Boost
Cuda
Pytest
YAML
OpenAI API
- Neural Network
Hugging Face Transformers
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Software Engineer
Thales - 8 maanden
- Verminderde technische schulden en verhoogde algemene testdekking voor de oplossing van de top Sky Tower , een instrument voor luchtverkeersleiders om elektronische strips te beheren.
- Uitgevoerde en geteste kritieke beveiligingsdetectiesystemen.
Technologieën:
- Technologieën:
Java
C++
C#
WPF
Software Engineer
IST IT Department - 1 jaar
- Een Convolutioneel Neurale Netwerk voor de classificatie van geldige identiteitskaarten.
- Uitgevoerde software voor automatische en periodieke back-ups van de gegevens van de universiteit naar de AWS-cloud.
- oude software opnieuw geïmplementeerd met behulp van moderne technologieën zoals Scala en Kotlin.
Technologieën:
- Technologieën:
Java
Python
AWS S3
Scala
Kotlin
TensorFlow
Keras
PyTorch
- Computer Vision
Software Engineer
DV Trading LLC - 2 maanden
• Implemented graphical user interfaces using WPF and .NET for the trading team • Refactored and optimized code in several legacy projects, increasing overall performance of proprietary trading tools by up to 30%
Technologieën:
- Technologieën:
Java
C++
C#
.NET
WPF
Laravel Developer
Systems Group - 4 maanden
Designed and developed a website for the Trainees project - matchmaking companies and near-graduates from the Portuguese ESHTE
Technologieën:
- Technologieën:
PHP
Laravel
MySQL
MariaDB
MongoDB
Docker
Educatie
Standalone courseComputer Science
Delft University of Technology · 2023 - 2023
Doctor Of PhilosophyComputer Science
Instituto Superior Técnico · 2019 - 2025
MSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2016 - 2018
BSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2012 - 2016
Portefeuille
Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden
In een kort gesprek van 25 minuten:
- gaan we in op wat je nodig hebt om je product te ontwikkelen;
- Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
- delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.




