NEU
Proxify is bringing transparency to tech team performance based on research conducted at Stanford. An industry first, built for engineering leaders.
Learn more
João M.
Deep Learning Research Engineer
João ist ein Deep Learning Engineer bei ASML mit mehr als 10 Jahren Erfahrung im Bereich künstlicher Intelligenz.
Er ist spezialisiert auf die Entwicklung fortschrittlicher Modelle, einschließlich großer Sprachmodelle (LLMs), die in der Lage sind, Code Refactoring, Fehlererkennung und kontinuierliches Lernen zu erstellen. João arbeitet umfassend mit PyTorch zusammen und stellt Modelle auf Cloud-Plattformen und Hochleistungsrechnersystemen zur Verfügung.
Vor ASML leitete er Forschungsteams bei GAIPS Lab, publizierte auf führenden KI-Konferenzen und sicherte sich Wettbewerbszuwendungen aus den USA. Luftwaffe und FCT. Er unterrichtete auch KI-Kurse und erhielt für seine Beiträge zur Bildung einen "Teaching Excellence Award".
Zu den wichtigsten Projekten von João gehören die Weiterentwicklung kontinuierlicher Lerntechniken, die es der KI ermöglichen, neues Wissen zu erwerben, ohne vorherige Aufgaben zu vergessen, und die Anwendung des Verstärkungslernens, um Modelle effizienter mit weniger Daten zu trainieren. Er ist leidenschaftlich darum bemüht, die KI-Systeme effektiver, praktischer und ständig zu verbessern.
Hauptkompetenz
- Python 10 Jahre

- Machine Learning 10 Jahre

- Data Science 10 Jahre
Andere Fähigkeiten
Ausgewählte Erfahrung
Beschäftigung
AI Researcher
Utrecht University - 4 monate
Developing a production-oriented AI system for personalised patient interventions in dementia care, combining reinforcement learning with large language models. Designed and built ToneRL, a hybrid architecture where a lightweight RL agent learns to control an LLM’s output in real time, adapting communication style to individual patients based on clinical feedback, without retraining or modifying the underlying model. Collaborating directly with clinicians and linguists to ensure outputs meet clinical communication standards. The architecture is designed for scalable deployment: one frozen base model serves all patients, with per-patient adaptation handled by lightweight policy instances requiring minimal compute.
Technologien:
- Technologien:
MongoDB
Docker
- Project Management
- Budget Management
Python
C
C++
- Data Science
TensorFlow
NumPy
OpenCV
Keras
Pandas
- MLOps
Open source
LaTeX
PyTorch
PyCharm
- Unit Testing
JUnit
Git
Unix
SciPy
Scikit-learn
Matplotlib
Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
Machine Learning
- Performance Testing
- Computer Vision
Cuda
OpenAI API
- Prompt Engineering
Ollama
- Neural Network
Security
Large Language Models (LLM)
Hugging Face Transformers
- JAX
- MLflow
PyTorch Lightning
Hugging Face
- LoRA
- QLoRA
AI
AI Engineering
vLLM
Agentic AI
Deep Learning Research Engineer
ASML - 1 jahr 2 monate
- Ein Forschungsteam am Projekt "LLMs for Software Engineering" mit Schwerpunkt auf der technischen Schuldenreduzierung, Fehlererkennung und Dokumentationsanalyse mit Hilfe von Large Language Models.
- Entwickelt, implementiert, geschult, getestet und implementiert LLMs zur automatischen Code-Refactoring und Fehlererkennung.
- Deployed models to cloud production environments and HPC distributed computing cluster.
- Überwachung der kontinuierlichen Leistung der eingesetzten Modelle mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Verbunden der Forschungsabteilung des Unternehmens mit akademischen Partnern bei TU/e.
Technologien:
- Technologien:
Docker
Java
Flask
Python
C++
AWS S3
Azure
- Data Science
Google Cloud
TensorFlow
NumPy
OpenCV
XGBoost
Keras
Caffe
Matlab
Pandas
Linux
- MLOps
Open source
LaTeX
PyTorch
PyCharm
- Unit Testing
Git
- Command-line interface
Unix
SciPy
Scikit-learn
Matplotlib
Azure ML
Random Forest
- Clustering
- SVM
- PCA
Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
Machine Learning
- Automation Testing
- Boost
Cuda
Pytest
Apache Flink
YAML
OpenAI API
- Prompt Engineering
Julia
- Mojo
Stable Diffusion
- Neural Network
Large Language Models (LLM)
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Deep Learning Research Engineer
GAIPS Research - 5 jahre 8 monate
- Entwickelt, implementiert, geschult, getestet und implementiert modernste Tieflernarchitekturen, einschließlich Schauspielerkritik, DQNs, und LLMs mit Hilfe von konvolutionären, wiederkehrenden und aufmerksamkeitsbasierten Mechanismen zur Leistungsextraktion über eine Vielzahl von Aufgaben.
- Verteilte Modelle für Cloud-Produktionsumgebungen auf Plattformen wie Google Cloud, Amazon AWS und Slurm HPC verteilte Computercluster.
- Überwachung der kontinuierlichen Leistung von eingesetzten Modellen mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Anordnung des HPC Slurm Clusters.
- Led fünf Forschungsteams als erster Autor, veröffentlicht ein Forschungsdokument für jeden in Top-AI-Veranstaltungsorte, einschließlich AAAI, IJCAI, ECAI, dem Artificial Intelligence Journal, und PLoS One Journal.
- Präsentation der AI-Forschung auf internationalen Top-Konferenzen wie AAI, IJCAI und ECAI.
- Sicherung von zwei wettbewerbsfähigen Fördergeldern, einer aus den USA. Air Force Office of Scientific Research und ein weiteres von der Portugiesischen Stiftung für Wissenschaft und Technologie (FCT).
- Erhalten des Best Paper Award für das Projekt „Helping People On The Fly: Ad Hoc Teamwork for Human-Robot Teams.“
Technologien:
- Technologien:
Docker
Python
- Data Science
Joomla
NumPy
OpenCV
XGBoost
Keras
- MLOps
Open source
PyTorch
PyCharm
Git
- Command-line interface
SciPy
Scikit-learn
Matplotlib
Azure ML
Convolutional neural network
- Recurrent neural network
- Transformer Network
Machine Learning
- Computer Vision
- Boost
Cuda
Pytest
YAML
OpenAI API
- Neural Network
Hugging Face Transformers
- JAX
- MLflow
PyTorch Lightning
- Slurm
Hugging Face
Software Engineer
Thales - 8 monate
- Reduzierte technische Schulden und eine erhöhte Gesamtprüfung der Top Sky Tower Lösung, ein Werkzeug für die Fluglotsen zur Verwaltung von elektronischen Streifen.
- Implementierte und getestete kritische Sicherheitserkennungssysteme.
Technologien:
- Technologien:
Java
C++
C#
WPF
Software Engineer
IST IT Department - 1 jahr
- Ein Neuronales Netzwerk ausgebildet, um gültige Identitätskartenbilder zu klassifizieren.
- Implementierte Software für automatische und periodische Sicherungen der Universitätsdatensätze in der AWS-Cloud.
- Reimplementierte Legacy-Software mit modernen Technologien wie Scala und Kotlin.
Technologien:
- Technologien:
Java
Python
AWS S3
Scala
Kotlin
TensorFlow
Keras
PyTorch
- Computer Vision
Software Engineer
DV Trading LLC - 2 monate
• Implemented graphical user interfaces using WPF and .NET for the trading team • Refactored and optimized code in several legacy projects, increasing overall performance of proprietary trading tools by up to 30%
Technologien:
- Technologien:
Java
C++
C#
.NET
WPF
Laravel Developer
Systems Group - 4 monate
Designed and developed a website for the Trainees project - matchmaking companies and near-graduates from the Portuguese ESHTE
Technologien:
- Technologien:
PHP
Laravel
MySQL
MariaDB
MongoDB
Docker
Ausbildung
FortbildungComputer Science
Delft University of Technology · 2023 - 2023
Dr. Phil.Computer Science
Instituto Superior Técnico · 2019 - 2025
MSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2016 - 2018
BSc.Information Systems and Computer Engineering
Instituto Superior Técnico · 2012 - 2016
Portfolio
Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten
In einem kurzen 25-minütigen Gespräch würden wir gerne:
- Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
- Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
- Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche




