João M.

Deep Learning Research Engineer

João ist ein Deep Learning Engineer bei ASML mit mehr als 10 Jahren Erfahrung im Bereich künstlicher Intelligenz.

Er ist spezialisiert auf die Entwicklung fortschrittlicher Modelle, einschließlich großer Sprachmodelle (LLMs), die in der Lage sind, Code Refactoring, Fehlererkennung und kontinuierliches Lernen zu erstellen. João arbeitet umfassend mit PyTorch zusammen und stellt Modelle auf Cloud-Plattformen und Hochleistungsrechnersystemen zur Verfügung.

Vor ASML leitete er Forschungsteams bei GAIPS Lab, publizierte auf führenden KI-Konferenzen und sicherte sich Wettbewerbszuwendungen aus den USA. Luftwaffe und FCT. Er unterrichtete auch KI-Kurse und erhielt für seine Beiträge zur Bildung einen "Teaching Excellence Award".

Zu den wichtigsten Projekten von João gehören die Weiterentwicklung kontinuierlicher Lerntechniken, die es der KI ermöglichen, neues Wissen zu erwerben, ohne vorherige Aufgaben zu vergessen, und die Anwendung des Verstärkungslernens, um Modelle effizienter mit weniger Daten zu trainieren. Er ist leidenschaftlich darum bemüht, die KI-Systeme effektiver, praktischer und ständig zu verbessern.

Hauptkompetenz

Python 10 Jahre
Machine Learning 10 Jahre
Data Science 10 Jahre

Andere Fähigkeiten

João M.

Netherlands

Erste Schritte

Ausgewählte Erfahrung

Beschäftigung

AI Researcher

Utrecht University - 4 monate

Developing a production-oriented AI system for personalised patient interventions in dementia care, combining reinforcement learning with large language models. Designed and built ToneRL, a hybrid architecture where a lightweight RL agent learns to control an LLM’s output in real time, adapting communication style to individual patients based on clinical feedback, without retraining or modifying the underlying model. Collaborating directly with clinicians and linguists to ensure outputs meet clinical communication standards. The architecture is designed for scalable deployment: one frozen base model serves all patients, with per-patient adaptation handled by lightweight policy instances requiring minimal compute.
Technologien:
- Technologien:
- MongoDB
- Docker
- Project Management
- Budget Management
- Python
- C
- C++
- Data Science
- TensorFlow
- NumPy
- OpenCV
- Keras
- Pandas
- MLOps
- Open source
- LaTeX
- PyTorch
- PyCharm
- Unit Testing
- JUnit
- Git
- Unix
- SciPy
- Scikit-learn
- Matplotlib
- Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
- Machine Learning
- Performance Testing
- Computer Vision
- Cuda
- OpenAI API
- Prompt Engineering
- Ollama
- Neural Network
- Security
- Large Language Models (LLM)
- Hugging Face Transformers
- JAX
- MLflow
- PyTorch Lightning
- Hugging Face
- LoRA
- QLoRA
- AI
- AI Engineering
- vLLM
- Agentic AI
Deep Learning Research Engineer

ASML - 1 jahr 2 monate
- Ein Forschungsteam am Projekt "LLMs for Software Engineering" mit Schwerpunkt auf der technischen Schuldenreduzierung, Fehlererkennung und Dokumentationsanalyse mit Hilfe von Large Language Models.
- Entwickelt, implementiert, geschult, getestet und implementiert LLMs zur automatischen Code-Refactoring und Fehlererkennung.
- Deployed models to cloud production environments and HPC distributed computing cluster.
- Überwachung der kontinuierlichen Leistung der eingesetzten Modelle mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Verbunden der Forschungsabteilung des Unternehmens mit akademischen Partnern bei TU/e.
Technologien:
- Technologien:
- Docker
- Java
- Flask
- Python
- C++
- AWS S3
- Azure
- Data Science
- Google Cloud
- TensorFlow
- NumPy
- OpenCV
- XGBoost
- Keras
- Caffe
- Matlab
- Pandas
- Linux
- MLOps
- Open source
- LaTeX
- PyTorch
- PyCharm
- Unit Testing
- Git
- Command-line interface
- Unix
- SciPy
- Scikit-learn
- Matplotlib
- Azure ML
- Random Forest
- Clustering
- SVM
- PCA
- Convolutional neural network
- Recurrent neural network
- Transformer Network
- NLP
- Machine Learning
- Automation Testing
- Boost
- Cuda
- Pytest
- Apache Flink
- YAML
- OpenAI API
- Prompt Engineering
- Julia
- Mojo
- Stable Diffusion
- Neural Network
- Large Language Models (LLM)
- JAX
- MLflow
- PyTorch Lightning
- Slurm
- Hugging Face
Deep Learning Research Engineer

GAIPS Research - 5 jahre 8 monate
- Entwickelt, implementiert, geschult, getestet und implementiert modernste Tieflernarchitekturen, einschließlich Schauspielerkritik, DQNs, und LLMs mit Hilfe von konvolutionären, wiederkehrenden und aufmerksamkeitsbasierten Mechanismen zur Leistungsextraktion über eine Vielzahl von Aufgaben.
- Verteilte Modelle für Cloud-Produktionsumgebungen auf Plattformen wie Google Cloud, Amazon AWS und Slurm HPC verteilte Computercluster.
- Überwachung der kontinuierlichen Leistung von eingesetzten Modellen mit Werkzeugen wie MLFlow, Sacred und Weights & Biases.
- Anordnung des HPC Slurm Clusters.
- Led fünf Forschungsteams als erster Autor, veröffentlicht ein Forschungsdokument für jeden in Top-AI-Veranstaltungsorte, einschließlich AAAI, IJCAI, ECAI, dem Artificial Intelligence Journal, und PLoS One Journal.
- Präsentation der AI-Forschung auf internationalen Top-Konferenzen wie AAI, IJCAI und ECAI.
- Sicherung von zwei wettbewerbsfähigen Fördergeldern, einer aus den USA. Air Force Office of Scientific Research und ein weiteres von der Portugiesischen Stiftung für Wissenschaft und Technologie (FCT).
- Erhalten des Best Paper Award für das Projekt „Helping People On The Fly: Ad Hoc Teamwork for Human-Robot Teams.“
Technologien:
- Technologien:
- Docker
- Python
- Data Science
- Joomla
- NumPy
- OpenCV
- XGBoost
- Keras
- MLOps
- Open source
- PyTorch
- PyCharm
- Git
- Command-line interface
- SciPy
- Scikit-learn
- Matplotlib
- Azure ML
- Convolutional neural network
- Recurrent neural network
- Transformer Network
- Machine Learning
- Computer Vision
- Boost
- Cuda
- Pytest
- YAML
- OpenAI API
- Neural Network
- Hugging Face Transformers
- JAX
- MLflow
- PyTorch Lightning
- Slurm
- Hugging Face
Software Engineer

Thales - 8 monate
- Reduzierte technische Schulden und eine erhöhte Gesamtprüfung der Top Sky Tower Lösung, ein Werkzeug für die Fluglotsen zur Verwaltung von elektronischen Streifen.
- Implementierte und getestete kritische Sicherheitserkennungssysteme.
Technologien:
- Technologien:
- Java
- C++
- C#
- WPF
Software Engineer

IST IT Department - 1 jahr
- Ein Neuronales Netzwerk ausgebildet, um gültige Identitätskartenbilder zu klassifizieren.
- Implementierte Software für automatische und periodische Sicherungen der Universitätsdatensätze in der AWS-Cloud.
- Reimplementierte Legacy-Software mit modernen Technologien wie Scala und Kotlin.
Technologien:
- Technologien:
- Java
- Python
- AWS S3
- Scala
- Kotlin
- TensorFlow
- Keras
- PyTorch
- Computer Vision
Software Engineer

DV Trading LLC - 2 monate

• Implemented graphical user interfaces using WPF and .NET for the trading team • Refactored and optimized code in several legacy projects, increasing overall performance of proprietary trading tools by up to 30%
Technologien:
- Technologien:
- Java
- C++
- C#
- .NET
- WPF
Laravel Developer

Systems Group - 4 monate

Designed and developed a website for the Trainees project - matchmaking companies and near-graduates from the Portuguese ESHTE
Technologien:
- Technologien:
- PHP
- Laravel
- MySQL
- MariaDB
- MongoDB
- Docker

Ausbildung

FortbildungComputer Science

Delft University of Technology · 2023 - 2023
Dr. Phil.Computer Science

Instituto Superior Técnico · 2019 - 2025
MSc.Information Systems and Computer Engineering

Instituto Superior Técnico · 2016 - 2018
BSc.Information Systems and Computer Engineering

Instituto Superior Técnico · 2012 - 2016

Portfolio

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten

In einem kurzen 25-minütigen Gespräch würden wir gerne:

Auf Ihren Bedarf bezüglich des Recruitments von Software-Entwicklern eingehen
Unseren Prozess vorstellen und somit wie wir Sie mit talentierten und geprüften Kandidaten aus unserem Netzwerk zusammenbringen können
Die nächsten Schritte besprechen, um den richtigen Kandidaten zu finden - oft in weniger als einer Woche

Deep Learning Research Engineer

João M.

Ausgewählte Erfahrung

Beschäftigung

AI Researcher

Deep Learning Research Engineer

Deep Learning Research Engineer

Software Engineer

Software Engineer

Software Engineer

Laravel Developer

Ausbildung

FortbildungComputer Science

Dr. Phil.Computer Science

MSc.Information Systems and Computer Engineering

BSc.Information Systems and Computer Engineering

Portfolio

Finden Sie Ihren nächsten Entwickler innerhalb von Tagen, nicht Monaten