João M.

Deep Learning Research Engineer

João is een Deep Learning Engineer bij ASML met meer dan 10 jaar ervaring in kunstmatige intelligentie.

Hij is gespecialiseerd in het bouwen van geavanceerde modellen, waaronder large language models (LLM’s), die in staat zijn tot code-refactoring, bugdetectie en continual learning. João werkt intensief met PyTorch en implementeert modellen op cloudplatforms en high-performance computing-systemen.

Voor zijn tijd bij ASML leidde hij onderzoeksteams bij GAIPS Lab, publiceerde hij op toonaangevende AI-conferenties en verkreeg hij competitieve onderzoeksbeurzen van de U.S. Air Force en FCT. Daarnaast gaf hij AI-cursussen en ontving hij een Teaching Excellence Award voor zijn bijdragen aan het onderwijs.

João’s belangrijkste projecten omvatten het ontwikkelen van technieken voor continual learning, waarmee AI nieuwe kennis kan verwerven zonder eerdere taken te vergeten, en het toepassen van reinforcement learning om modellen efficiënter te trainen met minder data. Hij is gepassioneerd over het effectiever, praktischer en voortdurend verbeterend maken van AI-systemen.

Hoofd expertise

  • Python
    Python 10 jaar
  • Machine Learning
    Machine Learning 10 jaar
  • Data Science 10 jaar

Andere vaardigheden

    João

    João M.

    Netherlands

    Aan de slag

    Geselecteerde ervaring

    Dienstverband

    • AI Researcher

      Utrecht University - 4 maanden

      Developing a production-oriented AI system for personalised patient interventions in dementia care, combining reinforcement learning with large language models. Designed and built ToneRL, a hybrid architecture where a lightweight RL agent learns to control an LLM’s output in real time, adapting communication style to individual patients based on clinical feedback, without retraining or modifying the underlying model. Collaborating directly with clinicians and linguists to ensure outputs meet clinical communication standards. The architecture is designed for scalable deployment: one frozen base model serves all patients, with per-patient adaptation handled by lightweight policy instances requiring minimal compute.

      Technologieën:

      • Technologieën:
      • MongoDB MongoDB
      • Docker Docker
      • Project Management
      • Budget Management
      • Python Python
      • C C
      • C++ C++
      • Data Science
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • Keras Keras
      • Pandas Pandas
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • JUnit JUnit
      • Git Git
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Performance Testing
      • Computer Vision
      • Cuda Cuda
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Ollama Ollama
      • Neural Network
      • Security Security
      • Large Language Models (LLM) Large Language Models (LLM)
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Hugging Face Hugging Face
      • LoRA
      • QLoRA
      • AI AI
      • AI Engineering AI Engineering
      • vLLM vLLM
      • Agentic AI Agentic AI
    • Deep Learning Research Engineer

      ASML - 1 jaar 2 maanden

      • Led een onderzoeksteam over de "LM's for Software Engineering" project, gericht op technische schuldvermindering, foutopsporing en documentatie analyse met behulp van grote taalmodellen.
      • Ontworpen, geïmplementeerd, getraind, getest en ingezette LLMs voor automatische code-refactoring en bug detectie.
      • Gebruik van modellen om productie-omgevingen en HPC computerclusters te verdelen.
      • Gevolgde de voortdurende prestaties van ingezette modellen met behulp van gereedschappen zoals MLFlow, Heilige en Gewichten & Biases.
      • Verbonden de onderzoeksafdeling van het bedrijf met academische partners bij TU/e.

      Technologieën:

      • Technologieën:
      • Docker Docker
      • Java Java
      • Flask Flask
      • Python Python
      • C++ C++
      • AWS S3 AWS S3
      • Azure Azure
      • Data Science
      • Google Cloud Google Cloud
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • Caffe Caffe
      • Matlab Matlab
      • Pandas Pandas
      • Linux Linux
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • Git Git
      • Command-line interface
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Random Forest Random Forest
      • Clustering
      • SVM
      • PCA
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Automation Testing
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • Apache Flink Apache Flink
      • YAML YAML
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Julia Julia
      • Mojo
      • Stable Diffusion Stable Diffusion
      • Neural Network
      • Large Language Models (LLM) Large Language Models (LLM)
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Deep Learning Research Engineer

      GAIPS Research - 5 jaar 8 maanden

      • Ontworpen en geïmplementeerd, getraind, getest en inzette de nieuwste architecturen voor diep leren, waaronder Actor-Critics, DQNs, en LLM's met behulp van convolutionele, herhalende en attentiegebaseerde mechanismen voor het extraheren van functies over een breed scala aan taken.
      • Uitgezette modellen om productieomgevingen te cloud op platformen zoals Google Cloud, Amazon AWS en Slurm HPC gedistribueerde computerclusters.
      • Gevolgde de voortdurende prestaties van ingezette modellen met behulp van gereedschappen als MLFlow, Heilige Stoelen, Gewichten & Biases.
      • Verzamel het HPC Slurm-cluster van het bedrijf.
      • Vijf onderzoeksteams als eerste auteur, publicatie van een onderzoeksdocument voor elke toptier AI locaties, inclusief AAI, IJCAI, ECAI, het Kunstmatige Intelligentie Journal en PLoS One Journal.
      • Gepresenteerd AI onderzoek bij internationale topconferenties zoals AAAI, IJCAI en ECAI.
      • Twee subsidies voor concurrerende concurrentie werden veiliggesteld, één van de Amerikaanse subsidies. De oprichting van een luchtmacht voor wetenschappelijk onderzoek en een andere organisatie van de Portugese Stichting voor Wetenschap en Technologie (FCT).
      • De beste Papier beloning ontvangen voor het project "Mensen helpen in de Fly: Advertentie Hoc Teamwork voor teams voor Human-Robot."

      Technologieën:

      • Technologieën:
      • Docker Docker
      • Python Python
      • Data Science
      • Joomla Joomla
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • MLOps
      • Open source Open source
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Git Git
      • Command-line interface
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • Machine Learning Machine Learning
      • Computer Vision
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • YAML YAML
      • OpenAI API OpenAI API
      • Neural Network
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Software Engineer

      Thales - 8 maanden

      • Verminderde technische schulden en verhoogde algemene testdekking voor de oplossing van de top Sky Tower , een instrument voor luchtverkeersleiders om elektronische strips te beheren.
      • Uitgevoerde en geteste kritieke beveiligingsdetectiesystemen.

      Technologieën:

      • Technologieën:
      • Java Java
      • C++ C++
      • C# C#
      • WPF WPF
    • Software Engineer

      IST IT Department - 1 jaar

      • Een Convolutioneel Neurale Netwerk voor de classificatie van geldige identiteitskaarten.
      • Uitgevoerde software voor automatische en periodieke back-ups van de gegevens van de universiteit naar de AWS-cloud.
      • oude software opnieuw geïmplementeerd met behulp van moderne technologieën zoals Scala en Kotlin.

      Technologieën:

      • Technologieën:
      • Java Java
      • Python Python
      • AWS S3 AWS S3
      • Scala Scala
      • Kotlin Kotlin
      • TensorFlow TensorFlow
      • Keras Keras
      • PyTorch PyTorch
      • Computer Vision
    • Software Engineer

      DV Trading LLC - 2 maanden

      • Implemented graphical user interfaces using WPF and .NET for the trading team • Refactored and optimized code in several legacy projects, increasing overall performance of proprietary trading tools by up to 30%

      Technologieën:

      • Technologieën:
      • Java Java
      • C++ C++
      • C# C#
      • .NET .NET
      • WPF WPF
    • Laravel Developer

      Systems Group - 4 maanden

      Designed and developed a website for the Trainees project - matchmaking companies and near-graduates from the Portuguese ESHTE

      Technologieën:

      • Technologieën:
      • PHP PHP
      • Laravel Laravel
      • MySQL MySQL
      • MariaDB MariaDB
      • MongoDB MongoDB
      • Docker Docker

    Educatie

    • Standalone courseComputer Science

      Delft University of Technology · 2023 - 2023

    • Doctor Of PhilosophyComputer Science

      Instituto Superior Técnico · 2019 - 2025

    • MSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2016 - 2018

    • BSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2012 - 2016

    Portefeuille

    • Multi-Task Learning & Catastrophic Forgetting in Continual Reinforcement Learning - 1
    • PyTorch Encoder-Decoder Attention Model - 1
    • odel-based Reinforcement Learning for Ad Hoc Teamwork - 1
    • TopSky Tower - 1

    Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden

    In een kort gesprek van 25 minuten:

    • gaan we in op wat je nodig hebt om je product te ontwikkelen;
    • Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
    • delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.

    Maak een afspraak