João M.

Deep Learning Research Engineer

João er en Deep Learning Engineer i ASML med over 10 års erfaring i kunstig intelligens.

Han har spesialisert seg på å bygge avanserte modeller, inkludert store språkmodeller (LLM-er), som kan utføre kode-refaktorering, feildeteksjon og kontinuerlig læring. João arbeidet omfattende med PyTorch og deployerte modeller på skyplattformer og høyytelses datasystemer.

Før ASML ledet han forskerteam ved GAIPS Lab, publiserte i ledende AI-konferanser, og sikret konkurransedyktige forskningsmidler fra den amerikanske flyvåpenet og FCT. Han underviste også i AI-kurs og mottok en Teaching Excellence Award for sitt bidrag til undervisning.

Joãos nøkkelprosjekter inkluderte utvikling av teknikker for kontinuerlig læring, som gjorde det mulig for AI å tilegne seg ny kunnskap uten å glemme tidligere oppgaver, og bruk av forsterkende læring for å trene modeller mer effektivt med mindre data. Han brenner for å gjøre AI-systemer mer effektive, praktiske og stadig bedre.

Hovedekspertise

  • Python
    Python 10 år
  • Machine Learning
    Machine Learning 10 år
  • Data Science 10 år

Andre kunnskaper

    João

    João M.

    Netherlands

    Kom i gang

    Utvalgt opplevelse

    Arbeidserfaring

    • AI Researcher

      Utrecht University - 4 months

      Developing a production-oriented AI system for personalised patient interventions in dementia care, combining reinforcement learning with large language models. Designed and built ToneRL, a hybrid architecture where a lightweight RL agent learns to control an LLM’s output in real time, adapting communication style to individual patients based on clinical feedback, without retraining or modifying the underlying model. Collaborating directly with clinicians and linguists to ensure outputs meet clinical communication standards. The architecture is designed for scalable deployment: one frozen base model serves all patients, with per-patient adaptation handled by lightweight policy instances requiring minimal compute.

      Teknologier:

      • Teknologier:
      • MongoDB MongoDB
      • Docker Docker
      • Project Management
      • Budget Management
      • Python Python
      • C C
      • C++ C++
      • Data Science
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • Keras Keras
      • Pandas Pandas
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • JUnit JUnit
      • Git Git
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Performance Testing
      • Computer Vision
      • Cuda Cuda
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Ollama Ollama
      • Neural Network
      • Security Security
      • Large Language Models (LLM) Large Language Models (LLM)
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Hugging Face Hugging Face
      • LoRA
      • QLoRA
      • AI AI
      • AI Engineering AI Engineering
      • vLLM vLLM
      • Agentic AI Agentic AI
    • Deep Learning Research Engineer

      ASML - 1 year 2 months

      • Led a research team on the "LMs for Software Engineering" prosjekt med fokus på teknisk gjeldsreduksjon, Feildeteksjon og dokumentasjonsanalyse ved hjelp av store språkmodeller.
      • Desiged, implemented, trained, testet, and deployed LLMs for automatic code refactoring and bug detection.
      • Utsatte modeller til sky-produksjonsmiljøer og HPC distribuerte dataprogramklynger.
      • Overvåket den kontinuerlige ytelsen til modeller med verktøy som MLFlow, Sacred og Weights & Biases.
      • Tilkoblingen til selskapets forskningsavdeling med akademiske partnere ved TU/e.

      Teknologier:

      • Teknologier:
      • Docker Docker
      • Java Java
      • Flask Flask
      • Python Python
      • C++ C++
      • AWS S3 AWS S3
      • Azure Azure
      • Data Science
      • Google Cloud Google Cloud
      • TensorFlow TensorFlow
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • Caffe Caffe
      • Matlab Matlab
      • Pandas Pandas
      • Linux Linux
      • MLOps
      • Open source Open source
      • LaTeX LaTeX
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Unit Testing
      • Git Git
      • Command-line interface
      • Unix Unix
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Random Forest Random Forest
      • Clustering
      • SVM
      • PCA
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • NLP
      • Machine Learning Machine Learning
      • Automation Testing
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • Apache Flink Apache Flink
      • YAML YAML
      • OpenAI API OpenAI API
      • Prompt Engineering
      • Julia Julia
      • Mojo
      • Stable Diffusion Stable Diffusion
      • Neural Network
      • Large Language Models (LLM) Large Language Models (LLM)
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Deep Learning Research Engineer

      GAIPS Research - 5 years 8 months

      • Prosjektert, implementert, trenet, testet, og distribuert toppmoderne læringsarkitekter, som for eksempel Actor-Critics, DQN, LL-er og LM ved bruk av konvolusjonale, gjentakende og oppmerksomhetsbaserte mekanismer for nedtrekksvirksomhet på tvers av mange oppgaver.
      • Distribuerte modeller til skytjenester på plattformer som Google Cloud, Amazon AWS, og Slurm HPC distribuerte dataklubstre.
      • Overvåket den kontinuerlige ytelsen til modeller ved bruk av verktøy som MLFlow, Sacred og Weights & Biases.
      • Sammensatte selskapets HPC Slurm klyngere.
      • Led fem forskerteam som førstegangsforfatter og offentliggjør en forskningsrapport til hvert trinn i nivå AI i arenaer. herunder AAAI, IJCAI, ECAI, the tificial Intelligence Journal, and PLoS One Journal.
      • Presented AI-forskning på internasjonale topp-nivå konferanser som AAAI, IJCAI og ECAI.
      • Sikret to konkurransepregede tilskudd, ett fra USA Air Force Office of Scientific Research og et annet fra det portugisiske stiftelsen for Science and Technology (FCT).
      • Mottok prisen for beste papir for prosjektet «Helping People On The Fly: Ad Hoc Teamwork for Human-Robot Teams.»

      Teknologier:

      • Teknologier:
      • Docker Docker
      • Python Python
      • Data Science
      • Joomla Joomla
      • NumPy NumPy
      • OpenCV OpenCV
      • XGBoost XGBoost
      • Keras Keras
      • MLOps
      • Open source Open source
      • PyTorch PyTorch
      • PyCharm PyCharm
      • Git Git
      • Command-line interface
      • SciPy SciPy
      • Scikit-learn Scikit-learn
      • Matplotlib Matplotlib
      • Azure ML Azure ML
      • Convolutional neural network Convolutional neural network
      • Recurrent neural network
      • Transformer Network
      • Machine Learning Machine Learning
      • Computer Vision
      • Boost
      • Cuda Cuda
      • Pytest Pytest
      • YAML YAML
      • OpenAI API OpenAI API
      • Neural Network
      • Hugging Face Transformers Hugging Face Transformers
      • JAX
      • MLflow
      • PyTorch Lightning PyTorch Lightning
      • Slurm
      • Hugging Face Hugging Face
    • Software Engineer

      Thales - 8 months

      • Redusert teknisk gjeld og økt samlet testdekning av løsningen med Top Sky Tower, et verktøy til lufttrafikktjenesten for å håndtere elektroniske striper.
      • Implementerte og testede kritiske systemer for deteksjon av sikkerhet.

      Teknologier:

      • Teknologier:
      • Java Java
      • C++ C++
      • C# C#
      • WPF WPF
    • Software Engineer

      IST IT Department - 1 year

      • Trent et Convolusjonalt nevrale nettverk for å klassifisere gyldige bilder av identitetskort.
      • Implementert programvare for automatiske og periodiske sikkerhetskopieringer av universitetets registre til AWS-skyen.
      • Reimplementert eldre programvare med bruk av moderne teknologier som Scala og Kotlin.

      Teknologier:

      • Teknologier:
      • Java Java
      • Python Python
      • AWS S3 AWS S3
      • Scala Scala
      • Kotlin Kotlin
      • TensorFlow TensorFlow
      • Keras Keras
      • PyTorch PyTorch
      • Computer Vision
    • Software Engineer

      DV Trading LLC - 2 months

      • Implemented graphical user interfaces using WPF and .NET for the trading team • Refactored and optimized code in several legacy projects, increasing overall performance of proprietary trading tools by up to 30%

      Teknologier:

      • Teknologier:
      • Java Java
      • C++ C++
      • C# C#
      • .NET .NET
      • WPF WPF
    • Laravel Developer

      Systems Group - 4 months

      Designed and developed a website for the Trainees project - matchmaking companies and near-graduates from the Portuguese ESHTE

      Teknologier:

      • Teknologier:
      • PHP PHP
      • Laravel Laravel
      • MySQL MySQL
      • MariaDB MariaDB
      • MongoDB MongoDB
      • Docker Docker

    Utdannelse

    • Standalone courseComputer Science

      Delft University of Technology · 2023 - 2023

    • Doctor Of PhilosophyComputer Science

      Instituto Superior Técnico · 2019 - 2025

    • MSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2016 - 2018

    • BSc.Information Systems and Computer Engineering

      Instituto Superior Técnico · 2012 - 2016

    Portefølje

    • Multi-Task Learning & Catastrophic Forgetting in Continual Reinforcement Learning - 1
    • PyTorch Encoder-Decoder Attention Model - 1
    • odel-based Reinforcement Learning for Ad Hoc Teamwork - 1
    • TopSky Tower - 1

    Finn din neste utvikler innen dager, ikke måneder

    I løpet av en kort 25-minutters samtale ønsker vi å:

    • Forstå dine utviklingsbehov
    • Forklare prosessen vår der vi matcher deg med kvalifiserte, evaluerte utviklere fra vårt nettverk
    • Dele de neste stegene for å finne riktig match, ofte på mindre enn en uke

    La oss ta en prat