Himanshu S.
Data Engineer
Himanshu er en erfaren dataingeniør med bred erfaring og færdigheder inden for SQL, Snowflake og AWS. Han har arbejdet i forskellige brancher, herunder sundhed, detailhandel, bilindustri og finans.
I løbet af de sidste fem år har Himanshu positioneret sig som Full-stack-datakonsulent i kraft af sin ekspertise inden for maskinlæring og datavidenskab.
Hos KnowledgeFoundry og ZS Associates var Himanshu et væsentligt aktiv i deres tekniske teams. Han er en pålidelig og dedikeret udvikler inden for datateknik med alsidige færdigheder.
Hovedekspertise
- OpenCV 4 år
- Linux 5 år
- LangChain 2 år
Andre færdigheder
- Docker 3 år
- FastAPI 2 år
- ChatGPT API 2 år
Udvalgt oplevelse
Beskæftigelse
Data Engineer
InfoGain - 10 måneder
- Skabte en Data Warehouse-løsning ved hjælp af AWS Redshift og AWS Glue og migrerede en OLAP-database fra MS SQL Server.
- Etableret en DBT-pipeline til ETL-processer, der overfører data mellem et MySQL-lager og en aktivitetsdatabase til en Neo4j-grafdatabase ved hjælp af indbygget Python-programmering. Opsætningen blev implementeret på en AWS Linux-boks med Neo4j kørende som en Docker-container.
- Udviklet en ETL-pipeline til udførelse af markedskurvanalyser og andre marketingstatistikker på millioner af rækker af transaktionsdata. Brugte Redshift som en transaktionsdatabase og udfyldte den på en serverløs måde ved hjælp af Amazon Lambda-funktioner i realtid.
Teknologier:
- Teknologier:
Python
ETL
- Data Engineering
AWS
Data Engineer
ZS Associates - 6 måneder
- Udviklet en pipeline til at konvertere data til et struktureret format, der gør det muligt at servere til Prodigy til ML-relateret tagging. Hele pipelinen blev konstrueret på en modulær måde ved hjælp af ren Python og shell-scripting.
- Implementerede datatransformationer i Python og lagrede de behandlede data i en Amazon S3-bucket til opbevaring og tilgængelighed.
Teknologier:
- Teknologier:
Python
Data Engineer
KnowledgeFoundry - 6 flere år 3 måneder
- Automatiseret processen med at skrive Hive-forespørgsler til ETL af flere tabeller (både engangs og inkrementelle) ved at generere automatiserede scripts.
- Læs CSV-filer fra mappeplaceringer, oprettede tabeller og udførte inkrementelle belastninger sekventielt.
- Opsætning af Snowflake som den primære lagringsløsning for strukturerede data og brug af DBT til ETL-processer. Udarbejdede SQL-baserede modeller til at definere transformationslogik og sikre fleksibilitet med inkrementel indlæsning og versionskontrol ved hjælp af DBT.
- Forberedte transformerede data til analyse ved hjælp af business intelligence-værktøjer, hvilket gjorde det lettere at finde frem til indsigter. Udførte regelmæssige kontroller i Snowflake og DBT for at opretholde dataintegritet og pipelinefunktionalitet.
- Designede og udviklede datapipelines til at udtrække, transformere og indlæse data fra forskellige kilder til et centraliseret datalager.
Teknologier:
- Teknologier:
ETL
SQL
- Data Engineering
Uddannelse
BSc.Information Technology
Dharmsinh Desai University · 2015 - 2019
Find din næste udvikler inden for få dage, ikke måneder
Book en 25-minutters samtale, hvor vi:
- udfører behovsafdækning med fokus på udviklingsopgaver
- Forklar vores proces, hvor vi matcher dig med kvalificerede, godkendte udviklere fra vores netværk
- beskriver de næste trin for at finde det perfekte match på få dage