Himanshu S.
Data Engineer
Himanshu is een doorgewinterde data engineer met uitgebreide ervaring en professionele vaardigheid in SQL, Snowflake en AWS. Hij heeft in verschillende sectoren gewerkt, waaronder de gezondheidszorg, detailhandel, automotive-industrie en de financiële sector.
De afgelopen vijf jaar heeft Himanshu zijn vaardigheden aangescherpt en zich gepositioneerd als full-stack data consultant, dankzij zijn expertise in zowel machine learning als data science.
Tijdens zijn periode bij KnowledgeFoundry en ZS Associates heeft Himanshu belangrijke bijdragen geleverd aan hun technische teams. Dankzij zijn diverse skills en toewijding is hij een betrouwbare developer op het gebied van data-engineering.
Hoofd expertise
- OpenCV 4 jaar
- Linux 5 jaar
- LangChain 2 jaar
Andere vaardigheden
- Docker 3 jaar
- FastAPI 2 jaar
- ChatGPT API 2 jaar
Geselecteerde ervaring
Dienstverband
Data Engineer
InfoGain - 10 maanden
- Het creëren van een Data Warehouse oplossing met behulp van AWS Redshift en AWS Glue, waarbij een OLAP-database is gemigreerd vanuit MS SQL Server.
- Het opzetten van een DBT pijplijn voor ETL processen, het overbrengen van gegevens tussen een MySQL magazijn en een activiteitendatabase naar een Neo4j grafiekdatabase met behulp van native Python programmering. De setup is geïmplementeerd op een AWS Linux box met Neo4j draaiend als een Docker container.
- Ontwikkelde een ETL-pijplijn voor het uitvoeren van marktmandanalyses en andere marketingstatistieken op miljoenen rijen transactiegegevens. Redshift gebruiken als transactionele database en deze op een serverloze manier vullen met behulp van Amazon Lambda-functies in realtime.
Technologieën:
- Technologieën:
Python
ETL
- Data Engineering
AWS
Data Engineer
ZS Associates - 6 maanden
- Ontwikkelde een pijplijn om gegevens om te zetten in een gestructureerd formaat, zodat ze kunnen worden aangeboden aan Prodigy voor ML-gerelateerde tagging. De hele pijplijn is modulair opgebouwd met puur Python en shell scripting.
- Implementeerde gegevenstransformaties in Python en sloeg de verwerkte gegevens op in een Amazon S3 bucket voor opslag en toegankelijkheid.
Technologieën:
- Technologieën:
Python
Data Engineer
KnowledgeFoundry - 6 jaar 3 maanden
- Geautomatiseerd schrijven van Hive queries voor ETL van meerdere tabellen (zowel eenmalig als incrementeel) door het genereren van geautomatiseerde scripts.
- CSV-bestanden van maplocaties gelezen, tabellen gemaakt en incrementele ladingen sequentieel uitgevoerd.
- Snowflake opgezet als de primaire opslagoplossing voor gestructureerde gegevens en DBT gebruikt voor ETL-processen. Maakte SQL-gebaseerde modellen om transformatielogica te definiëren en zorgde voor flexibiliteit met incrementeel laden en versiebeheer met behulp van DBT.
- Voorbereiden van getransformeerde gegevens voor analyse met behulp van business intelligence tools, waardoor inzichten moeiteloos kunnen worden ontdekt. Voerde regelmatig controles uit in Snowflake en DBT om de gegevensintegriteit en pipeline-functionaliteit te behouden.
- Ontwierp en ontwikkelde datapijplijnen voor het extraheren, transformeren en laden van gegevens uit verschillende bronnen in een gecentraliseerd datawarehouse.
Technologieën:
- Technologieën:
ETL
SQL
- Data Engineering
Educatie
BSc.Information Technology
Dharmsinh Desai University · 2015 - 2019
Vind jouw volgende ontwikkelaar binnen enkele dagen, niet maanden
In een kort gesprek van 25 minuten:
- gaan we in op wat je nodig hebt om je product te ontwikkelen;
- Ons proces uitleggen om u te matchen met gekwalificeerde, doorgelichte ontwikkelaars uit ons netwerk
- delen we de stappen met je om de juiste match te vinden, vaak al binnen een week.