Olá, seja muito bem-vindo (a), é um prazer ter você aqui. ao meu portfólio de projetos de Ciência de Dados.

Nessa página, eu demonstro minhas habilidades de resolver problemas de negócio utilizando conceitos, técnicas e ferramentas de Ciência de Dados para resolver problemas de negócio de forma prática e eficiente. Compartilho projetos desenvolvidos com dados públicos, Você vai encontrar também, minhas experiências profissionais, habilidades, ferramentas e conceitos envolvendo a Ciência de Dados.
de Ciência de Dados para resolver problemas de negócio de forma prática e eficiente.
Você vai encontrar também, minhas experiências profissionais, habilidades, ferramentas e conceitos envolvendo a Ciência de Dados.

Sobre mim

Meu nome é Felipe Ambrozio

sou estundante de ciencias de Dados estou no 4 periodo e atualmente trabalho como Fiscal de Prevenção de Perdas há 15 anos e 6 meses.

Atualmente, asumo a responsabilidade de agente de prevenção de perdas, onde monitoram e fiscaliza processos e procedimentos em estabelecimentos, visando prevenir e mitigar perdas financeiras e patrimoniais, atuando na área de varejo.
Com precedente para desenvolvendo ferramentas para flexbilizar e agilizar trabalhos, Ultilizo ferramentas como Excel para automatizar tarefaz e para estruturas dados em busca de insigner. faço operação em sistema de CFTV e gestão de Inventario, desenvolvir ferramnetas para automaizar a gestoa de precificação e organizaçao de perdas o peracional. adquirir experiência na solução de problemas de negócio e domínio sobre as ferramentas de análise de dados.

Estou buscando uma oportunidade de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Principais Habilidades

Soft Skills e Problem Solving

Resolver problemas orientados a dados e a resultado de negócio
Foco em soluções de alto impacto de negócio
Foco em métricas acionáveis
Foco na dor do negócio e do cliente
Proatividade e trabalho em Equipe
Boa comunicação oral e escrita
Objetividade e clareza ao comunicar ideias ao time
Storytelling com Dados
Raciocínio Lógico e Senso crítico

Linguagens de Programação e Banco de Dados

Python
SQL e NoSQL
R para modelagem estatística
Banco de Dados Postgresql, SQLite, MySQL, SupaBase

Machine Learning Data Mining e IA Generativa/Automatização

Modelos/Algoritmos de Classificação, Clusterização, Sistemas de Recomendação, Regressão Linear, Regressão Logística, Séries Temporais, Redes Neurais, Naive Bayes, Árvore de Decisão, Support Vector Machine (SVM), K-Means, KNN.
Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade
Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index)
Pacotes de Machine Learning: Sklearn e Scipy
Interpretabilidade de Modelos com SHAP
Lovable, N8n, VBA

Estatística para Tomada de Decisão

Estatística Descritiva
Teste de Hipóteses
Planejamento de Experimentos: Teste A/B, Teste A/B/n, DIC, DQL, DBC e Fatoriais

Visualização de Dados

Matplotlib, Seaborn, Plotly e Bokeh
Power BI, Metabase

MLOps e Engenharia de Software

Git, Github, Notion
Streamlit, Flask-API, Shiny
Azure, Docker, Airflow, PySpark, AWS Sagemaker, Google Cloud Platform ( GCP )

Pesquisa Operacional e Otimização

Algorítmos Genéticos
Otimização com Programação Linear Inteira e Não Inteira
Otimizaçõa com Programação Não Linear

Análise de Dados

Análises: Exploratória, Descritiva, Diagnóstica, Preditiva e Prescritiva
Análise de Cohort
Análise RMF
Market Basket Analysis (com Regras de Associação e Algoritmo Apriori e ECLAT)
Análise Conjunta
PCA
Análise de Sentimentos
Análise de Sobrevivência

Experiências

14.5+ anos Losprever

Sou um profissional responsáveis por monitorar a entrada e saída de pessoas e mercadorias, verificar o cumprimento de normas e procedimentos, identificar comportamentos suspeitos e implementar medidas para reduzir riscos de furtos, roubos e danos aos produtos sistema

Principais Projetos em Ciências de Dados

Projeto de Previsão de Vendas Rossmann

Nesse projeto, foram utilizados conceitos de Estatística, Programação em Python, Pensamento Analítico, Manipulação de Dados, Lógica de Negócio e Machine Learning visando resolver o problema de negócio da Rede de Farmácias Rossmann, durante o projeto foi desenvolvido um modelo de previsão de vendas automatizado para a rede de farmácias Rossmann, reduzindo a dependência de previsões manuais.

No projeto, foi desenvolvida uma aplicação web que permite um acesso fácil e integrado ao modelo em produção, tornando as previsões disponíveis para qualquer consumidor a qualquer momento.

As ferramentas utilizadas foram:

Python 3.11 e Pyenv
Ferramentas de Estatística descritiva ( localização, dispersão, assimetria, kurtosis, densidade )
Pandas e Numpy.
Matplotlib e Seaborn
Scikit-learn, Boruta, Skopt, XGBoost
Git
Flask e Streamlit

Saiba Mais

Construção de um programa de fidelidade com clusterização de clientes.

Eu usei Python, Estatística e técnicas não-supervisionadas de Machine Learning para segmentar um grupo de clientes com base em suas características de performance de compra, a fim de selecionar grupos de clientes para formar um programa de Fidelidade com o objetivo de aumentar a receita da empresa. E o resultado dessa solução, caso fosse implementada, seria de R$ 15MM de dólares de receita anual.

As ferramentas utilizadas foram:

Git, Gitlab e Github
Python, Pandas, Matplotlib e Seaborn Jupyter Notebook
K-Means, Hierarquical Clustering, DBScan
AWS Cloud ( EC2, S3, Postgres, SQLite )
Metabase Visualization

Saiba mais

Credit Score: Modelo de tomada de decisão automática na concessão de créditos

O modelo usa regressão logística e é alimentado por uma base histórica de clientes adimplentes e inadimplentes e toma a decisão calculando o risco com base na probabilidade de um cliente ser inadimplente, e também respeita a legislação brasileira a respeito de dados sensíveis

As ferramentas utilizadas foram:

Linguagem: Python
Manipulação e Tratamentos da Pipeline: Pandas
Treinamento: Scikit-learn
IDE: Google Colab
Visualização: Matplotlib

Saiba mais

Fraud Detection: Modelo de detecção de fraude em transações bancárias

As ferramentas utilizadas foram:

Linguagem: Python
Manipulação e Tratamentos da Pipeline: Pandas, imblearn, Numpy, RandomizedSearchCV
Insights: Pandas Profilling
Treinamento: Scikit-learn
IDE: Google Colab

Saiba mais

Contatos

Sinta-se à vontade para entrar em contato.