Projeto de Previsão de Vendas Rossmann
Nesse projeto, foram utilizados conceitos de Estatística, Programação em Python,
Pensamento Analítico, Manipulação de Dados, Lógica de Negócio e Machine Learning visando
resolver o problema de negócio da Rede de Farmácias Rossmann, durante o projeto foi
desenvolvido um modelo de previsão de vendas automatizado para a rede de farmácias
Rossmann, reduzindo a dependência de previsões manuais.
No projeto, foi desenvolvida uma aplicação web que permite um acesso fácil e integrado ao
modelo em produção, tornando as previsões disponíveis para qualquer consumidor a
qualquer momento.
As ferramentas utilizadas foram:
- Python 3.11 e Pyenv
- Ferramentas de Estatística descritiva ( localização, dispersão, assimetria,
kurtosis, densidade )
- Pandas e Numpy.
- Matplotlib e Seaborn
- Scikit-learn, Boruta, Skopt, XGBoost
- Git
- Flask e Streamlit
Construção de um programa de fidelidade com clusterização de clientes.
Eu usei Python, Estatística e técnicas não-supervisionadas de Machine Learning para
segmentar um grupo de clientes com base em suas características de performance de
compra, a fim de selecionar grupos de clientes para formar um programa de Fidelidade com
o objetivo de aumentar a receita da empresa. E o resultado dessa solução, caso fosse
implementada, seria de R$ 15MM de dólares de receita anual.
As ferramentas utilizadas foram:
- Git, Gitlab e Github
- Python, Pandas, Matplotlib e Seaborn Jupyter Notebook
- K-Means, Hierarquical Clustering, DBScan
- AWS Cloud ( EC2, S3, Postgres, SQLite )
- Metabase Visualization
Credit Score: Modelo de tomada de decisão automática na concessão de créditos
O modelo usa regressão logística e é alimentado por uma base histórica de clientes
adimplentes e inadimplentes e toma a decisão calculando o risco com base na
probabilidade de um cliente ser inadimplente, e também respeita a legislação brasileira
a respeito de dados sensíveis
As ferramentas utilizadas foram:
- Linguagem: Python
- Manipulação e Tratamentos da Pipeline: Pandas
- Treinamento: Scikit-learn
- IDE: Google Colab
- Visualização: Matplotlib
Fraud Detection: Modelo de detecção de fraude em transações bancárias
O modelo usa regressão logística e é alimentado por uma base histórica de clientes
adimplentes e inadimplentes e toma a decisão calculando o risco com base na
probabilidade de um cliente ser inadimplente, e também respeita a legislação brasileira
a respeito de dados sensíveis
As ferramentas utilizadas foram:
- Linguagem: Python
- Manipulação e Tratamentos da Pipeline: Pandas, imblearn, Numpy, RandomizedSearchCV
- Insights: Pandas Profilling
- Treinamento: Scikit-learn
- IDE: Google Colab