Sobre mim

Meu nome é Felipe Ambrozio

sou estundante de ciencias de Dados estou no 4 periodo e atualmente trabalho como Fiscal de Prevenção de Perdas há 15 anos e 6 meses.

Atualmente, asumo a responsabilidade de agente de prevenção de perdas, onde monitoram e fiscaliza processos e procedimentos em estabelecimentos, visando prevenir e mitigar perdas financeiras e patrimoniais, atuando na área de varejo.
Com precedente para desenvolvendo ferramentas para flexbilizar e agilizar trabalhos, Ultilizo ferramentas como Excel para automatizar tarefaz e para estruturas dados em busca de insigner. faço operação em sistema de CFTV e gestão de Inventario, desenvolvir ferramnetas para automaizar a gestoa de precificação e organizaçao de perdas o peracional. adquirir experiência na solução de problemas de negócio e domínio sobre as ferramentas de análise de dados.

Estou buscando uma oportunidade de trabalhar profissionalmente como Cientista de Dados para melhorar a tomada de decisão da empresa, através da construção de soluções usando dados.

Principais Habilidades

Soft Skills e Problem Solving

  • Resolver problemas orientados a dados e a resultado de negócio
  • Foco em soluções de alto impacto de negócio
  • Foco em métricas acionáveis
  • Foco na dor do negócio e do cliente
  • Proatividade e trabalho em Equipe
  • Boa comunicação oral e escrita
  • Objetividade e clareza ao comunicar ideias ao time
  • Storytelling com Dados
  • Raciocínio Lógico e Senso crítico

Linguagens de Programação e Banco de Dados

  • Python
  • SQL e NoSQL
  • R para modelagem estatística
  • Banco de Dados Postgresql, SQLite, MySQL, SupaBase

Machine Learning Data Mining e IA Generativa/Automatização

  • Modelos/Algoritmos de Classificação, Clusterização, Sistemas de Recomendação, Regressão Linear, Regressão Logística, Séries Temporais, Redes Neurais, Naive Bayes, Árvore de Decisão, Support Vector Machine (SVM), K-Means, KNN.
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade
  • Métricas de performance dos algoritmos (RMSE, MAE, MAPE, Confusion Matrix, Precisão, Recall, Curva ROC, Curva Lift, AUC, Silhouette Score, DB-Index)
  • Pacotes de Machine Learning: Sklearn e Scipy
  • Interpretabilidade de Modelos com SHAP
  • Lovable, N8n, VBA

Estatística para Tomada de Decisão

  • Estatística Descritiva
  • Teste de Hipóteses
  • Planejamento de Experimentos: Teste A/B, Teste A/B/n, DIC, DQL, DBC e Fatoriais

Visualização de Dados

  • Matplotlib, Seaborn, Plotly e Bokeh
  • Power BI, Metabase

MLOps e Engenharia de Software

  • Git, Github, Notion
  • Streamlit, Flask-API, Shiny
  • Azure, Docker, Airflow, PySpark, AWS Sagemaker, Google Cloud Platform ( GCP )

Pesquisa Operacional e Otimização

  • Algorítmos Genéticos
  • Otimização com Programação Linear Inteira e Não Inteira
  • Otimizaçõa com Programação Não Linear

Análise de Dados

  • Análises: Exploratória, Descritiva, Diagnóstica, Preditiva e Prescritiva
  • Análise de Cohort
  • Análise RMF
  • Market Basket Analysis (com Regras de Associação e Algoritmo Apriori e ECLAT)
  • Análise Conjunta
  • PCA
  • Análise de Sentimentos
  • Análise de Sobrevivência

Experiências

14.5+ anos Losprever

Sou um profissional responsáveis por monitorar a entrada e saída de pessoas e mercadorias, verificar o cumprimento de normas e procedimentos, identificar comportamentos suspeitos e implementar medidas para reduzir riscos de furtos, roubos e danos aos produtos sistema

Principais Projetos em Ciências de Dados

Projeto de Previsão de Vendas Rossmann

Nesse projeto, foram utilizados conceitos de Estatística, Programação em Python, Pensamento Analítico, Manipulação de Dados, Lógica de Negócio e Machine Learning visando resolver o problema de negócio da Rede de Farmácias Rossmann, durante o projeto foi desenvolvido um modelo de previsão de vendas automatizado para a rede de farmácias Rossmann, reduzindo a dependência de previsões manuais.

No projeto, foi desenvolvida uma aplicação web que permite um acesso fácil e integrado ao modelo em produção, tornando as previsões disponíveis para qualquer consumidor a qualquer momento.

As ferramentas utilizadas foram:

  • Python 3.11 e Pyenv
  • Ferramentas de Estatística descritiva ( localização, dispersão, assimetria, kurtosis, densidade )
  • Pandas e Numpy.
  • Matplotlib e Seaborn
  • Scikit-learn, Boruta, Skopt, XGBoost
  • Git
  • Flask e Streamlit

Construção de um programa de fidelidade com clusterização de clientes.

Eu usei Python, Estatística e técnicas não-supervisionadas de Machine Learning para segmentar um grupo de clientes com base em suas características de performance de compra, a fim de selecionar grupos de clientes para formar um programa de Fidelidade com o objetivo de aumentar a receita da empresa. E o resultado dessa solução, caso fosse implementada, seria de R$ 15MM de dólares de receita anual.

As ferramentas utilizadas foram:

  • Git, Gitlab e Github
  • Python, Pandas, Matplotlib e Seaborn Jupyter Notebook
  • K-Means, Hierarquical Clustering, DBScan
  • AWS Cloud ( EC2, S3, Postgres, SQLite )
  • Metabase Visualization

Credit Score: Modelo de tomada de decisão automática na concessão de créditos

O modelo usa regressão logística e é alimentado por uma base histórica de clientes adimplentes e inadimplentes e toma a decisão calculando o risco com base na probabilidade de um cliente ser inadimplente, e também respeita a legislação brasileira a respeito de dados sensíveis

As ferramentas utilizadas foram:

  • Linguagem: Python
  • Manipulação e Tratamentos da Pipeline: Pandas
  • Treinamento: Scikit-learn
  • IDE: Google Colab
  • Visualização: Matplotlib

Fraud Detection: Modelo de detecção de fraude em transações bancárias

O modelo usa regressão logística e é alimentado por uma base histórica de clientes adimplentes e inadimplentes e toma a decisão calculando o risco com base na probabilidade de um cliente ser inadimplente, e também respeita a legislação brasileira a respeito de dados sensíveis

As ferramentas utilizadas foram:

  • Linguagem: Python
  • Manipulação e Tratamentos da Pipeline: Pandas, imblearn, Numpy, RandomizedSearchCV
  • Insights: Pandas Profilling
  • Treinamento: Scikit-learn
  • IDE: Google Colab

Contatos

Sinta-se à vontade para entrar em contato.