Passe para a Próxima Fase em Machine Learning com a Ajuda de um Campeão do Kaggle

Mario Filho já participou de entrevistas e eventos em parceria com

Para você que já não é "tão iniciante" assim.

É muito fácil encontrar dezenas de cursos livres, pós-graduações e bootcamps por aí para quem quer aprender Machine Learning "do zero".

Mas depois que você aprende o básico fica difícil encontrar algum caminho que você possa usar para continuar evoluindo.

São muitas áreas, algoritmos, técnicas, transformações, ferramentas, direções que você pode tomar.

E sempre fica aquela pergunta: "será que essa é a direção certa ou eu só estou perdendo tempo?"

Ler papers é uma das maneiras mais recomendadas, mas quem garante que o que você lê num paper funciona na realidade?

Afinal, no paper sempre a solução oferecida pelos pesquisadores é a melhor de todas, mas quando você vai implementar na prática, a história é bem diferente.

Sem falar que alguns autores parece que escrevem da forma mais difícil possível.

A cada três palavras você precisa procurar uma no Google.

Competir no Kaggle é outra forma muito boa de melhorar suas habilidades, mas você terá que passar pelo menos 4 horas por dia escrevendo código e testando ideias para conseguir descobrir o que realmente funciona.

Vão ter períodos de 2 ou 3 dias em que nada do que você vai testar vai funcionar. A chance de você desistir e ir fazer outra coisa é muito grande.

Você pode tentar aprender tudo sozinho e gastar um tempo enorme filtrando as melhores ideias ou pegar o atalho que eu estou te oferecendo.

A Forma Mais Rápida de Atingir o Próximo Nível em Suas Habilidades de Machine Learning

Aqui você ganha acesso a aulas de aplicação prática de machine learning em nível intermediário e avançado.

São as técnicas usadas para resolver problemas no mercado e testadas no ambiente mais "selvagem" do machine learning: competições do Kaggle.

Isso não significa que elas são difíceis de entender, pelo contrário, assim como em outros vídeos, eu explico de forma concreta, simples e prática para te ajudar.

Tudo fica mais fácil de entender com a explicação certa.

São mais de 40 aulas em HD, acompanhadas de Jupyter Notebooks em Python.

E você não precisa correr para assistir tudo de uma vez, já que seu acesso nunca expira.

A ideia é ter acesso a esse material para consultar sempre que você precisar. É normal lembrar de uma ideia e querer revisar as aulas para ver os detalhes da implementação.

Este é um Breve Resumo de Tudo o que Você Vai Aprender

1. Como Criar uma Solução de Machine Learning, da Ideia ao Deploy (26 aulas)

Neste módulo as aulas são divididas em 5 partes onde você me acompanha enquanto construo um modelo de machine learning para selecionar os vídeos mais relevantes do Youtube.

Depois de assistir as aulas você vai saber criar a primeira versão de uma solução completa de machine learning, incluindo:

  • traduzir um problema para a linguagem do machine learning
  • coletar e preparar os dados
  • criar um web app para fazer as previsões em dados novos.

Exatamente como num projeto completo de machine learning no mercado.

2. Métodos de Validação para Time Series (7 aulas)

Neste módulo você aprenderá técnicas testadas na prática para validação de modelos de machine learning em time series.

Depois de assistir estas aulas você vai:

  • saber os dois tipos principais de validação para time series
  • ter 5 métodos para escolher e comparar modelos
  • saber escolher a validação mais adequada para seus dados

3. Redes Neurais para Time Series (9 aulas)

Aqui você estudará as três estruturas mais avançadas de redes neurais para modelar time series.

Depois de assistir estas aulas você estará preparado para treinar, tunar, validar e comparar:

  • redes neurais convolucionais para time series
  • redes neurais recorrentes para time series
  • redes neurais sequence-to-sequence (encoder-decoder) para time series

4. Ensembles (Stacking) para Time Series (10 aulas)

Não existe um ambiente que te ensine mais sobre ensembles do que criar soluções vencedoras de competições de machine learning.

Você aprenderá exatamente a mesma estratégia que eu usei para gerar e combinar modelos nas soluções que usei para vencer competições:

  • como aplicar stacking, a forma mais poderosa de criar um ensemble, a time series
  • as 4 maneiras de gerar centenas de modelos rapidamente para combinar no ensemble
  • como selecionar a melhor combinação de modelos em múltiplos níveis sem cair nas armadilhas do overfitting.

E já estou preparando a próxima série de aulas para publicar nas próximas semanas sobre:

5. Feature Engineering para Time Series (já tem 4 aulas disponíveis!)

As aulas são na linguagem Python.

O pré-requisito é ter o conhecimento básico sobre estas bibliotecas ou estar disposto a aprender o básico por conta própria: Numpy, Pandas, Scipy, Scikit-learn, Pytorch e Tensorflow.

Para ajudar, no módulo de lives editadas você pode assistir tutoriais rápidos sobre Pytorch e Tensorflow.

Veja o conteúdo de cada aula mais abaixo nesta mesma página.

VER PREÇO 👉

Aprenda com Mario Filho

  • Considerado o 12º melhor cientista de dados do mundo em 2016 no ranking do Kaggle
  • Lead Data Scientist na TOTVS (2017) e Upwork Inc (2018-2019)
  • 100+ sessões de mentoria com avaliação máxima (5 estrelas) na Codementor
  • Mais de 1.000 horas trabalhadas e US$ 200 mil faturados em trabalhos freelance na Upwork
  • Kaggle Grandmaster: parte do grupo de elite dos 200 cientistas de dados mais bem-sucedidos em competições de Machine Learning
  • Mais de R$ 100 mil em prêmios em competições de Data Science.
  • Mais de 10 mil seguidores no LinkedIn, Youtube, Instagram e Facebook

Estas são as Aulas que Você Poderá Assistir Quantas Vezes Quiser, sem Limite de Tempo

01

Como Criar uma Solução de Machine Learning, da Ideia ao Deploy (26 aulas)

Defina o Problema

  • Traduzindo a Ideia para a Linguagem da Data Science
  • Como Escolher um Problema para Resolver

Prepare os Dados

  • Criando o Coletor da Página de Busca do Youtube
  • Criando o Extrator de Dados da Página de Busca do Youtube
  • Criando o Coletor de Dados da Página de Vídeo
  • Criando o Extrator de Dados da Página de Vídeo
  • Inspecionando os Dados Extraídos da Página de Vídeo
  • Limpando e Transformando os Dados
  • Criando as Primeiras Features
  • Visualizando e Interpretando uma Árvore de Decisão
  • Active Learning e Adicionando Features de Texto do Título
  • Selecionando Exemplos para o Active Learning

Crie o Modelo

  • O Primeiro Modelo - Random Forest
  • LightGBM e Bayesian Optimization
  • Regressão Logística
  • Ensemble Final

Coloque em Produção

  • Criando o Web App com o Flask - app.py
  • Criando o Web App com o Flask - run_backend.py
  • Criando o Web App com o Flask - get_data.py e ml_utils.py
  • Criando o Contêiner com Docker
  • Construindo e Rodando o Docker
  • Enviando para o Heroku
  • Analisando a Solução Final

Melhorando o App

  • Armazenando dados numa DB SQL com SQLite3
  • Criando a API "predict" para retornar previsões em vídeos fora da DB
  • BÔNUS: Tutorial rápido de Scrapy

02

Métodos de Validação para Time Series (7 aulas)

  • Holdout Simples
  • Repeated Holdout
  • Prequential Expanding
  • Prequential Sliding
  • Block e Combinatorial Cross-Validation
  • Comparação dos Métodos com a Distribuição de Avaliações do Teste
  • Comentários sobre o Paper que Usei como Referência

03

Redes Neurais para Time Series (9 aulas)

  • Redes Neurais Convolucionais para Time Series - Primeiros Passos
  • Redes Neurais Recorrentes para Time Series - LSTM parte 1
  • Redes Neurais Recorrentes para Time Series - LSTM parte 2
  • Redes Neurais Recorrentes para Time Series - LSTM com variáveis da estrutura da data
  • Redes Neurais Recorrentes para Time Series - LSTM com previsão a cada passo
  • Redes Neurais Recorrentes para Time Series - Estabilizando as previsões e rodando na GPU
  • Redes Neurais Recorrentes para Time Series - Tunando com Bayesian Optimization
  • Comparando a CNN e a RNN
  • Encoder-Decoder (Seq2Seq) para Time Series

04

Feature Engineering para Time Series (4 aulas)

  • Transformação Avançada de Categóricas com Likelihood e P-value - Pré-processamento dos dados
  • Transformação Avançada de Categóricas com Likelihood e P-value - Likelihood
  • Transformação Avançada de Categóricas com Likelihood e P-value - Weighted Likelihood
  • Transformação Avançada de Categóricas com Likelihood e P-value - Featurização e Modelagem

05

Ensembles (Stacking) para Time Series (10 aulas)

  • Introdução ao Stacking na Prática
  • Split de dados e LightGBM
  • Redes Neurais e Primeira Stack
  • EXTRA: Análise de Overfitting entre Validação e Teste (Robustez)
  • Diversidade com Grupos de Features e Mais uma Rede Neural
  • XGBoost na GPU e Diversidade em Grupos de Linhas
  • Diversidade de Hiperparâmetros e Ideias Criativas com XGBoost
  • (Boosted) Random Forest
  • Stacking (com Model Selection) Usando Ridge
  • Stack Final com Média Ponderada de 2 Modelos
  • Didática aprovada por mais de 500 alunos
  • 30 dias de garantia incondicional
  • Assista quando e quantas vezes quiser, seu acesso nunca expira
  • Mais de 40 aulas avançadas sobre machine learning com Jupyter Notebooks disponíveis
  • Professor premiado 5 vezes em competições práticas de machine learning

Estas são Mensagens de Alguns de Seus Colegas de Classe

"Quer aprender a desenvolver uma solução de Data Science completa?

Então, preciso te recomendar o curso do Mario Filho!

Concluí o curso do Mario nesse fim de semana e gostei muito!

Acho que o Mario acertou bem no formato:

- Não é um curso longo (nada de curso de 50 horas e que você não chega nem a desenvolver um projeto).

- O projeto que ele ensina não é "engessado", ele te dá todo o passo a passo de como fazer, mas você também tem a liberdade de customizar muitas coisas do seu jeito. E afinal, projeto engessado não ensina, só te faz reproduzir código pronto.

- Tem um precinho camarada, e caso você deseje, tem a possibilidade de parcelar.

- E você também tem um canal aberto com ele para tirar dúvidas e fazer sugestões.

Então, nessa quarentena, se quiser aproveitar o tempo e aprender um projeto como esse, recomendo muito o curso do Mario!"

Hugo

"A demanda de profissionais de Data Science não só pelo Brasil, mas pelo mundo tem sido cada vez maior e com isso, tem aumentado também o número de cursos e formações de cientistas de dados e tem sido cada vez mais difícil separar o 'joio do trigo'.

Alguns inclusive propõe 'soluções' milagrosas.

Não existe milagre.

Esse final de semana pude finalizar o curso mais completo que já fiz sobre o assunto e de quebra acompanhar o grande Mario Filho em um projeto de Data Science do zero até o deploy.

O curso começa no desenvolvimento do problema, web scraping para montar o dataset, técnicas de active learning, construção do modelo de machine learning, do docker e da API em Flask.

Excelente para quem estiver começando e não sabe como tornar o seu primeiro projeto algo real."

Sara

"Obrigado Mario Filho!

Você mudou a minha a visão sobre o que realmente importa sobre os conhecimentos técnicos para gerar valor com Data Science e Machine Learning.

Curso extremamente diferenciado na sua abordagem 100% Hands On.

Me inspirou a começar desenvolver a minha primeira solução com Machine Learning!"

Daniel

"Curso excelente!

Aborda conceitos necessários para conduzir um projeto de Data Science.

Mario Filho atualmente possui um dos melhores conteúdos sobre Data Science em português."

Alexandre

"Alguns insights  do curso do Kaggle Grandmaster Mario Filho. 

Primeiro, uma frase que vi no livro "Manual do CEO" de Josh Kaufman.

"Trabalhar na coisa certa provavelmente é mais importante do que se empenhar."

Talvez essa frase simbolize a maior dificuldade para quem busca um lugar ao sol na área de DS, assim como eu:

- Cursos do udemy são um bom "start" mas há uma exaltação implícita dos algoritmos quando a parte fundamental está no tratamento dos dados e no entendimento do que se deseja modelar para criação de novas "features", algo mais subjetivo que ensembles de árvores e redes neurais.

- Por vezes cai no erro mais comum que era exagerar no estudo teórico, modus operandi fruto da formação acadêmica em exatas, o equilíbrio para entranhar o conhecimento é resolver problemas e aprender sob demanda depois que se domina fundamentos principais.

- Agradeço aos ensinamentos que me propiciaram uma visão global de um projeto prático desde a formulação do problema até o deploy, a lapidação que eu precisava,  "era a coisa certa que eu deveria dispender meu empenho". "

Jarbas

"Muito obrigado, Mario!! Sério, o curso está muito bacana!

O projeto é simples, mas ao mesmo tempo desafiador por passar por todas as etapas de desenvolvimento.

Pra mim, a melhor parte foi a modelagem, é muito bom conhecer um pouco como pensa a mente de um cientista de dados experiente durante esse processo.

E claro, construir a aplicação também foi muito enriquecedor, saber entregar os resultados em uma solução acessível é às vezes o background que falta para muitos cientistas de dados.

Obrigado por ter disponibilizado esse curso, estou recomendando pra todo mundo que me pergunta sobre curso de Data Science agora hahaha!

Abraços!"

Gustavo

Ainda está em Dúvida?

Q: Por que comprar se posso aprender tudo sozinho na internet?

Fora deste curso você não vai aprender com alguém que tenha mais de mil horas trabalhadas em projetos de Data Science e cinco prêmios em competições de machine learning.

O material das aulas foi feito com base em várias fontes diferentes (papers, tutoriais, experiência, artigos de blog) que eu fui encontrando com o tempo. Não é algo que você encontra por aí com uma pesquisa simples no Google.

Não tem outro lugar em que tudo isso está reunido e organizado para você.

Q: Como saber se preencho os requisitos?

O pré-requisito é ter o conhecimento básico sobre estas bibliotecas ou estar disposto a aprender o básico por conta própria: Numpy, Pandas, Scipy, Scikit-learn, Pytorch e Tensorflow.

Se mesmo assim você estiver em dúvida, lembre que há uma garantia de 30 dias após a compra.

Neste período você pode desistir do curso e eu te devolvo todo o dinheiro sem precisar de qualquer justificativa de sua parte.

Q: E se surgir alguma dúvida durante as aulas?

Em cada aula há uma parte de comentários onde você pode postar as suas dúvidas e ver as dúvidas respondidas de outros alunos também.

Q: Existem tarefas para ajudar no aprendizado?

Não existem tarefas obrigatórias, mas todos os scripts e notebooks usados estão disponíveis.

Q: Posso usar o projeto do primeiro curso no meu portfolio?

Você pode usar o projeto em seu portfolio.

Q: Tem certificado?

Sim, mas é mais para você guardar como recordação do que usar no mercado, já que o que vale é o portfólio que você constrói com o que aprende aqui.