Kaggle Grandmaster te Mostra Como Criar uma Solução Completa de Data Science.

Passando por Todas as Fases, da Ideia ao Deploy

“Machine Learning é Apenas 10% de um Projeto de Data Science”

Você já deve ter ouvido falar que a maior parte do tempo de um cientista de dados é gasta na preparação dos dados…

Mesmo assim, a maioria dos cursos foca em ensinar apenas a parte da modelagem.

O professor te dá um dataset pronto, limpo e com uma tarefa bem definida, faltando você preencher apenas um pouco do código para tudo funcionar e você ganhar nota dez.

Na vida real, não é assim…

Um projeto de Data Science é muito mais do que apenas um modelo de Machine Learning.

Existem 5 passos:

  • 1. Definição do Problema
  • 2. Preparação dos Dados
  • 3. Modelagem
  • 4. Deploy
  • 5. Monitoramento

Para ser um cientista de dados profissional, você precisa saber como funciona cada uma destas partes.

As empresas valorizam muito mais quem chega com essa experiência do que quem só fez modelos em notebooks com datasets prontos…

O que torna mais fácil entrar no mercado se você já tiver feito esse tipo de projeto.

Mas como ganhar essa experiência antes de conseguir trabalhar em casos reais dentro de uma empresa?

Se você já sabe:

  • O Básico de Machine Learning
  • Programar em Python
  • Usar bibliotecas como Numpy, Pandas e Scikit-learn
  • Treinar e validar um modelo simples de machine learning
  • Está disposto a estudar 15 minutos por dia

Vou te ensinar a fazer um projeto de Data Science, “da ideia ao deploy”, que você pode colocar em seu portfolio para mostrar para as empresas.

Isso é o que você precisa saber na hora de fazer um projeto de Data Science na vida real.

Você terá uma maneira concreta de demonstrar que tem as habilidades técnicas necessárias para trabalhar na empresa.

É a prova que, quando o time de negócios chegar para você com um problema, você estará pronto para ajudar a criar uma solução baseada em dados.

Tudo que nós temos no começo do curso é um problema e uma ideia, mas no fim do curso teremos a primeira solução para resolver o problema.

E você terá acesso a todos os materiais que eu usei.

Com eles você pode repetir cada passo que eu mostro nos vídeos para recriar a solução e usá-la no seu portfólio para tornar seu currículo mais atraente.

E se você quiser um desafio maior, você pode fazer um projeto completamente novo.

O método que eu ensino serve para qualquer projeto de Data Science que envolva machine learning.

É exatamente o mesmo processo que eu uso para entregar projetos para clientes da minha consultoria

E também que eu usava quando trabalhava como cientista de dados contratado nas empresas.

Nós vamos criar, juntos, um recomendador de vídeos do Youtube.

COMPRAR O CURSO

Aprenda com Mario Filho

  • Considerado o 12º melhor cientista de dados do mundo em 2016 no ranking do Kaggle
  • Lead Data Scientist na TOTVS (2017) e Upwork Inc (2018-2019)
  • 100+ sessões de mentoria com avaliação máxima (5 estrelas) na Codementor
  • Mais de 1.000 horas trabalhadas e US$ 200 mil faturados em trabalhos freelance na Upwork
  • Kaggle Grandmaster: parte do grupo de elite dos 200 cientistas de dados mais bem-sucedidos em competições de Machine Learning
  • Mais de R$ 100 mil em prêmios em competições de Data Science.
  • Mais de 10 mil seguidores no LinkedIn, Youtube, Instagram e Facebook

O Que Você Vai Aprender

Este é o conteúdo de cada vídeo do curso.

01

Defina o Problema

  • Traduzindo a Ideia para a Linguagem da Data Science
  • Como Escolher um Problema para Resolver

02

Prepare os Dados

  • Criando o Coletor da Página de Busca do Youtube
  • Criando o Extrator de Dados da Página de Busca do Youtube
  • Criando o Coletor de Dados da Página de Vídeo
  • Criando o Extrator de Dados da Página de Vídeo
  • Inspecionando os Dados Extraídos da Página de Vídeo
  • Limpando e Transformando os Dados
  • Criando as Primeiras Features
  • Visualizando e Interpretando uma Árvore de Decisão
  • Active Learning e Adicionando Features de Texto do Título
  • Selecionando Exemplos para o Active Learning

03

Crie o Modelo

  • O Primeiro Modelo - Random Forest
  • LightGBM e Bayesian Optimization
  • Regressão Logística
  • Ensemble Final

04

Coloque em Produção

  • Criando o Web App com o Flask - app.py
  • Criando o Web App com o Flask - run_backend.py
  • Criando o Web App com o Flask - get_data.py e ml_utils.py
  • Criando o Contêiner com Docker
  • Construindo e Rodando o Docker
  • Enviando para o Heroku
  • Analisando a Solução Final

05

Melhorando o App

  • Armazenando dados numa DB SQL com SQLite3
  • Criando a API "predict" para retornar previsões em vídeos fora da DB
  • BÔNUS: Tutorial rápido de Scrapy

Veja o que Outros Alunos Acharam do Curso

"Quer aprender a desenvolver uma solução de Data Science completa?

Então, preciso te recomendar o curso do Mario Filho!

Concluí o curso do Mario nesse fim de semana e gostei muito!

Acho que o Mario acertou bem no formato:

- Não é um curso longo (nada de curso de 50 horas e que você não chega nem a desenvolver um projeto).

- O projeto que ele ensina não é "engessado", ele te dá todo o passo a passo de como fazer, mas você também tem a liberdade de customizar muitas coisas do seu jeito. E afinal, projeto engessado não ensina, só te faz reproduzir código pronto.

- Tem um precinho camarada, e caso você deseje, tem a possibilidade de parcelar.

- E você também tem um canal aberto com ele para tirar dúvidas e fazer sugestões.

Então, nessa quarentena, se quiser aproveitar o tempo e aprender um projeto como esse, recomendo muito o curso do Mario!"

Hugo

"A demanda de profissionais de Data Science não só pelo Brasil, mas pelo mundo tem sido cada vez maior e com isso, tem aumentado também o número de cursos e formações de cientistas de dados e tem sido cada vez mais difícil separar o 'joio do trigo'.

Alguns inclusive propõe 'soluções' milagrosas.

Não existe milagre.

Esse final de semana pude finalizar o curso mais completo que já fiz sobre o assunto e de quebra acompanhar o grande Mario Filho em um projeto de Data Science do zero até o deploy.

O curso começa no desenvolvimento do problema, web scraping para montar o dataset, técnicas de active learning, construção do modelo de machine learning, do docker e da API em Flask.

Excelente para quem estiver começando e não sabe como tornar o seu primeiro projeto algo real."

Sara

Muito obrigado, Mario!! Sério, o curso está muito bacana!

O projeto é simples, mas ao mesmo tempo desafiador por passar por todas as etapas de desenvolvimento.

Pra mim, a melhor parte foi a modelagem, é muito bom conhecer um pouco como pensa a mente de um cientista de dados experiente durante esse processo.

E claro, construir a aplicação também foi muito enriquecedor, saber entregar os resultados em uma solução acessível é às vezes o background que falta para muitos cientistas de dados.

Obrigado por ter disponibilizado esse curso, estou recomendando pra todo mundo que me pergunta sobre curso de Data Science agora hahaha!

Abraços!"

Gustavo

Para Maximizar Suas Chances de Sucesso

certificate

ACESSO AOS MATERIAIS

Com eles você pode repetir cada passo que eu mostrei nos vídeos para recriar a solução e usá-la no seu portfólio para tornar seu currículo mais atraente.

handshake-heart

APLIQUE EM QUALQUER PROJETO

O método que eu ensino serve para qualquer projeto de Data Science que envolva machine learning.

floorplan

ACESSO SEM LIMITE DE TEMPO

O curso tem apenas 6 horas de aula e seu acesso aos vídeos e materiais adicionais não expira.

ribbon

30 DIAS DE GARANTIA

Se você não gostar do curso, basta enviar um e-mail em até 30 dias corridos após a compra e te reembolso o valor total, sem precisar de justificativas.

COMPRAR O CURSO

Perguntas Frequentes

Q: Quem é o Professor?

Meu nome é Mario Filho.

Eu trabalho como cientista de dados desde 2014.

Conquistei 5 prêmios em competições internacionais de machine learning, ocupei o 12º lugar no ranking dos melhores cientistas de dados do mundo no Kaggle e faço parte do seleto grupo de Kaggle Competitions Grandmasters.

A maior parte da minha carreira foi como freelancer, até o dia em que eu resolvi procurar um emprego “normal”, em agosto de 2017.

Me candidatei a 9 vagas de cientista de dados em startups, empresas de tecnologia e bancos.

E recebi ofertas de todas elas.

Foram duas semanas intensas, com recrutadores pedindo que eu não aceitasse as ofertas dos concorrentes até que eles pudessem negociar uma proposta melhor para me oferecer.

Aceitei uma oferta e comecei a trabalhar, mas a história só estava começando…

Poucos meses depois fui contatado pela Upwork, uma empresa com sede no Vale do Silício, e eles não desistiram enquanto não aceitei trabalhar para eles.

É por isso que você pode acreditar quando eu te falo…

O que mais fez a diferença nestes processos, de longe, foi demonstrar que eu sabia pegar um problema e criar uma solução de Data Science para resolvê-lo em pouco tempo.

Q: Por que este curso é diferente?

Cursos de machine learning costumam focar muito na parte dos algoritmos.

Os datasets já vem prontos e tudo o que você precisa fazer é preencher algumas linhas de código para fazer tudo funcionar.

Não é assim que funciona na vida real.

Apesar de ser importante aprender os algoritmos e modelos, não adianta saber todos eles e não entender como encaixar tudo isso para resolver um problema real.

É aí que entra este curso.

Aqui você aprende a combinar os métodos, técnicas e algoritmos para criar uma solução de Data Science.

Tudo que nós temos no começo é um problema e uma ideia, mas no fim do curso teremos a primeira solução para resolver o problema.

Q: Por que comprar se posso aprender tudo sozinho na internet?

Tudo depende de quanto esforço e tempo você tem para aprender.

Se você pode dedicar muitos anos para:

  • encontrar as ferramentas utilizadas no mercado
  • materiais que ensinem a usar essas ferramentas
  • a sequência certa para aprender

Não faz sentido fazer esse curso.

Agora se você quer aprender, em poucas horas:

  • as ferramentas que eu testei na prática em dezenas de projetos
  • em um conjunto de aulas que tenha uma sequência baseada nas centenas de horas de mentoria que já fiz
  • poder tirar suas dúvidas sobre os vídeos dentro da comunidade

Este curso vai te ajudar.

Além disso, fora deste curso você não vai aprender com alguém que tenha mais de mil horas trabalhadas em projetos de Data Science e cinco prêmios em competições de machine learning.

Q: Como saber se preencho os requisitos?

Se você acompanhou e entendeu os vídeos do tutorial do Titanic no meu canal do Youtube, você preenche os requisitos básicos para fazer este curso.

Se mesmo assim você estiver em dúvida, lembre que há uma garantia de 30 dias após a compra.

A maior garantia de um curso de Data Science no Brasil.

Neste período você pode desistir do curso e eu te devolvo todo o dinheiro sem precisar de qualquer justificativa de sua parte.

Q: E se surgir alguma dúvida durante as aulas?

Em cada vídeo há uma parte de comentários onde você pode postar as suas dúvidas e ver as dúvidas respondidas de outros alunos também.

Q: Existem tarefas para ajudar no aprendizado?

Não existem tarefas obrigatórias, mas a ideia é que você faça um projeto seguindo a mesma linha que eu mostro nos vídeos.

Todos os arquivos usados estão disponíveis.

Alguns alunos pegam os arquivos, melhoram o mesmo projeto que é apresentado nos vídeos (recomendador de vídeos do youtube) e colocam no portfólio.

Outros fazem um projeto independente, como um aluno que criou um recomendador de carros para escolher o carro que ele deveria comprar.

Todos eles servem como projetos para mostrar para recrutadores, porque mostram que você sabe fazer o processo da ideia ao deploy.

E eu sempre compartilho esses projetos nas redes sociais, primeiro porque é uma conquista importante e eu gosto de incentivar, mas também para dar visibilidade ao aluno.

Q: Posso usar o projeto no meu portfolio?

Você pode (e deve) usar o projeto em seu portfolio.

A ideia é colocar em prática o que você aprendeu e mostrar para as empresas!

Visite meu Instagram/LinkedIn para ver os projetos de alguns alunos.

Q: Tem certificado?

Sim, mas é mais para você guardar como recordação do que usar no mercado.

Os recrutadores se importam muito mais com seus projetos do que com os certificados dos cursos.

Q: Qual hardware eu preciso para fazer este curso?

Existem alunos fazendo o curso com computadores comuns com 4GB de memória.

A parte que consome mais memória é a geração do contêiner do Docker, que atinge um pico de 800MB.

Não precisa de GPU (placa de vídeo).

P.S.: Não esqueça, este curso vai te ensinar a habilidade mais importante para conseguir um emprego em Data Science.

Este preço é por tempo limitado e eu não ofereço descontos!

Você terá 30 (trinta) dias corridos de garantia.