


















Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Aprenda a programacao com python
Tipologia: Resumos
1 / 26
Esta página não é visível na pré-visualização
Não perca as partes importantes!



















O que Vamos Precisar? Antes de começar com as explicações, é importante que você saiba o que vai precisar para poder seguir com a aula sem que você fique perdido. Então vou te mostrar o que precisa e já vou deixar os links caso você não tenha ou tenha alguma dúvida sobre como baixar, configurar ou instalar o que for necessário para a aula.
Antes de iniciar de fato o projeto, é interessante que você entenda a base de dados que vai utilizar e o que cada informação significa para ter um melhor entendimento. Aqui eu vou te mostrar essa base de dados já dentro do nosso editor de Python, pois ela está em extensão .csv , o que dificulta um pouco a visualização dos dados.
Entendendo a Base de Dados Essa é uma base de dados de cancelamento de clientes em uma empresa fictícia. Mas lembre-se de que isso é bem semelhante ao que vai encontrar no seu dia a dia de trabalho, então o que vamos fazer aqui é algo que você vai poder replicar no seu trabalho! Então é possível que se depare com bases de dados bem similares a essa.
Idade Sexo – Masculino e Feminino Tempo_como_cliente Frequencia_uso – A frequência de uso desse cliente Ligacoes_callcenter – Quantas vezes o cliente ligou ao Call Center da empresa Dias_atraso – Dias em que o cliente esteve em atraso Assinatura – O plano que o cliente possui Duracao_contrato – Tempo de duração do contrato (Mensal, Trimestral e Anual) Total_gasto Meses_ultima_interação – Meses desde a última interação do cliente Cancelou – Se o cliente cancelou ( 1 ) ou não ( 0 ) sua assinatura
O Python, é uma linguagem de programação. Ok.... Mas o que é uma linguagem de programação?? Assim como temos diferentes línguas para falarmos, existem diversas línguas que nos permitem “falar” com os computadores. Entre as línguas de produção, o Python é uma das mais fáceis de aprender e uma das que mais cresce no mundo em termos de utilização. Pode ser utilizado em diversas áreas:
O que é o Python?
Tendo tudo instalado e com a base de dados na pasta onde criou o seu arquivo ( main.ipynb ). É importante que o seu arquivo tenha essa extensão para que você consiga utilizar o Jupyter dentro do Visual Studio Code (VSCode). Nós já podemos começar a importação da nossa base de dados.
Importando a base de dados Vamos iniciar com a importação da biblioteca pandas ( 1 ª linha de código). Essa é uma biblioteca muito utilizada em análise de dados, então é uma biblioteca muito importante para essa área. Após importar a biblioteca pandas nós vamos utilizar o pd.read_csv para ler o nosso arquivo que está no formato csv. A ideia é atribuir essa tabela a uma variável, que nesse caso vai se chamar tabela. É interessante você colocar nomes intuitivos para saber do que se tratam seus dados, então tabela é um bom nome para iniciar. Logo abaixo nós vamos utilizar o comando tabela.drop para remover a coluna CustomerID da nossa base de dados, pois essa informação não é útil e não adiciona nada na nossa análise. É apenas o número do cliente, por esse motivo podemos remover essas informações logo no início. Para finalizar vamos utilizar o comando display para visualizar a nossa base de dados.
Removendo Informações Vazias Antes de começar com as análise é essencial que você faça o tratamento de dados, assim evita trazer erro por conta de dados desnecessários ou até inexistentes. Você deve ter visto na visualização da base de dados que nós temos 881. 666 linhas de informação. Só que como você deve saber, nem toda base de dados é completa, então nós vamos ter informações em branco, e essas informações podem atrapalhar nossas análises. Por isso nós vamos utilizar o comando tabela.dropna para remover as informações vazias da nossa tabela. Na imagem a esquerda você consegue ver as informações dos dados em cada uma das colunas. Com isso, pode notar que não temos 881. 666 informações não vazias (ou seja, informações preenchidas). Por esse motivo que vamos utilizar o dropna , para remover essas informações vazias e padronizar nossa base de dados para manter a mesma quantidade de informações em todas as colunas.
Verificando o Cancelamento por Contrato IMPORTANTE: Na parte de análise de dados, não tem uma informação correta para ser analisada logo de cara. Esse é um processo que vai tomar tempo, pois você de fato precisa analisar os dados e entender o que está acontecendo na sua base de dados. Então pode ser que demore mais em alguns casos para encontrar o que procura antes de propor sua solução. Já vimos como está a relação do cancelamento dos clientes, agora podemos dar uma olhada como está a duração do contrato desses clientes. Lembrando que temos 3 tipos de contrato : mensal, trimestral e anual. Então é interessante ver como está essa proporção para verificar se isso pode ser um fator que afeta diretamente o cancelamento do serviço. Com essa simples análise você já nota que temos a seguinte proporção na duração dos contratos:
Analisando as Informações dos Conratos Aqui nós vamos utilizar o groupby para agrupar as informações da coluna duração_contrato e depois fazer a média das informações que temos na tabela. Isso vai nos dar uma informação mais geral de cada um desses planos, e podemos verificar se tem alguma informação importante. Com as informações agrupadas, é possível notar que os clientes do plano Mensal , possuem uma média de cancelamento igual a 1 , ou seja, praticamente todos os clientes que utilizam esse plano fizeram o cancelamento do serviço. Esse já é um ponto importante dentro da nossa análise, pois existe um plano dessa empresa, onde praticamente todos os clientes fazem o cancelamento do serviço.
Análise de Assinaturas Como ainda temos um número bem alto de cancelamentos vamos agora fazer uma análise nas assinaturas para verificar se podemos tirar alguma conclusão para melhorar esse índice de cancelamentos. Primeiro vamos fazer a contagem dos valores na coluna de assinaturas para saber quantas assinaturas temos em cada um dos planos. Em seguida vamos agrupar as informações por assinatura e obter a média das linhas para cada uma das colunas. Na primeira análise podemos verificar que temos praticamente a mesma quantidade em cada uma das assinaturas, ou seja, temos praticamente 1 / 3 em cada assinatura. E na segunda análise temos que os valores de cancelamento também são muito parecidos. O que fazer agora? Não podemos excluir nenhuma informação, pois os dados são praticamente iguais. Isso quer dizer que vamos ter que ir mais fundo na nossa análise de dados. Foi o que eu comentei anteriormente, nem sempre vamos achar logo de cara o que precisamos!
Análises Gráficas Como a última análise não foi muito boa para poder verificar quais informações poderiam ser removidas, vamos criar alguns gráficos, pois dessa forma fica muito mais fácil visualizar os dados e obter as informações que de fato estão aumentando o número de cancelamentos nessa empresa. Para criação dos gráficos nós vamos utilizar a biblioteca plotly.express , então se você ainda não instalou a biblioteca basta ir até o terminal e escrever pip install plotly. OBS: Caso tenha problemas na visualização dos gráficos depois de instalar a biblioteca, volte ao terminal e escreva pip install nbformat. Feito isso, vamos utilizar a estrutura de repetição For para percorrer cada uma das colunas da nossa tabela. Com isso vamos criar um gráfico de Histograma com cada uma das colunas, assim podemos analisar cada uma das informações e verificar como elas se comportam em relação aos cancelamentos da empresa.