



























Estude fácil! Tem muito documento disponível na Docsity
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Prepare-se para as provas
Estude fácil! Tem muito documento disponível na Docsity
Prepare-se para as provas com trabalhos de outros alunos como você, aqui na Docsity
Encontra documentos específicos para os exames da tua universidade
Prepare-se com as videoaulas e exercícios resolvidos criados a partir da grade da sua Universidade
Responda perguntas de provas passadas e avalie sua preparação.
Ganhe pontos para baixar
Ganhe pontos ajudando outros esrudantes ou compre um plano Premium
Um resumo da aplicação da aprendizagem de máquina e análise de dados usando a linguagem python e as ferramentas ipython e jupyter. O autor, julio cartier, compartilha sua experiência como desenvolvedor python na empresa ivia/wipro e detentor de um mestrado em ciência da computação. Ele aborda o que é aprendizagem de máquina, seus tipos e como python se tornou uma linguagem popular para essa área. Além disso, ele discute as bibliotecas numpy, scikit-learn, pandas, seaborn e matplotlib, que são ótimas opções para análise de dados em python. O documento também inclui um exemplo de análise de dados usando o conjunto de dados titanic.
Tipologia: Slides
1 / 35
Esta página não é visível na pré-visualização
Não perca as partes importantes!




























Julio Cartier
Aprendizagem de Máquina
● Aprendizagem Supervisionado
● Aprendizagem Não-Supervisionado
● Aprendizagem Semi-Supervisionado
● Aprendizagem Por Reforço
Python para análise de dados
Ipython e Jupyter
Ipython e Jupyter
Ipython e Jupyter
Ipython e Jupyter
#Bibliotecas para Analise de Dados import pandas as pd import numpy as np
#Bibliotecas para plotar gráficos import seaborn as sb import matplotlib.pyplot as plt
Ipython e Jupyter
#Bibliotecas para aprendizagem de máquina from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression from sklearn.ensemble import AdaBoostClassifier from sklearn.ensemble import RandomForestClassifier from sklearn.metrics import roc_auc_score
import warnings warnings.filterwarnings('ignore')
Ipython e Jupyter
data.drop(['Ticket', 'Name'], axis=1, inplace=True)
data.describe()
Ipython e Jupyter
data['Cabin'].head()
data['Cabin'] = data['Cabin'].astype(str).str[0]
data.head()
data['Cabin'].head()
Ipython e Jupyter
e_age = data['Age'].isnull().sum()
print(format(e_age))
def normalizeAge(data): if data < 1.0: return 1. return data
data['Age'] = data['Age'].apply(normalizeAge)
Ipython e Jupyter
idade_media_homens = data[data['Sex'] == 'male'].groupby('Pclass')['Age'].mean() idade_media_mulheres = data[data['Sex'] == 'female'].groupby('Pclass')['Age'].mean()
print(idade_media_homens) print(idade_media_mulheres)