Pandas DataFrame DataFrame.mean() Função
-
Sintaxe de
pandas.DataFrame.mean(): -
Códigos de exemplo:
DataFrame.mean()Método para encontrar a média ao longo do eixo da coluna -
Códigos de exemplo:
DataFrame.mean()Método para encontrar a média ao longo do eixo da linha -
Códigos de exemplo:
DataFrame.mean()Método para encontrar a média ignorando os valoresNaN
A função Python Pandas DataFrame.mean() calcula a média dos valores do objeto DataFrame sobre o eixo especificado.
Sintaxe de pandas.DataFrame.mean():
DataFrame.mean(axis=None, skipna=None, level=None, numeric_only=None, **kwargs)
Parâmetros
axis |
encontrar média ao longo da linha (axis=0) ou coluna (axis=1) |
skipna |
Booleano. Excluir valores NaN (skipna=True) ou incluir valores NaN (skipna=False) |
level |
Conte junto com um nível particular se o eixo for MultiIndex. |
numeric_only |
Booleano. Para colunas numeric_only=True, incluir apenas colunas float, int, e boolean. |
**kwargs |
Argumentos adicionais de palavras-chave para a função. |
Retornar
Se o level não for especificado, retornar Series da média dos valores para o eixo solicitado, caso contrário, retornar DataFrame dos valores médios.
Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da coluna
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean()
print("Means of Each Column:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Means of Each Column:
X 2.00
Y 4.75
dtype: float64
Ele calcula a média para ambas as colunas X e Y e finalmente retorna um objeto Series com a média de cada coluna.
Para encontrar a média de uma coluna específica de DataFrame em Pandas, chamamos a função mean() somente para aquela coluna.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df["X"].mean()
print("Mean of Column X:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Column X:
2.0
Ela dá apenas a média dos valores da coluna X de DataFrame.
Códigos de exemplo: DataFrame.mean() Método para encontrar a média ao longo do eixo da linha
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
means=df.mean(axis=1)
print("Mean of Rows:")
print(means)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of Rows:
0 2.5
1 2.5
2 5.0
3 3.5
dtype: float64
Ele calcula a média de todas as linhas e finalmente retorna um objeto Series com a média de cada linha.
Para encontrar a média de uma determinada linha de DataFrame em Pandas, chamamos a função mean() apenas para essa linha.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, 2, 3],
'Y': [4, 3, 8, 4]})
print("DataFrame:")
print(df)
mean=df.iloc[[0]].mean(axis=1)
print("Mean of 1st Row:")
print(mean)
Resultado:
DataFrame:
X Y
0 1 4
1 2 3
2 2 8
3 3 4
Mean of 1st Row:
0 2.5
dtype: float64
Ela fornece apenas a média dos valores da primeira linha de DataFrame.
Utilizamos o método iloc para selecionar linhas com base no índice.
Códigos de exemplo: DataFrame.mean() Método para encontrar a média ignorando os valores NaN
Utilizamos o valor padrão do parâmetro skipna, ou seja, skipna=True para encontrar a média de DataFrame ao longo do eixo especificado, ignorando os valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, None, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=True)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4.0
1 2.0 3.0
2 NaN NaN
3 3.0 4.0
Mean of Columns
X 2.000000
Y 3.666667
dtype: float64
Se definirmos skipna=True, ele ignora o NaN no dataframe. Isso nos permite calcular a média de DataFrame ao longo do eixo da coluna, ignorando os valores NaN.
import pandas as pd
df = pd.DataFrame({'X': [1, 2, None, 3],
'Y': [4, 3, 3, 4]})
print("DataFrame:")
print(df)
means=df.mean(skipna=False)
print("Mean of Columns")
print(means)
Resultado:
DataFrame:
X Y
0 1.0 4
1 2.0 3
2 NaN 3
3 3.0 4
Mean of Columns
X NaN
Y 3.5
dtype: float64
Aqui, obtemos o valor NaN para a média da coluna X, pois a coluna X tem o valor NaN presente nela.
Suraj Joshi is a backend software engineer at Matrice.ai.
LinkedIn