Найдите среднее геометрическое значение данного кадра данных Pandas.
Pandas Dataframe, библиотека Python с открытым исходным кодом, используется для хранения, удаления, изменения и обновления данных в табличной форме. Он спроектирован так, что я могу легко интегрироваться с программами Python для анализа данных. Он предоставляет различные способы манипулирования данными и инструменты для обработки данных.
Математическое понятие средних геометрических является очень полезным понятием для определения средних или центральных тенденций в пределах данного набора числовых данных. Это достигается путем умножения каждого отдельного числа, присутствующего в наборе данных, в результате чего получается корень n-й степени. Значение n, в свою очередь, определяется общим количеством значений в группе данных.
Синтаксис
Синтаксис для создания DataFrame
df = pandas.DataFrame(data, index, columns)
«pandas.dataframe» создает пустой объект dataframe.
«данные», где мы храним данные. Это может быть список или словарь
-
«индекс» и «столбец» являются необязательными, которые определяют метки строк и столбцов.
Подход 1 — использование NumPy
Следующая программа иллюстрирует поиск среднего геометрического заданного фрейма данных с помощью Numpy:
Алгоритм
Шаг 1. Импортируйте модули Pandas и Numpy.
Шаг 2 . Создайте фрейм данных Pandas для хранения значений массива.
Шаг 3. Используйте функцию Numpy в переменной с именемгеометрическое_среднее, чтобы найти среднее значение.
Шаг 4. Распечатайте выходные данные.
Пример
import pandas as pd
import numpy as np
# create a sample dataframe
df = pd.DataFrame({
'A': [2, 4, 6, 8],
'B': [1, 3, 5, 7]
})
# calculate the geometric mean for each column
geometric_mean = np.exp(np.log(df).mean())
# display the result
print("Geometric mean for each column:\n", geometric_mean)
Выход
Geometric mean for each column:
A 4.426728
B 3.201086
Подход 2. Использование пользовательской функции
Следующая программа иллюстрирует пользовательскую функцию под названием «geometric_mean», которая принимает в качестве входных данных фрейм данных Pandas и вычисляет среднее геометрическое всех значений в фрейме данных с помощью цикла.
Алгоритм
Шаг 1. Импорт библиотеки Pandas
Шаг 2. Создание DataFrame и сохранение значений.
Шаг 3. Определение пользовательской функции
Шаг 4. Создание новой переменной «gm» для вызова функции.
Шаг 5. Распечатка вывода с помощью вызова «gm».
Пример
import pandas as pd
# create sample dataframe
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})
# define a function to calculate geometric mean
def geometric_mean(data):
product = 1
for val in data.to_numpy().ravel():
product *= val
return product**(1.0/len(data.to_numpy().ravel()))
# calculate geometric mean of dataframe using custom function
gm = geometric_mean(df)
print(gm)
Выход
3.764350599503129
Подход 3 — Использование библиотеки Scipy
Scipy — это библиотека Python, предоставляющая мощные возможности научных вычислений, позволяющие работать с численными алгоритмами, оптимизацией и статистическим анализом.
Следующий код вычисляет среднее геометрическое фрейма данных Pandas, используя функцию gmean() из модуля scipy.stats.
Алгоритм
Шаг 1. Импорт библиотеки Pandas, Numpy, Scipy.
Шаг 2. Создание фрейма данных «df»
Шаг 3. Использование функций numpy и scipy.
Шаг 4. Печать результатов.
Пример
import numpy as np
from scipy.stats import gmean
import pandas as pd
# create sample dataframe
df = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})
# calculate geometric mean of dataframe using Scipy
gm = gmean(df.to_numpy().ravel())
print(gm)
Выход
3.764350599503128
Заключение
Среднее геометрическое, мощная математическая формула, обычно используемая для вычисления среднего значения ряда чисел, умноженных вместе, может быть невероятно ценным инструментом для анализа данных в Pandas Dataframes. Эта формула особенно полезна в сценариях с несколькими столбцами для анализа, поскольку ее можно использовать быстро и точно для определения среднего значения по каждому столбцу. Используя среднее геометрическое, вы можете раскрыть в своих данных ценную информацию и закономерности, которые в противном случае могли бы остаться незамеченными, что позволит вам принимать обоснованные решения и предпринимать целевые действия на основе этой информации.