Как рассчитать P-значение и его корреляцию в Excel 2007
Поиск P-значения в Excel для корреляций — относительно простой процесс, но, к сожалению, для этой задачи нет ни одной функции Excel. Корреляции часто являются важным шагом для установления взаимосвязи или связи между двумя наборами данных, и вы можете вычислить коэффициент корреляции в Excel (например, коэффициент корреляции Пирсона) с помощью встроенных функций. Есть также функции для статистических тестов. Однако значение r, полученное вами для вашей корреляции, необходимо преобразовать в t-статистику, прежде чем вы сможете интерпретировать результаты.
Поиск коэффициента корреляции в Excel
Если вы ищете корреляцию Пирсона в Excel 2007 или общий коэффициент корреляции, существуют встроенные функции, которые позволяют это вычислить. Во-первых, вам нужны два массива данных, которые вы хотите сравнить на предмет корреляции. Предположим, что они находятся в столбцах A и B, начиная со 2-й по 21-ю ячейки в каждой. Используйте функцию Correl или Pearson, чтобы найти коэффициент корреляции в Excel. В пустой ячейке введите «=Correl([массив 1], [массив 2])» или «=Pearson([массив 1], [массив 2])», чтобы найти коэффициент корреляции с первым столбцом данных. упоминается там, где написано «[массив 1]», и второе, где написано «[массив 2]». В примере вы должны ввести «=Pearson(A2:A21, B2:B21)» или «=Correl(A2:A21, B2:B21)», отметив, что вы также можете открыть скобки, а затем выделить соответствующие ячейки с помощью с помощью мыши или клавиатуры введите запятую, а затем выделите второй набор. Это возвращает коэффициент корреляции со значением от −1 до 1.
Интерпретация корреляции в Excel
Интерпретация корреляции в Excel в решающей степени зависит от преобразования вывода корреляционной функции в значение t. Это можно сделать с помощью формулы. Найдите пустую ячейку и введите в нее:«=([коэффициент корреляции]*SQRT([количество пар данных]-2)/SQRT(1-[коэффициент корреляции]^2))». Опять же, квадратные скобки представляют собой информацию, которую необходимо ввести для ваших конкретных данных. Для «[коэффициент корреляции]» введите ссылку на ячейку, которую вы использовали для расчета корреляции в последнем разделе. Для «[количество пар данных]» введите общее количество точек данных в одном массиве. В примере, работающем от ячеек 2 до 21 в столбцах A и B, всего имеется 20 пар точек данных. Это n на статистическом жаргоне. Итак, представьте, что вы используете пример и помещаете свою корреляцию в ячейку C2. Введите "=(C2 *SQRT(20-2)/SQRT(1-C2^2))" в пустую ячейку, чтобы найти статистику t.
Теперь вы можете использовать это вместе с функцией «Tdist», чтобы найти P-значение. В другой пустой ячейке введите «=СТЬЮДРАСП([статистика t], [степени свободы], [количество хвостов])», чтобы выполнить соответствующий тест значимости в Excel. Опять же, квадратные скобки — это место, где вы вводите свои конкретные данные. Статистика t — это значение, которое вы только что вычислили, поэтому, например, представьте, что вы сделали это в ячейке C3. Степени свободы для корреляции задаются размером выборки (n) минус два, поэтому в примере (с n =20) это будет 18. Наконец, односторонний или двусторонний тест покажет вам, поиск результатов в одном или двух направлениях — конкретно положительной или отрицательной корреляции. Если вы не уверены, в каком направлении будет корреляция, используйте двусторонний критерий и введите «2» вместо «[количество хвостов]».
В этом примере вы должны ввести "=TDIST(C3, 18, 2)", чтобы найти P-значение. Как правило, результат считается значимым, если P <0,05.
Другие версии Excel
В более новых версиях Excel процесс нахождения коэффициента корреляции и выполнения теста значимости в Excel точно такой же. Эти же функции существуют во всех более поздних версиях Excel. Однако в версиях Excel до 2003 года функция "Пирсона" часто имеет ошибки округления, поэтому в более старых версиях вместо нее следует использовать функцию "Коррел".