Как использовать описательную статистику в Excel
Прежде чем анализировать новую выборку или совокупность данных, полезно изучить каждую переменную по отдельности, чтобы определить, есть ли что-то необычное в данных, о которых вам следует знать во время анализа. Функция описательной статистики в пакете инструментов анализа Excel вычисляет ряд статистических данных, которые помогают понять изменчивость и основную тенденцию данных.
Включить пакет инструментов анализа
Шаг 1
Запустите Эксель. Выберите Файл. а затем Параметры. .
Шаг 2
Выберите Надстройки. из списка опций в левой колонке. Найдите запись пакета анализа в списке надстроек справа. Если его нет в списке активированных надстроек, выберите Перейти... чтобы открыть экран надстроек.
Шаг 3
Установите флажок рядом с Пакетом инструментов анализа. и выберите ОК. .
Шаг 4
После активации пакета анализа или, если он уже был активирован, нажмите ОК. продолжить.
Использовать описательную статистику
Ваша цель при использовании этого инструмента — рассчитать описательную статистику для данных, собранных для переменной, чтобы лучше понять эти данные. Одним из примеров может быть анализ количества секунд, которое потребовалось участнику забега, чтобы пробежать одну милю.
Шаг 1
Откройте книгу, содержащую данные, которые вы хотите проанализировать:в этом примере количество секунд на милю. Выберите Данные. в меню Анализ данных. на ленточной панели Описательная статистика из поля выбора, а затем нажмите ОК .
Шаг 2
Введите диапазон ячеек, содержащих данные для переменной, или нажмите селектор ячеек. , выделите диапазон мышью и нажмите кнопку еще раз. Выберите пустой раздел рабочей книги для хранения выходных данных описательной статистики и выберите тип информации, которую вы хотите отобразить, например сводную статистику и 95-процентные доверительные интервалы. Выберите ОК. для расчета статистики.
Шаг 3
Используйте и интерпретируйте описательную статистику следующим образом:
- Среднее :Среднее значение — здесь это будет 716,69 секунды или почти 12 минут на милю.
- Стандартная ошибка :это то, насколько ваши выборочные значения близки к среднему значению. При нормальном распределении почти все значения будут находиться в пределах трех стандартных ошибок среднего; около 95 процентов будут находиться в пределах двух стандартных ошибок; и около двух третей будут находиться в пределах одной стандартной ошибки вокруг среднего значения.
- Медиана :Среднее значение — здесь 697 секунд, что составляет около 11,6 минут на милю.
- Режим :Наиболее распространенное значение — 675 секунд или 11,25 минут на милю.
- Стандартное отклонение :показатель того, насколько сильно разбросаны числа вокруг среднего значения.
- Эксцесс :Указывает, являются ли данные пиковыми или плоскими при построении графика по сравнению с нормальным распределением. Эксцесс для нормального распределения равен 3.
- Асимметрия :Указывает, являются ли данные симметричными при построении графика по сравнению с нормальным распределением. Асимметрия для нормального распределения равна 0.
- Диапазон :Разница между самым низким и самым высоким значениями — 667 секунд или примерно 11,1 минуты.
- Минимум :Наименьшее значение в наборе данных — 399, что составляет 6,65 минуты на милю.
- Максимум :самое высокое значение в наборе данных — 1066, или 17,77 минут на милю.
- Сумма :Сумма всех точек данных.
- Подсчитать :количество точек данных.
- Уровень достоверности (95%) :интервал вокруг среднего значения, при котором можно быть уверенным с 95-процентной вероятностью, что интервал содержит фактическое среднее значение.