о чем говорит стандартное отклонение в статистике
Стандартное отклонение (Standard Deviation)
Стандартное отклонение (σ, s) – это мера разброса в наборе числовых данных. Выражаясь простыми словами, насколько далеко от Cреднего арифметического (Mean) находятся точки данных. Его также можно назвать мерой центральной тенденции: чем меньше стандартное отклонение, тем более «сгруппированы» данные вокруг центра (среднего). Чем отклонение больше, тем больше разброс значений.
Стандартное отклонение в статистике
Метрика рассчитывается с помощью следующей формулы:
Пример. Мы располагаем Выборкой (Sample) из 10 наблюдений, где указано, сколько килограммов томатов собрали дачники в этом месяце:
Средним значением выборки будет 7,7:
$$\bar
Следуя формуле, вычислим квадрат разницы между i-м элементом выборки и средним значением. К примеру, для первого вхождения это будет:
Причина, по которой мы возводим разницы в квадрат, заключается в том, что большие отклонения от среднего как бы «наказываются» более сурово. Возведение в квадрат также приводит одинаковому учету отклонений в обоих направлениях (положительном и отрицательном), то есть расстояние от среднего значения у отрицательного и положительного числа будет рассчитано верно в обоих случаях.
Суммой значений правого столбца является число 64,1. Итак, согласно формуле стандартное отклонение будет равно:
Стандартное отклонение в Машинном обучении
Представьте, что перепись «томатного» населения приобрела более широкие масштабы, и исследователи собрали данные о целом климатическом поясе. Мало тех, кто собрал по 2 килограмма, и тех, кто собрал 50. В среднем, садоводы собирали 25 кг.
При создании модели прогнозирования урожая стандартное отклонение уточняет наши предположения с помощью следующих принципов:
Библиотека Statistics
Рассчитывание стандартного отклонения выполняется мгновенно с помощью библиотеки statistics:
Описательные статистики
Первичные описательные статистики – это наиболее простые характеристики, которыми можно описать психологические данные, которые были получены в ходже тестирования испытуемых.
К наиболее часто используемым в курсовых и дипломных по психологии описательным статистикам можно отнести:
Среднее значение
Простейшая математическая процедура, которую необходимо освоить студенту-психологу при написании диплома – расчет среднего значения.
Среднее значение или среднее арифметическое – это число, получаемое как сумма нескольких показателей, деланная на количество этих показателей. Например, в результате тестирования были получены показатели тревожности в группе из 10-ти человек. Чтобы получить среднее значение тревожности по группе нужно сложить показатели всех испытуемых, а затем получившуюся сумму разделить на 10.
Среднее значение характеризует группу целиком. Зная среднее можно оценить показатели каждого испытуемого относительно остальных. Например, измеряемая в приведённом выше примере тревожность могла быть от 1 до 5 баллов. Пусть средняя по группе тревожность оказалась 3,5 балла. Тогда, показатель испытуемого в 4 балла можно считать относительно высоким, а в 2 балла- относительно низким.
Среднее значение относится к показателям центральной тенденции и отражает степень выраженности показателя в группе. Стандартное отклонение отражает степень изменчивости признака в группе, но о нем речь впереди.
Среднее значение какого-либо показателя характеризует группу в целом и позволяет сравнивать ее с другими группами. Например, проведена диагностика уровня эмпатии в группе мужчин и женщин. Как узнать, влияет ли пол на способность к эмпатии. Один из способов – найти средний уровень этого показателя в группах мужчин и женщин. Например, в группе женщин средний уровень эмпатии равен 23,5 баллов, а в группе мужчин – 17,7 баллов. Как видно, в среднем у женщин эмпатия выше, чем у мужчин.
Среднее – это не единственный статистический показатель, который отражает выраженность переменной в группе. Аналогичную функцию выполняют мода и медиана. Однако они редко используются в дипломах по психологии.
Средние значения выраженности психологических показателей в курсовой или дипломной по психологии представляются в виде таблиц и диаграмм. В таблицах среднее обозначается буквой «М».
Стандартное отклонение
Если среднее арифметическое отражает выраженность показателя в группе, то стандартное отклонение (среднеквадратичное отклонение) показывает его разброс данных или изменчивость. Чем больше величина стандартного отклонения, тем больше разброс показателей в группе испытуемых.
Например, группу мальчиков протестировали методикой на выявление уровня эгоцентризма, показатели которого изменяются от 1 до 10. Расчет среднего показал М=6,5, а стандартное отклонение σ=3 (стандартное отклонение обозначается буквой «сигма»). Эти данные позволяют нам говорить о том, что подавляющее большинство показателей эгоцентризма мальчиков укладываются в диапазон от 3,5 до 9,5 (среднее плюс/минус стандартное отклонение – М ± σ).
Если при тестировании группы девочек среднее значение М=5, а стандартное отклонение σ=1, то большинство испытуемых этой группы имеют эгоцентризм в диапазоне от 4 до 6 (5 ± 1).
Анализирую такие данные в дипломе по психологии можно указать, что средний уровень эгоцентризма у мальчиков больше, чем у девочек. При этом разброс показателей эгоцентризма у мальчиков также больше, чем у девочек, то есть, в группе мальчиков есть испытуемые с очень низкими и очень высокими показателями относительно среднего. У девочек показатели менее «разбросаны» относительно среднего.
Расчет среднего и стандартного отклонения
Формула расчета среднего очень проста и этот параметр можно рассчитать вручную.
Пример расчёта среднего
В таблице приведены показатели, полученные по тесту диагностики уровня одиночества у 64-х испытуемых.
Стандартное отклонение
Среднее квадратичное отклонение (или стандартное отклонение) – вторая по значению константа вариационного ряда. Она является мерой разнообразия входящих в группу объектов и показывает, на сколько в среднем отклоняются варианты от средней арифметической изучаемой совокупности. Чем сильнее разбросаны варианты вокруг средней, чем чаще встречаются крайние или другие отдаленные классы отклонений от средней вариационного ряда, тем большим оказывается и среднее квадратичное отклонение. Стандартное отклонение есть мера изменчивости признаков, обусловленная влиянием на них случайных факторов. Квадрат стандартного отклонения (S²) называется дисперсией.
Что такое «случайное» при детальном рассмотрении? В формуле модели вариант случайный компонент предстает в виде некой «добавки» к доле варианты, сформированной под действием систематических факторов, ± xслуч.. Она, в свою очередь, складывается из эффектов влияния неопределенно большого числа факторов: xслуч. = Σ xслуч.k.
Каждый из этих факторов может обнаружить свое сильное действие (дать большой вклад), а может почти не участвовать в становлении конкретной варианты (слабое действие, незначительный вклад). Причем доля случайной «прибавки» для каждой варианты оказывается различной! Рассматривая, например, размеры дафний, можно увидеть, что одна особь крупнее, другая мельче, поскольку одна родилась на несколько часов раньше, другая позже, или одна генетически не вполне идентична прочим, а третья росла в более прогреваемой зоне аквариума и т. д.
Если эти частные факторы не входят в число контролируемых при сборе вариант, то они, индивидуально проявляясь в разной степени, обеспечивают случайное варьирование вариант. Чем больше случайных факторов, чем они сильнее, тем дальше будут разбросаны варианты вокруг средней и тем большим оказывается характеристика варьирования, среднее квадратичное отклонение. В контексте нашей книги термин «случайное» есть синоним слова «неизвестное», «неподконтрольное». Пока мы каким-либо способом не выразим интенсивность фактора (группировкой, градацией, числом), до тех пор он останется фактором, вызывающим случайную изменчивость.
Смысл стандартного отклонения (вариант от средней) выражает формула:

где x – значение признака у каждого объекта в группе,
М – средняя арифметическая признака,
п – число вариант выборки.
Выполнять расчеты удобнее с помощью рабочей формулы:

где Σ x² – сумма квадратов значений признака для всех вариант,
Σ x – сумма значений признака,
Для примера с массой тела бурозубок стандартное отклонение будет равно: S = 0.897216496, а после необходимого округления S = 0.897 г.
В некоторых случаях бывает необходимо определить взвешенное среднее квадратичное отклонение для суммарного распределения, составленного из нескольких выборок, для которых значения стандартных отклонений уже известны. Эта задача решается с помощью формулы:

где SΣ – усредненная величина среднего квадратичного отклонения для суммарного распределения,
S – усредняемые значения стандартного отклонения,
п – объемы отдельных выборок,
k – число усредняемых стандартных отклонений.
Рассмотрим такой пример. Четыре независимых определения веса печени (мг) у землероек-бурозубок в июне, июле, августе и сентябре дали следующие величины стандартных отклонений: 93, 83, 50, 71 (при n = 17, 115, 132, 140). Подставив в вышеприведенную формулу нужные значения, получим стандартные отклонения для суммарной выборки (для всего бесснежного периода):

В случае, если требуется первичная статистическая обработка большого числа выборок, но необязательно с большой точностью, для оценки стандартного отклонения можно воспользоваться экспресс-методом, основанным на знании закона нормального распределения. Как уже отмечалось, крайние значения для выборки (с вероятностью P = 95%) можно считать границами, удаленными от средней на расстояние 2S: xmin = M − 2S, xmax = M + 2S. Это значит, что в лимите (Lim), в диапазоне от максимального до минимального выборочного значения, укладываются четыре стандартных отклонения:
Однако этот вывод справедлив только по отношению к выборкам большого размера, тогда как для небольших выборок необходимо делать поправки. Рекомендуется следующая формула приблизительного расчета стандартного отклонения (Ашмарин и др., 1975):

где величина d взята из таблицы 3 (против соответствующего объема выборки, n).
| п | d | п | d | п | d | n | d |
| 1.128 | 2.704 | 3.258 | 3.588 | ||||
| 1.693 | 2.847 | 3.336 | 3.640 | ||||
| 2.059 | 2.970 | 3.407 | 3.689 | ||||
| 2.326 | 3.079 | 3.472 | 3.735 | ||||
| 2.534 | 3.173 | 3.532 | более |
Выборочное стандартное отклонение веса тела бурозубок (n = 63), рассчитанное по приведенной формуле, составляет:
S = (11.9 − 7.3) / 4 = 1.15 г,
что достаточно близко к точному значению, S = 0.89 г.
Использование экспресс-оценок стандартного отклонения значительно сокращает время расчетов, существенно не сказываясь на их точности. Отмечается лишь небольшая тенденция к завышению получаемых этим методом значений стандартного отклонения при небольших объемах выборок.
Стандартное отклонение – величина именованная, поэтому с ее помощью можно сравнивать характер варьирования лишь одних и тех же признаков. Чтобы сопоставить изменчивость разнородных признаков, выраженных в различных единицах измерения, а также нивелировать влияние масштаба измерений, используют так называемый коэффициент вариации (СV), безразмерную величину, отношение выборочной оценки S к собственной средней M:

В нашем примере с весом тела бурозубок:

Индивидуальная изменчивость (варьирование) признаков – одна из наиболее емких характеристик биологической популяции, любого биологического процесса или явления. Коэффициент вариации может считаться вполне адекватным и объективным показателем, хорошо отражающим фактическое разнообразие совокупности независимо от абсолютной величины признака. Индекс был создан для унификации показателей изменчивости разных или разноразмерных признаков путем приведения их к одному масштабу.
Практика показывает, что для многих биологических признаков наблюдается увеличение изменчивости (стандартного отклонения) с ростом их величины (средней арифметической). При этом коэффициент вариации остается примерно на одном и том же уровне – 8–15%. За увеличение коэффициента вариации ответственны, как правило, растущие отличия распределения признака от нормального закона.
Стандартное отклонение
Стандартное отклонение (англ. Standard Deviation) — простыми словами это мера того, насколько разбросан набор данных.
Вычисляя его, можно узнать, являются ли числа близкими к среднему значению или далеки от него. Если точки данных находятся далеко от среднего значения, то в наборе данных имеется большое отклонение; таким образом, чем больше разброс данных, тем выше стандартное отклонение.
Стандартное отклонение обозначается буквой σ (греческая буква сигма).
Стандартное отклонение также называется:
Использование и интерпретация величины среднеквадратического отклонения
Стандартное отклонение используется:
Рассмотрим два малых предприятия, у нас есть данные о запасе какого-то товара на их складах.
| День 1 | День 2 | День 3 | День 4 | |
|---|---|---|---|---|
| Пред.А | 19 | 21 | 19 | 21 |
| Пред.Б | 15 | 26 | 15 | 24 |
В обеих компаниях среднее количество товара составляет 20 единиц:
Однако, глядя на цифры, можно заметить:
Если рассчитать стандартное отклонение каждой компании, оно покажет, что
Стандартное отклонение показывает эту волатильность данных — то, с каким размахом они меняются; т.е. как сильно этот запас товара на складах компаний колеблется (поднимается и опускается).
Расчет среднеквадратичного (стандартного) отклонения
Формулы вычисления стандартного отклонения
Разница между формулами S и σ («n» и «n–1»)
Состоит в том, что мы анализируем — всю выборку или только её часть:
Как рассчитать стандартное отклонение?
Пример 1 (с σ)
Рассмотрим данные о запасе какого-то товара на складах Предприятия Б.
| День 1 | День 2 | День 3 | День 4 | |
| Пред.Б | 15 | 26 | 15 | 24 |
Если значений выборки немного (небольшое n, здесь он равен 4) и анализируются все значения, то применяется эта формула:
Применяем эти шаги:
1. Найти среднее арифметическое выборки:
μ = (15 + 26 + 15+ 24) / 4 = 20
2. От каждого значения выборки отнять среднее арифметическое:
3. Каждую полученную разницу возвести в квадрат:
4. Сделать сумму полученных значений:
5. Поделить на размер выборки (т.е. на n):
6. Найти квадратный корень:
Пример 2 (с S)
Задача усложняется, когда существуют сотни, тысячи или даже миллионы данных. В этом случае берётся только часть этих данных и анализируется методом выборки.
У Андрея 20 яблонь, но он посчитал яблоки только на 6 из них.
Популяция — это все 20 яблонь, а выборка — 6 яблонь, это деревья, которые Андрей посчитал.
| Яблоня 1 | Яблоня 2 | Яблоня 3 | Яблоня 4 | Яблоня 5 | Яблоня 6 |
| 9 | 2 | 5 | 4 | 12 | 7 |
Так как мы используем только выборку в качестве оценки всей популяции, то нужно применить эту формулу:
Математически она отличается от предыдущей формулы только тем, что от n нужно будет вычесть 1. Формально нужно будет также вместо μ (среднее арифметическое) написать X ср.
Применяем практически те же шаги:
1. Найти среднее арифметическое выборки:
Xср = (9 + 2 + 5 + 4 + 12 + 7) / 6 = 39 / 6 = 6,5
2. От каждого значения выборки отнять среднее арифметическое:
X1 – Xср = 9 – 6,5 = 2,5
X2 – Xср = 2 – 6,5 = –4,5
X3 – Xср = 5 – 6,5 = –1,5
X4 – Xср = 4 – 6,5 = –2,5
X5 – Xср = 12 – 6,5 = 5,5
X6 – Xср = 7 – 6,5 = 0,5
3. Каждую полученную разницу возвести в квадрат:
4. Сделать сумму полученных значений:
Σ (Xi – Xср)² = 6,25 + 20,25+ 2,25+ 6,25 + 30,25 + 0,25 = 65,5
5. Поделить на размер выборки, вычитав перед этим 1 (т.е. на n–1):
(Σ (Xi – Xср)²)/(n-1) = 65,5 / (6 – 1) = 13,1
6. Найти квадратный корень:
S = √((Σ (Xi – Xср)²)/(n–1)) = √ 13,1 ≈ 3,6193
Дисперсия и стандартное отклонение
Стандартное отклонение равно квадратному корню из дисперсии (S = √D). То есть, если у вас уже есть стандартное отклонение и нужно рассчитать дисперсию, нужно лишь возвести стандартное отклонение в квадрат (S² = D).
Дисперсия — в статистике это «среднее квадратов отклонений от среднего». Чтобы её вычислить нужно:
Ещё расчёт дисперсии можно сделать по этой формуле:
Правило трёх сигм
Это правило гласит: вероятность того, что случайная величина отклонится от своего математического ожидания более чем на три стандартных отклонения (на три сигмы), почти равна нулю.
Глядя на рисунок нормального распределения случайной величины, можно понять, что в пределах:
Это означает, что за пределами остаются лишь 0,28% — это вероятность того, что случайная величина примет значение, которое отклоняется от среднего более чем на 3 сигмы.
Стандартное отклонение в excel
Вычисление стандартного отклонения с «n – 1» в знаменателе (случай выборки из генеральной совокупности):
1. Занесите все данные в документ Excel.
2. Выберите поле, в котором вы хотите отобразить результат.
3. Введите в этом поле «=СТАНДОТКЛОНА(«
4. Выделите поля, где находятся данные, потом закройте скобки.
5. Нажмите Ввод (Enter).
В случае если данные представляют всю генеральную совокупность (n в знаменателе), то нужно использовать функцию СТАНДОТКЛОНПА.
Коэффициент вариации
Коэффициент вариации — отношение стандартного отклонения к среднему значению, т.е. Cv = (S/μ) × 100% или V = (σ/X̅) × 100%.
Стандартное отклонение делится на среднее и умножается на 100%.
Можно классифицировать вариабельность выборки по коэффициенту вариации:
Стандартное отклонение может быть сокращено как SD и чаще всего представлено в математических текстах и уравнениях строчной греческой буквой сигма σ для стандартного отклонения генеральной совокупности или латинской буквой s для стандартного отклонения выборки.
Когда доступна только выборка данных из генеральной совокупности, термин стандартное отклонение выборки или стандартное отклонение выборки может относиться либо к вышеупомянутой величине применительно к этим данным, либо к измененной величине, которая является объективной оценкой стандартное отклонение совокупности (стандартное отклонение всей совокупности).
СОДЕРЖАНИЕ
Основные примеры
Стандартное отклонение оценок восьми учащихся
Эти восемь точек данных имеют среднее (среднее) значение 5:
Сначала вычислите отклонения каждой точки данных от среднего и возведите результат каждого в квадрат :
Дисперсия представляет собой среднее из этих значений:
а стандартное отклонение совокупности равно квадратному корню из дисперсии:
σ знак равно 4 знак равно 2. <\ displaystyle \ sigma = <\ sqrt <4>> = 2.>
Стандартное отклонение среднего роста для взрослых мужчин
Определение ценностей населения
Стандартное отклонение σ для X определяется как
Стандартное отклонение вероятностного распределения такое же, как и у случайной величины, имеющей это распределение.
Дискретная случайная величина
Непрерывная случайная величина
В случае параметрического семейства распределений стандартное отклонение может быть выражено через параметры. Например, в случае логнормального распределения с параметрами μ и σ 2 стандартное отклонение составляет
Предварительный расчет
Не исправленное стандартное отклонение выборки
Скорректированное стандартное отклонение выборки
Если смещенная дисперсия выборки (второй центральный момент выборки, которая является оценкой дисперсии генеральной совокупности с понижением) используется для вычисления оценки стандартного отклонения совокупности, результатом будет
Извлечение квадратного корня снова приводит к смещению (поскольку квадратный корень является нелинейной функцией, которая не коммутирует с математическим ожиданием), что дает скорректированное стандартное отклонение выборки, обозначенное s:
Беспристрастное стандартное отклонение выборки
Ошибка в этом приближении уменьшается квадратично (как 1 / N 2 ), и оно подходит для всех, кроме самых маленьких выборок или наивысшей точности: для N = 3 смещение равно 1,3%, а для N = 9 смещение уже менее 0,1%.
Доверительный интервал выборочного стандартного отклонения
Чтобы показать, как большая выборка сужает доверительный интервал, рассмотрим следующие примеры: Небольшая совокупность N = 2 имеет только 1 степень свободы для оценки стандартного отклонения. В результате 95% ДИ SD изменяется от 0,45 × SD до 31,9 × SD; Факторы здесь следующие :
Большая популяция N = 10 имеет 9 степеней свободы для оценки стандартного отклонения. Те же вычисления, что и выше, дают нам в этом случае 95% доверительный интервал от 0,69 × SD до 1,83 × SD. Таким образом, даже при выборке из 10 фактическое стандартное отклонение может быть почти в 2 раза выше, чем стандартное отклонение для выборки. Для выборки N = 100 это составляет от 0,88 × SD до 1,16 × SD. Чтобы быть более уверенным в том, что SD сэмплирования близко к фактическому SD, нам нужно отобрать большое количество точек.
Границы стандартного отклонения
Тождества и математические свойства
Стандартное отклонение инвариантно при изменении местоположения и напрямую зависит от масштаба случайной величины. Таким образом, для постоянной c и случайных величин X и Y :
Стандартное отклонение суммы двух случайных величин может быть связано с их индивидуальными стандартными отклонениями и ковариацией между ними:
Вычисление суммы квадратов отклонений может быть связано с моментами, рассчитанными непосредственно из данных. В следующей формуле буква E интерпретируется как ожидаемое значение, т. Е. Среднее значение.
Стандартное отклонение выборки можно рассчитать как:
Для конечной совокупности с равными вероятностями во всех точках имеем
что означает, что стандартное отклонение равно квадратному корню из разницы между средним квадратом значений и квадратом среднего значения.
См. Расчетную формулу для дисперсии для доказательства и аналогичный результат для стандартного отклонения выборки.
Толкование и применение
Большое стандартное отклонение указывает на то, что точки данных могут далеко отклоняться от среднего, а небольшое стандартное отклонение указывает, что они сгруппированы близко к среднему.
Примеры применения
Практическая ценность понимания стандартного отклонения набора значений состоит в том, чтобы понять, насколько велико отклонение от среднего (среднего).
Экспериментальная, промышленная и проверка гипотез
Стандартное отклонение часто используется для сравнения реальных данных с моделью для проверки модели. Например, в промышленных приложениях вес продуктов, сходящих с производственной линии, может потребовать соответствия юридически требуемому значению. Взвешивая некоторую долю продуктов, можно определить средний вес, который всегда будет немного отличаться от долгосрочного среднего. Используя стандартные отклонения, можно рассчитать минимальное и максимальное значение, при котором усредненный вес будет находиться в пределах некоторого очень высокого процента времени (99,9% или более). Если он выходит за пределы допустимого диапазона, возможно, необходимо скорректировать производственный процесс. Статистические тесты, подобные этим, особенно важны, когда тестирование относительно дорогое. Например, если продукт нужно открыть, слить и взвесить, или если продукт был израсходован во время теста иным образом.
Погода
В качестве простого примера рассмотрим среднесуточные максимальные температуры в двух городах, одном на суше и на побережье. Полезно понимать, что диапазон суточных максимальных температур для прибрежных городов меньше, чем для городов внутри страны. Таким образом, хотя каждый из этих двух городов может иметь одинаковую среднюю максимальную температуру, стандартное отклонение суточной максимальной температуры для прибрежного города будет меньше, чем для внутреннего города, поскольку в любой конкретный день фактическая максимальная температура более вероятна. быть дальше от средней максимальной температуры для внутреннего города, чем для прибрежного.
Финансы
В финансах стандартное отклонение часто используется как мера риска, связанного с колебаниями цен на данный актив (акции, облигации, имущество и т. Д.), Или риска портфеля активов (активно управляемые паевые инвестиционные фонды, индексные взаимные фонды). фонды или ETF). Риск является важным фактором при определении того, как эффективно управлять портфелем инвестиций, поскольку он определяет вариацию доходности актива и / или портфеля и дает инвесторам математическую основу для принятия инвестиционных решений (известную как оптимизация среднего отклонения ). Фундаментальная концепция риска заключается в том, что по мере его увеличения ожидаемая доходность инвестиций также должна увеличиваться, что называется премией за риск. Другими словами, инвесторы должны ожидать более высокой отдачи от инвестиций, если они сопряжены с более высоким уровнем риска или неопределенности. При оценке инвестиций инвесторы должны оценить как ожидаемую доходность, так и неопределенность будущей прибыли. Стандартное отклонение обеспечивает количественную оценку неопределенности будущих доходов.
Расчет средней (или среднего арифметического) доходности ценной бумаги за определенный период дает ожидаемую доходность актива. Для каждого периода вычитание ожидаемой прибыли из фактической приводит к разнице из среднего. Возведение разницы в квадрат за каждый период и взятие среднего дает общую дисперсию доходности актива. Чем больше отклонение, тем больший риск несет безопасность. Нахождение квадратного корня из этой дисперсии даст стандартное отклонение рассматриваемого инвестиционного инструмента.
Финансовые временные ряды известны как нестационарные ряды, тогда как приведенные выше статистические расчеты, такие как стандартное отклонение, применимы только к стационарным рядам. Чтобы применить вышеупомянутые статистические инструменты к нестационарным рядам, этот ряд сначала должен быть преобразован в стационарный ряд, что позволит использовать статистические инструменты, которые теперь имеют действительную основу для работы.
Геометрическая интерпретация
чьи координаты являются средними значениями, с которых мы начали.
Неравенство Чебышева
Наблюдение редко отличается от среднего значения более чем на несколько стандартных отклонений. Неравенство Чебышева гарантирует, что для всех распределений, для которых определено стандартное отклонение, объем данных в пределах ряда стандартных отклонений среднего будет не меньше, чем указано в следующей таблице.
Правила для нормально распределенных данных
Если распределение данных приблизительно нормальное, то доля значений данных в пределах z стандартных отклонений среднего определяется следующим образом:
Пропорция знак равно эрф ( z 2 ) <\ displaystyle <\ text
| Доверительный интервал | Пропорция в пределах | Пропорция без | |
|---|---|---|---|
| Процент | Процент | Дробная часть | |
| 0,318 639 σ | 25% | 75% | 3/4 |
| 0,674 490 σ | 50 % | 50 % | 1 / 2 |
| 0,977 925 σ | 66,6667% | 33,3333% | 1/3 |
| 0,994 458 σ | 68% | 32% | 1 / 3,125 |
| 1 σ | 68,268 9492 % | 31,731 0508 % | 1 / 3,151 4872 |
| 1,281 552 σ | 80% | 20% | 1/5 |
| 1,644 854 σ | 90% | 10% | 1/10 |
| 1,959 964 σ | 95% | 5% | 1/20 |
| 2 σ | 95,449 9736 % | 4,550 0264 % | 1 / 21 977 895 |
| 2,575 829 σ | 99% | 1% | 1/100 |
| 3 σ | 99,730 0204 % | 0,269 9796 % | 1 / 370,398 |
| 3,290 527 σ | 99,9% | 0,1% | 1 / 1000 |
| 3,890 592 σ | 99,99% | 0,01% | 1 / 10 000 |
| 4 σ | 99,993 666 % | 0,006 334 % | 1 / 15 787 |
| 4,417 173 σ | 99,999% | 0,001% | 1 / 100 000 |
| 4,5 σ | 99,999 320 465 3751% | 0,000 679 534 6249% | 1 / 147 159. 5358 6,8 / 1 000 000 |
| 4,891 638 σ | 99,9999 % | 0,0001 % | 1 / 1 000 000 |
| 5 σ | 99,999 942 6697 % | 0,000 057 3303 % | 1 / 1 744 278 |
| 5,326 724 σ | 99,999 99 % | 0,000 01 % | 1 / 10 000 000 |
| 5,730 729 σ | 99,999 999 % | 0,000 001 % | 1 / 100 000 000 |
| 6 σ | 99,999 999 8027 % | 0,000 000 1973 % | 1 / 506 797 346 |
| 6,109 410 σ | 99,999 9999 % | 0,000 0001 % | 1 / 1 000 000 000 |
| 6,466 951 σ | 99,999 999 99 % | 0,000 000 01 % | 1 / 10 000 000 000 |
| 6,806 502 σ | 99,999 999 999 % | 0,000 000 001 % | 1 / 100 000 000 000 |
| 7 σ | 99,999 999 999 7440% | 0,000 000 000 256 % | 1 / 390 682 215 445 |
Связь между стандартным отклонением и средним значением
Стандартное отклонение среднего
Часто нам нужна некоторая информация о точности полученного среднего значения. Мы можем получить это, определив стандартное отклонение выборочного среднего. Предполагая статистическую независимость значений в выборке, стандартное отклонение среднего связано со стандартным отклонением распределения следующим образом:
σ иметь в виду знак равно 1 N σ <\ displaystyle \ sigma _ <\ text
(Предполагается статистическая независимость.)
Методы быстрого расчета
Аналогично для стандартного отклонения выборки,
Взвешенный расчет
Также может применяться инкрементный метод с уменьшенными ошибками округления, но с некоторой дополнительной сложностью.
Текущая сумма весов должна быть вычислена для каждого k от 1 до n :
В финальном дивизионе
Приведенные выше формулы становятся равными более простым формулам, приведенным выше, если веса приняты равными единице.












