рефераты конспекты курсовые дипломные лекции шпоры

Раздел Математика
/
Статистическое распределение выборки.

Реферат Курсовая Конспект

Выберите учебное заведение

Статистическое распределение выборки.

Статистическое распределение выборки. - раздел Математика, Возникновение математики случайного относится к середине 18 века и связано с попыткой создания теории азартных игр, особенно в кости Эмпирическая Функция Распределения/ Пусть Изучается...

Эмпирическая функция распределения/

Пусть изучается некоторая св. X. С этой целью над с. в. X производится ряд независимых опытов (наблюдений). В каждом из этих опытов величина X принимает то или иное значение.

Пусть она приняла n₁ раз значение x₁, n₂ раз — значение x₂, …, n_k раз — значение x_k. При этом n₁ + n₂ +…+ n_k =n— объем выборки. Значения x₁, x₂, …, x_k называются вариантами св. X.

Вся совокупность значений с.в. X представляет собой первичный статистический материал, который подлежит дальнейшей обработке, прежде всего — упорядочению.

Операция расположения значений случайной величины (признака) по неубыванию называется ранжированием статистических данных. Полученная таким образом последовательность x₍₁₎, x₍₂₎, …, x₍_n₎ значений с. в. X (где x₍₁₎£ x₍₂₎£ …£ x₍_n₎ и x₍₁₎=,…, x₍_n₎ =называется вариационным рядом.

Числа n_i , показывающие, сколько раз встречаются варианты x_i в ряде наблюдений, называются частотами, а отношение их к объему выборки — частностями или относительными частотами (р_i*), т.е.

(6.1)

где n=

Перечень вариантов и соответствующих им частот или частостей называется статистическим распределением выборки или статистическим рядом.

Записывается статистическое распределение в виде таблицы. Первая строка содержит варианты, а вторая — их частоты n_i (или частости р_i*).

Пример 6.2. В результате тестирования (см. пример 6.1) группа абитуриентов набрала баллы: 5, 3, 0, 1, 4, 2, 5, 4, 1, 5. Записать полученную выборку в виде: а) вариационного ряда; б) статистического ряда.

а) Проранжировав статистические данные (т. е. исходный ряд), получим вариационный ряд (x₍₁₎, x₍₂₎, …, x₍₁₀₎):

(0, 1, 1, 2, 3, 4, 4, 5, 5, 5).

б) Подсчитав частоту и частость вариантов x₁=0, x₂=1, x₃ =2, x₄=3, x₅ =4, x₆ =5, получим статистическое распределение выборки) (так называемый дискретный статистический ряд)

x_i

n_i

или

x_i

р_i*

Статистическое распределение выборки является оценкой неизвестного распределения. В соответствии с теоремой Бернулли (п. 5.3) относительные частоты р_i* сходятся при n → ∞ к соответствующим вероятностям р_i, т.е. р_i*р_i. Поэтому при больших значениях п статистическое распределение мало отличается от истинного распределения.

В случае, когда число значений признака (с. в. X) велико или признак является непрерывным (т. е. когда с. в. X может принять любое значение в некотором интервале), составляют интервальный статистический ряд. В первую строку таблицы статистического распределения вписывают частичные промежутки [x₀, x₁), [x₁, x₂), …, [x_k_-1, x_k), которые берут обычно одинаковыми по длине: h = x₁ – x₀ = х₂ — x₁ = .... Для определения величины интервала (h) можно использовать формулу Стерджеса:

,

где х_m_ах — x_min — разность между наибольшим и наименьшим значениями признака, m= 1 + log₂ n — число интервалов (log₂ n ≈ 3,322 lg n). За начало первого интервала рекомендуется брать величину x_нач = x_min—. Во второй строчке статистического ряда вписывают количество наблюдений n_i (i =1,…,k), попавших в каждый интервал.

Пример 6.3. Измерили рост (с точностью до см) 30 наудачу отобранных студентов. Результаты измерений таковы:

178, 160, 154, 183, 155, 153, 167, 186, 163, 155,

157, 175, 170, 166, 159, 173, 182, 167, 171, 169,

179, 165, 156, 179, 158, 171, 175, 173, 164, 172.

Построить интервальный статистический ряд.

Для удобства проранжируем полученные данные:

153, 154, 155, 155, 156, 157, 158, 159, 160, 163, 164, 165. 166. 167, 167, 169,

170, 171, 171, 172, 173, 173, 175, 175, 178, 179, 179, 182, 183, 186.

Отметим, что X — рост студента — непрерывная с. в. При более точном измерении роста значения с. в. X обычно не повторяются (вероятность наличия на Земле двух человек, рост которых равен, скажем = 1,732050808... метров, равна нулю!).

Как видим, х_т_i_п = 153, х_m_ах = 186; по формуле Стерджеса, при п = 30, находим длину частичного интервала

Примем h = 6. Тогда х_нач = 153-= 150. Исходные данные

разбиваем на 6 (т = 1 + log₂30 = 5,907 ≈ 6) интервалов: [150,156), [156,162), [162,168), [168,174), [174, 180), [180, 186).

Подсчитав число студентов (n_i), попавших в каждый из полученных промежутков, получим интервальный статистический ряд:

Рост [150-156) [156-162) [162-168) [168-174) [174-180) [180-186)

Частота

Частость 0,13 0,17 0,20 0,23 0,17 0,10

Одним из способов обработки вариационного ряда является построение эмпирической функции распределения.

Эмпирической (статистической) функцией распределения называется функция F_n* (х), определяющая для каждого значения х частость события {X < х}:

F_n* (х)=p*{X<x}. (6.2)

Для нахождения значений эмпирической функции удобно F_n* (х) писать в виде

F_n* (х)=

где n — объем выборки, n_х — число наблюдений, меньших x (x Î R) Очевидно, что F_n* (х) удовлетворяет тем же условиям, что и истинная функция распределения F(x) (см. п. 2.3).

При увеличении числа п наблюдений (опытов) относительная частота события {X < х} приближается к вероятности этого события (теорема Бернулли, п. 5.3). Эмпирическая функция распределения^- F_n* (х) является оценкой вероятности события {X < х}, т.е. оценкой теоретической функции распределения F(x) с.в. X, Имеет место

Теорема 6.1 (Гливенко).Пусть F(x) — теоретическая функция распределения с.в. X, а F_n* (х) — эмпирическая. Тогда для любого e > 0

lim { |F_n* (х)-F(x)|>e} = 0.

Пример 6.4.Построить функцию F_n* (х), используя условие и результаты примера 6.2.

Здесь п = 10. Имеем F*₁₀(x) = = 0 при х£ 0 (наблюдений меньше 0 нет); F*₁₀(x) = при 0 < х£ 1 (здесь n_х = 1) и т. д. Окончательно получаем

График эмпирической функции распределения

приведен на рис. 59.

Развернуть

Открыть в широком формате

– Конец работы –

Эта тема принадлежит разделу:

Возникновение математики случайного относится к середине 18 века и связано с попыткой создания теории азартных игр, особенно в кости

Теория вероятности как и другие науки возникла из потребностей практики Ее элементы были знакомы еще первобытным людям шансы убить зверя у двух... Возникновение математики случайного относится к середине века и связано с... Пример одной из ситуаций два игрока договорились играть в кости до тех пор пока одному не удастся выиграть три...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Статистическое распределение выборки.

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

Предмет теории вероятности
Любая наука изучает не сами явления, протекающие в природе, в обществе, а их математические модели, т.е. описание явлений при помощи набора строго определенных символов и операций над ними.

Действия над событиями
Введем основные операции над событиями; они полностью соответствуют основным операциям над множествами. Суммой событий А и В называется событие С = А +

Статистическое определение вероятности
Для математического изучения случайного события необходимо ввести какую-либо количественную оценку события. Понятно, что одни события имеют больше шансов («более вероятны») наступить, чем другие.

Элементы комбинаторики
Согласно классическому определению подсчет вероятности события А сводится к подсчету числа благоприятствующих ему исходов. Делают это обычно комбинаторными методами. Комбин

Геометрическое определение вероятности
Геометрическое определение вероятности прим

Аксиоматическое определение вероятности
Аксиоматическое построение теории вероятностей создано в начале 30-х годов академиком А. Н. Колмогоровым. Аксиомы теории вероятностей вводятся таким образом, чтобы вероятность события обладала осн

Свойства вероятностей
Приведем ряд свойств вероятности, являющихся следствием аксиом Колмогорова. С1. Вероятность невозможного события равна нулю, т.е. Р(Æ) =0.

Конечное вероятностное пространство
Пусть производится некоторый опыт (эксперимент), который имеет конечное число возможных исходов w1, w2, w3,.., wn. В этом случае Ώ = {

Условные вероятности
Пусть А и В — два события, рассматриваемые в данном опыте. Наступление одного события (скажем, А) может влиять на возможность наступления другого (В). Для характеристики зависимости одн

Независимость событий
Из определения условной вероятности (п. 1.14) следует, что Р(А×В) = Р(А)×Р(ВçА)=Р(В)-Р(АçВ), (1.22) т. е. вероятность произведения

Вероятность суммы событий
Как известно (п. 1.11), вероятность суммы двух несовместных событии определяется аксиомой A3: ({А + В) = Р(А) + Р(В), А×В = Æ Выведем формулу суммы вероятностей двух совместных с

Формула полной вероятности
Одним из следствий совместного применения теорем сложения умножения вероятностей являются формулы полнойвероятности и Байеса. Напомним, что события А1, А2, …

Формула Байеса (теорема гипотез)
Следствием формулы (1.30) является формула Байеса или теорема гипотез. Она позволяет переоценить вероятности гипотез Hi, принятых до опыта и называе

Формула Бернулли
Простейшая задача, относящаяся к схеме Бернулли, состоит в определении вероятности того, что в п независимых испытаниях событие А наступит т раз (0 £т £ n

Понятие случайной величины. Закон распределения случайной величины
Одним из важнейших понятий теории вероятностей (наряду со случайным событием и вероятностью) является понятие случайной величины. Под случайной величиной понимают величину, которая в резул

Закон распределения дискретной случайной величины. Многоугольник распределения
Пусть X — д. с. в., которая принимает значения x1, x2, x3,…,xn,… (множество этих значений конечно или счетно) с некоторой вероятностью pi

Функция распределения и ее свойства. Функция распределения дискретной случайной величины
Очевидно, ряд распределения с.в. может быть построен только для д.с. в.: для н. с. в. нельзя даже перечислить все ее возможные значения. Кроме того, как увидим позже (п. 2.3, 2.4), вероятность кажд

Математическое ожидание случайной величины
Математическим ожиданием (или средним значением) д. с. в. X, — имеющей закон распределения рi = Р{Х = xi}, i= 1,2, 3,... , n, называется число, равное сумме произвед

Дисперсия
Дисперсией (рассеянием) с. в. X называется математическое ожидание квадрата ее отклонения от своего математического ожидания. Обозначается дисперсия через DX (или

Среднее квадратическое отклонение
Дисперсия DX имеет размерность квадрата св. X, что в сравнительных целях неудобно. Когда желательно, чтобы оценка разброса (рассеяния) имела размерность с.в., используют еще одну числовую характер

Мода и медиана. Моменты случайных величин. Асимметрия и эксцесс. Квантили
Модой д. с. в. X называется ее значение, принимаемое с наибольшей вероятностью по сравнению с двумя соседними значениями, обозначается через M0X. Для н.с.b. M0X — точ

Предмет математической статистики
Математическая статистика — раздел математики, в котором изучаются методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений для выявления

Генеральная и выборочная совокупности
Пусть требуется изучить данную совокупность объектов относительно некоторого признака. Например, рассматривая работу диспетчера (продавца, парикмахера,...), можно исследовать: его загружен

Графическое изображение статистического распределения
Статистическое распределение изображается графически (для наглядности) в виде так называемых полигона и гистограммы. Полигон, как правило, служит для изображения дискретного (т. е. варианты отлич

Числовые характеристики статистического распределения
Для выборки можно определить ряд числовых характеристик, аналогичным тем, что в теории вероятностей определялись для случайных величин (см. п. 2.5). Пусть статистическое распределение выб