рефераты конспекты курсовые дипломные лекции шпоры

Реферат Курсовая Конспект

Ошибка выборки

Ошибка выборки - раздел Математика, СТАТИСТИКА. КУРС ЛЕКЦИЙ Развитие Современной Теории Выборочного Наблюдения Началось С Простой Случайн...

Развитие современной теории выборочного наблюдения началось с простой случайной выборки.

В процессе проведения выборочного наблюдения, как и вообще при анализе данных любого обследования возникают ошибки. Все ошибки выборочного наблюдения подразделяются на ошибки выборки (случайные); ошибки, вызванные отклонением от схемы отбора (неслучайные) и ошибки наблюдения (случайные и неслучайные).

Ошибка отбора приводит к неслучайным ошибкам. Так бывает, если заменяется единицы, попавшие в выборку, другими единицами (например, если вместо отобранного домохозяйства, где в момент прихода исследователя никто не открыл дверь и был проведен опрос соседей, или когда появляются добровольные респонденты и просят, чтобы их опросили). Неслучайные ошибки возникают из-за методов сбора данных (неудобные вопросы, на которые не отвечают правдиво или неоднозначные по формулировке вопросы).

Случайные ошибки - это те ошибки, которые изменяются по вероятностным законам. К случайным относятся ошибки выборки.

В математической теории выборочного метода доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются.

Теоретической основой выборочного метода служат теоремы теории вероятностей П.Л. Чебышева и А.И. Ляпунова.

Теорема П.Л. Чебышева в приложении к выборочному методу формулируется следующим образом: «при неограниченном увеличении числа независимых наблюдений () в генеральной совокупности с ограниченной дисперсией с вероятностью сколь угодно близкой к 1, можно ожидать, что отклонение выборочной средней от генеральной средней будет сколь угодно мало, т.е. при .

Таким образом, теорема П.Л. Чебышева доказывает принципиальную возможность определения генеральной средней по данным простой случайной выборки.

Однако, пользуясь этой теоремой, мы не можем указать вероятность появления ошибок определенной величины. На этот вопрос отвечает теорема А.М. Ляпунова, доказанная в 1901 году. Согласно этой теореме при достаточно большом числе независимых наблюдений в генеральной совокупности с конечной средней и ограниченной дисперсией вероятность того, что (расхождение между выборочной средней и генеральной средней) не превзойдет по абсолютной величине некоторую величину tm равно интегралу Лапласа:

, где Ф(t) – нормированная функция Лапласа.

(1)

Величина m - средняя квадратическая стандартная ошибка выборки.

Ошибка выборки или ошибка репрезентативности - это разница между значением показателя, полученного по выборке, и генеральным параметром. Так, ошибка репрезентативности выборочной средней равна , дисперсии .

Если предположить, что было проведено бесконечное число выборок равного объема из одной и той же генеральной совокупности, то показатели отдельных выборок образовали бы ряд возможных значений. Каждая выборка имеет свою ошибку репрезентативности. Эти ошибки также бы образовывали ряд. При бесконечно большом числе выборок получается кривая частот, которая представляет кривую выборочного распределения. Свойства таких распределений используют для получения статистических заключений, установления вероятности той или иной величины, той или иной ошибки выборки.

По выборочному распределению может быть рассчитана средняя квадратическая ошибка репрезентативности:

 

 

(2)

 

где ε2i - квадрат ошибки выборки для i -той выборки;

fi - число выборок с одинаковым значением выборочной средней.

Теперь выпишем среднее квадратическое отклонение выборочных средних от генеральной средней:

(3)

Эта формула называется средней ошибкой выборочной средней.

Поскольку, как правило, генеральная средняя неизвестна, этой формулой просто так нельзя воспользоваться. Кроме того, в социально-экономических исследованиях из одной и той же совокупности выборку не проводят многократно. Но можно воспользоваться методами теории вероятностей, основанными на использовании предельных теорем закона больших чисел. Для оценки ошибки выборки используют соотношение, которое вытекает из теоремы П.Л.Чебышева. Оно формулируется следующим образом: квадрат средней ошибки (дисперсия выборочных средних) прямо пропорциональна дисперсии признака х в генеральной совокупности σ2 и обратно пропорциональна объему выборки n. Получаем следующую формулу:

(4)

 

Следовательно, извлекая, квадратный корень, получаем среднюю ошибку выборочной средней.

(5)

Таким образом, средняя ошибка выборки тем больше, чем больше вариация в генеральной совокупности, и тем меньше, чем больше объем выборки. Ошибка конкретной выборки может принимать различные значения, но отношение её к средней ошибке практически не превышает 3, если величина n достаточно большая (n>100).

Распределение ошибок выборочных средних имеет характер нормального распределения, даже если генеральная совокупность имеет иную форму распределения. Из формулы (5) получаем, что отклонение выборочной средней от генеральной средней равно:

 
 
(6)


Эту формулу еще называют предельной ошибкой выборки

Нормированное отклонение t может быть установлено по таблице "Значение интеграла вероятностей". Для этого необходимо принять определенный уровень вероятности суждения о точности данной выборки. Вероятность, которая принимается при расчете ошибки выборочной характеристики, называется доверительной. Чаще всего принимают доверительную вероятность равной 0,95, 0,954 и 0,997 или даже 0,999. Доверительный уровень 0,95 означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы; вероятность 0,954 - в 46 случаях из 1000, при 0,997 - в 3 случаях из 1000, а 0,999 - в 1 случае из 1000. Коэффициент t – коэффициентом доверия.

Приведем наиболее часто употребляемые уровни доверительной вероятности и соответствующие значения t для выборок достаточно большого объема (n≥30):

 

t 1,0 1,96 2,0 2,58 3,00
Ф(t) 0,683 0,95 0,954 0,99 0,997

 

Чтобы вычислить ошибку выборки при принятой доверительной вероятности, нужно рассчитать величину средней ошибки . Формула (4) включает дисперсию признака в генеральной совокупности σ2, которая, как правило, неизвестна. Доказано, что соотношение между σ2 и σ 2 определяется следующим равенством: (следствие теоремы Чебышева)

 

(7)

(8)
Отсюда

Если n велико то сомножитель n/(n-1) ≈1 и можно принять выборочную дисперсию в качестве оценки величины генеральной дисперсии. Подставляем выражение (10) в формулу средней ошибки выборки получим,

или (9)

(10)
Соответственно

Ошибка выборки для выборочной относительной величины (доли) определяется аналогично. Дисперсия относительной величины по данным выборки: 2 = w(1-w), где р- доля тех или иных единиц в выборке.

Средняя ошибка выборочной доли определяется по формуле:

(11)

 

Предельная ошибка выборочной доли с принятой доверительной вероятностью имеет вид:

 

(12)

 

При проведении выборочного наблюдения используются разные способы формирования выборочной совокупности: случайный отбор - повторный или бесповторный, механический, серийный и типический. Вид выборки влияет на величину ошибки. Мы с вами разобрали какова будет ошибка при случайном повторном (отбор единицами). При бесповторном отборе формула средней ошибки умножается на , который корректирует величину ошибки выборки в связи с изменением состава совокупности и вероятности попадания единиц в выборку. Представим все формулы средней ошибки выборки в таблице:

Вид выборки Средняя ошибка
выборочной средней выборочной относительной (доли)
Повторная - отбор единицами
Бесповторная - отбор единицами
Серийная (нерайонированная)
Районированная - отбор единицами, бесповторная
Районированная - отбор сериями, бесповторная

 

Здесь r - число отобранных серий, R - общее число серий. В серийной выборке дисперсия определяется как колеблемость между сериями по формуле:

(13)

 

- среднее значение признака х в i-той серии;

- среднее значение в целом по выборке;

r - число отобранных серий.

Если серии не равны по числу единиц, то в числитель добавляется вес - число единиц i-той серии, а в знаменателе вместо к указывается ∑fi.

При типическом отборе (районированная выборка) дисперсия рассчитывается как средняя из внутренних дисперсий:

 

(14)

 

где - выборочная дисперсия признака х в i-том районе;

(15)

nj - объем выборки в j-том районе;

m - число районов.

При нерайонированной серийной выборке дисперсия рассчитываем по следующей формуле:

(16)

где pj - доля единиц определенной категории в j-той серии;

p - доля единиц этой категории в выборке.

При районированной серийной выборке дисперсия представляет среднюю из межсерийных дисперсий для каждого района:

(17)

где - межсерийная дисперсия доли в j-том районе;

rj - число серий, отобранных в j-том районе

m - число районов.

 

– Конец работы –

Эта тема принадлежит разделу:

СТАТИСТИКА. КУРС ЛЕКЦИЙ

РАЗДЕЛ I ОПИСАТЕЛЬНАЯ СТАТИСТИКА... Тема Статистика как наука Методы статистики...

Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: Ошибка выборки

Что будем делать с полученным материалом:

Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:

Все темы данного раздела:

СТАТИСТИКА. КУРС ЛЕКЦИЙ
         

Общее понятие статистики. Предмет статистики.
Слово "статистика" происходит от латинского слова status - состояние, положение вещей. Первоначально оно употреблялось в значении "политическое состояние". Отсюда и итальянское

Статистическое исследование. Методы статистики
Статистика изучает совокупности однокачественных явлений в конкретных условиях места и времени. И, следовательно, статистика располагает всегда ограниченным числом данных. Каждое явление возникает

Статистическое наблюдение. Виды статистического наблюдения.
Статистическое наблюдение - это массовое, планомерное, научно организованное наблюдение за явлениями экономической и социальной жизни. Это наблюдение может проводиться органами государственной стат

Сущность и значение статистических показателей. Показатель и его атрибуты
Мы уже говорили, что статистика изучает массовые явления, процессы количественно в числовой форме. Но "числа", применяемые в статистике, это не абстрактные числа математики, которые харак

Общие принципы построения относительных статистических показателей
При построении относительных статистических показателей необходимо соблюдать следующие принципы. Принцип 1. Сравниваемые абсолютные показатели в относительных величинах должны быть

Понятие о системах статистических показателей
Как правило, изучаемые статистикой процессы и явления, достаточно сложны и поэтому их сущность не может быть выражены в отдельном показателе. В таких случаях используют систему статистических показ

Роль и значение статистических показателей в управлении экономическими и социальными процессами
Основной функцией конкретных статистических показателей и их систем является познавательная информационная функция. Без статистической информации невозможно познание закономерностей природны

Статистические таблицы
Статистические данные должны быть представлены так, чтобы ими можно было пользоваться. Существуют три способа представления данных: они могут быть включены в текст, представлены в таблицах или выра

Распределение занятого населения России по секторам экономики (млн. человек)
  Всего занято в экономике В том числе: 72,1 66,0 На государст

Основные виды графиков
Иногда статистические таблицы дополняются графиками, когда ставится цель подчеркнуть какую-то особенность данных, провести их сравнение. Графики являются самой эффективной формой представления данн

Карты и картограммы.
Картограммы и картодиаграммы применяются для изображения графической характеристики изучаемых явлений. Они показывают размещение изучаемого явления, его интенсивность на определенной территории - в

Значение и сущность группировки. Построение группировки
Изучаемые статистикой массовые явления и процессы протекают в множествах элементов (единиц) некоторого вида, или совокупностях. Определить совокупность – значит определить входящие в нее элементы,

Виды группировок
В зависимости от числа положенных в основание группировки признаков различают простые и многомерные группировки. Простой называется группировка, выполненная по одному признаку. Среди прост

В апреле 1994 г.
Группа населения по размеру среднедушевого денежного дохода, тыс. руб. в месяц Численность населения Всего млн. ч. % к ит

По сумме активов баланса (данные условные)
Группа банков по сумме активов баланса, млн. руб. Количество банков, единиц В среднем на один банк Численность занятых, ч

И числу детей в 1989 г.
(по материалам переписи населения) Группа семей по месту проживания В том числе подгруппа семей по числу детей Число се

Многомерные группировки
Группировка, осуществляемая одновременно по комплексу признаков называется многомерной. Характеристика одной и той же стороны изучаемого явления может быть дана с помощью набора пр

Средняя арифметическая величина. Свойства средней арифметической величины
Как мы уже говорили раньше, статистика изучает массовые явления и процессы. Каждое такое явление обладает как общими для всей совокупности свойствами, так и особенными, индивидуальными свойствами.

Понятие средней арифметической
Виды средних величин отличают, прежде всего, тем, какое свойство, какой параметр исходной варьирующей массы индивидуальных значений признака должен быть сохранен неизменным. Средней ари

Виды средней арифметической
Если при группировке значения осредняемого признака заданы интервалами, то при расчете средней арифметической величины в качестве значения признака в группах принимаются середины этих интервалов, т

Свойства арифметической средней
1. Сумма отклонений индивидуальных значений признака от его среднего значения равна нулю. Доказательство:

Средняя квадратическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить н

Средняя геометрическая величина
Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменным произведение индивидуальных величин, то применяют среднюю геометрическую величину. Её формула так

Средняя гармоническая величина
Если по условиям задачи необходимо, чтобы неизменной оставалась при осреднении сумма величин, обратных индивидуальным значениям признака, то средняя величина является гармонической средней. Иными с

Вариации массовых явлений. Построение вариационного ряда
Составной частью сводной обработки данных статистического наблюдения является построение рядов распределения. Как мы уже говорили ранее, в зависимости от того, является признак, взятый за основу гр

Структурные характеристики вариационного ряда. Показатели размера и интенсивности вариации.
При изучении вариации применяются такие характеристики вариационного ряда, которые описывают количественно его структуру, строение. К ним относят медиану и моду, которые еще часто называют структур

Показатели размера и интенсивности вариации.
Абсолютные средние размеры вариации. Следующим этапом изучения вариации признака в совокупности является измерение характеристик величины вариации. Простейшим из них служит

Относительное отклонение по модулю m
3) коэффициент вариации как относительное квадратическое от

Закономерности распределения.
В приведенном примере можно заметить определенную зависимость между изменением варьирующегося признака и частот. Частоты в этих рядах с увеличением значения признака первоначально увеличиваются, а

Тема 6. Выборочное наблюдение.
  1. Способы формирования выборочной совокупности. Виды выборки. 2. Ошибка выборки. 3. Определение необходимой численности выборки. 4. Малая выборка.

Определение необходимой численности выборки.
Средняя квадратическая (стандартная) ошибка выборки зависит от объема выборки и степени вариации признака в генеральной совокупности. Уменьшение стандартной ошибки выборки, а следовательно увеличен

Малая выборка
Таблицы интеграла вероятностей используются для выборок большого объема из бесконечно большой генеральной совокупности. Но уже при n > 100 получается несоответствие между табличными данными и ве

Понятие о статистической и корреляционной связи
Невозможно управлять явлениями, предсказывать их развитие без изучения характера, силы и других особенностей связей. Поэтому методы измерения связей составляют важную часть статистического анализа.

Парная регрессия на основе метода наименьших квадратов и метода группировок.
Парная регрессия характеризует связь между двумя признаками: результативным и факторным. Аналитически связь между ними описывается уравнениями: прямой :

Множественная (многофакторная) регрессия.
Изучение связи между тремя и более связанными между собой признаками носит название множественной регрессии. При исследовании зависимостей методами множественной регрессии задача формулируется так

Оценка тесноты связи.
Измерение тесноты и направления связи между признаками предлагает определение меры соответствия вариации результативного признака от одного (при изучении парных зависимостей) или нескольких (множес

Проверка значимости параметров регрессии.
Проверка статистической значимости всех параметров, полученных в процессе корреляционно-регрессионного анализа, основывается на предположении, что все эти параметры, а точнее, их значения являются

Методы выявления типа тенденции динамики
Ряд динамики может быть подвержен влиянию различных факторов. Под действием эволюционных факторов происходят изменения, которые определяют общие направления развития, называемые тенденцией или т

Методика измерения параметров тренда
После того как установлено наличие тенденции в ряду динамики производится её описание с помощью уравнений, отражающих те или иные качественные свойства развития. Эта процедура называется методом сг

Методика изучения и показатели колеблемости
Если при изучении и измерении тенденции динамики колебания уровней играют лишь роль помех, то в дальнейшем они сами становятся предметом статистического исследования. Типы колебаний весьма разнообр

Прогнозирование на основе тренда
Методика статистического прогноза по тренду и колеблемости основана на их экстраполяции, т.е. на предположении, что параметры тренда и колеблемости сохраняться до прогнозируемого периода. Такая экс

Агрегатные и средние индексы
Агрегатный индекс – сложный относительный показатель, который характеризует среднее изменение социально-экономического явления, состоящего из несоизмеримых элементов. Латинское слово «агрега

Средние индексы
Помимо агрегатных индексов в статистике применяется другая их форма – средневзвешенные индексы. К их исчислению прибегают тогда, когда имеющаяся в распоряжении информация не позволяет рассчитать об

Индексы структурных сдвигов
При изучении динамики качественных показателей приходится определять изменение средней величины индексируемого показателя, которое может быть вызвано действием двух факторов – изменением значения и

Индексы пространственно-территориального сопоставления
В статистической практике часто возникает потребность в сопоставлении уровней экономического явления в пространстве: по странам, экономическим районам, , областям, т.е. в исчислении территориальных

Экономические индексы Ласпейреса, Пааше, Фишера. Индексы-дефляторы.
В рыночном хозяйстве особое место среди индексов качественных показателей отводится индексам цен. Основным назначением индекса цен является оценка динамики цен на товары производственного и непроиз

Границы и условия применения индексного метода
Индексный метод предполагает, что связь между признаками является жестко детерминированной, которая проявляется как в каждом отдельном случае (для отдельного товара, вида продукции, предприятия), т

Хотите получать на электронную почту самые свежие новости?
Education Insider Sample
Подпишитесь на Нашу рассылку
Наша политика приватности обеспечивает 100% безопасность и анонимность Ваших E-Mail
Реклама
Соответствующий теме материал
  • Похожее
  • Популярное
  • Облако тегов
  • Здесь
  • Временно
  • Пусто
Теги