Реферат Курсовая Конспект
ТЕМА №8 - раздел Математика, ТЕОРІЯ ЙМОВІРНОСТЕЙ ТА МАТЕМАТИЧНА СТАТИСТИКА 1. Предмет Математичної Статистики. Статистичні Сукупності (Генеральн...
|
1. Предмет математичної статистики. Статистичні сукупності (генеральна та вибіркова).
2. Способи відбору. Проста випадкова вибірка. Впорядкування даних та їх розподіл.
3. Числові характеристики статистичних розподілів.
4. Точкові та інтервальні оцінки параметрів статистичних розподілів, вимоги до цих оцінок.
Предмет математичної статистики полягає у розробці методів збору та обробки статистичних даних для одержання наукових та практичних висновків.
Основні задачі математичної статистики:
1) вказати способи збору та групування (якщо даних дуже багато) статистичних відомостей;
2) визначити закон розподілу випадкової величини або системи випадкових величин за статистичними даними;
3) визначити невідомі параметри розподілу;
4) перевірити правдоподібність припущень про закон розподілу випадкової величини, про форму зв’язку між випадковими величинами або про значення параметру, який оцінюють.
ГЕНЕРАЛЬНА ТА ВИБІРКОВА СУКУПНОСТІ.
Нехай потрібно вивчити сукупність об’єктів відносно деякої якісної або кількісної ознаки (випадкової величини), які характеризують ці об’єкти. Кожен об’єкт, який спостерігають, має декілька ознак. Розглядаючи лише одну ознаку кожного об’єкта, ми припускаємо, що інші ознаки рівноправні, або що множина об’єктів однорідна.
Такі множини однорідних об’єктів називають статистичною сукупністю.
Наприклад, якщо досліджують партію деталей, то якісною ознакою може бути стандартність або нестандартність кожної деталі, а кількісною ознакою– розмір деталі. Кількісні ознаки бувають дискретними та неперервними.
Перевірку статистичної сукупності можна провести двома способами:
1) перевірити усі об’єкти сукупності (суцільна перевірка або перепис);
2) перевірити лише певну частину об’єктів сукупності (вибірка).
Перевагами вивчення вибірки є малі затрати коштів, обладнання та часу. Вибірку можна ефективно застосовувати для вивчення відповідної ознаки усієї сукупності лише тоді, коли дані вибірки вірно відображають цю ознаку, тобто вибірка повинна бути репрезентативною (представницькою, показною).Згідно із законом великих чисел теорії імовірностей можна стверджувати , що вибірка буде репрезентативною лише тоді, коли її здійснюють випадково.
Простим випадковим відбором (простою випадковою вибіркою)називають такий відбір із статистичної сукупності, при якому кожний об’єкт, що відбирається, має однакову імовірність потрапити до вибірки. Об’єм вибіркової сукупності (вибірки) – це кількість об’єктів цієї сукупності.Варто відмітити, що альтернативою для простої випадкової вибірки в статистиці є розшарована випадкова вибірка.
Генеральною називають сукупність об’єктів, з якої зроблено вибірку. Об’єм генеральної сукупності позначають .
Вибірки бувають повторні(при яких відібраний об’єкт повертається до генеральної сукупності перед відбором іншого об’єкта) та безповторні(при яких взятий об’єкт до генеральної сукупності не повертається). Найчастіше використовуються безповторні вибірки.
ДЖЕРЕЛА ДАНИХ У СТАТИСТИЦІ.
Дослідники і менеджери отримують дані, необхідні для прийняття рішень, в основному, з трьох джерел:
1) вибіркові обстеження;
2) спеціально поставлені експерименти;
3) результати повсякденної (рутинної) роботи у бізнесі.
Приклади: 1) дослідницький центр вибирає 1000 потенційних виборців для опитування з метою вивчення рейтингу певного кандидата на виборах; 2) проведення анкетування серед певної групи людей за спеціально розробленою анкетою; 3) аналіз даних рівня продажу певного виду товару, різноманітні офіційні джерела статистичних даних.
Джерела даних бувають первинними та вторинними.
Первинні дані збираються спеціально для статистичного дослідження. Для цих даних є відомості про методи збирання, точність даних тощо.
Вториннимиє дані, що використовуються у статистиці, але спочатку збирались для інших цілей. Очевидно, що рутинні записи про діяльність фірм, офіційні статистичні звіти є вторинними даними.
Безумовно, більш цінними є первинні дані, але їх не завжди можна отримати, тому часто використовуються вторинні дані.
СПОСОБИ ВІДБОРУ.
1. Вибір, який не потребує розділення генеральної сукупності на частини. До цього вибору відносять:
- простий випадковий безповторний відбір;
- простий випадковий повторний відбір.
2. Вибір, при якому генеральна сукупність розділяється на частини (розшарований випадковий відбір). До цього виду вибору відносять:
- типовий відбір;
- механічний відбір;
- серійний відбір.
Типовимназивають відбір, при якому об’єкти відбирають не із усієї генеральної сукупності, а лише із її типових частин. Наприклад, якщо однакові вироби виготовляються на різних підприємствах (або різними станками), то відбираються вироби кожного окремого підприємства (станка) тощо.
Механічнимназивають відбір, при якому генеральна сукупність механічно поділяється на стільки частин, скількимає бути об’єктів у вибірці. Із кожної частини випадковим чином відбирають один об’єкт. Наприклад, якщо потрібно перевірити 25% усіх виготовлених виробів, то відбирають кожний четвертий виріб. Зазначимо, що для репрезентативності механічного відбору потрібно враховувати специфіку технологічного процесу.
Серійнимназивають відбір, при якому об’єкти із генеральної сукупності відбирають не по одному, а серіями. Серійний відбір застосовують тоді, коли ознака, яку досліджують, мало змінюється у різних серіях.
Зауважимо, що в економічних дослідженнях застосовують і комбіновані відбори.
ПРОСТА ВИПАДКОВА ВИБІРКА.
Для здійснення простої випадкової вибірки необхідна наявність основи вибірки,тобто такого представлення генеральної сукупності, при якому її елементи були б принаймні перераховані.
Приклад. а) генеральна сукупність – всі клієнти банку. Основою вибірки можуть бути робочі списки клієнтів, що вів банк.
б) генеральна сукупність – всі мешканці міста,які мають телефон. Основою вибірки може бути телефонний довідник.
Як правило, дані для утворення простої випадкової вибірки подаються у вигляді деякої, заздалегідь складеної таблиці і тому основою вибірки є нумерація елементів цієї таблиці.
Основа вибірки повинна повністю відбивати ознаку генеральної сукупності, яка вивчається. Порушення цієї вимоги може зробити вибірку нерепрезентативною.
Приклад. Для обстеження молодих сімей міста на предмет наявності в них дітей дошкільного віку дослідник випадковим чином за допомогою телефонного довідника обзвонює сім’ї з 18.00 до 21.00 щодня. Чи буде така вибірка репрезентативною?
Приклад. Проста випадкова вибірка може використовуватись у наступних дослідженнях:
а) телефонна компанія перевіряє рахунки 10% всіх міжнародних телефонних переговорів з метою визначення їх середньої величини;
б) аудиторська перевірка 20% фірм регіону з метою контроля правильності сплати податків.
Загальновідомо, що найкращим способом здійснення простої випадкової вибірки є використання випадкових вибіркових чисел (їх таблиць або за допомогою стандартних комп’ютерних програм, зокрема, функції “выборка” електронних таблиць Excel).
СТАТИСТИЧНИЙ РОЗПОДІЛ ОЗНАКИ.
Дані у статистиці, отримані за допомогою спеціальних досліджень або із робочих (рутинних) записів у бізнесі, надходять до дослідника у вигляді неорганізованої маси (незалежно від того, чи є вони вибірковими, чи даними із генеральної сукупності). В математичній статистиці замість слова “дані” вживається термін “варіанти”. Характеристику варіанти (випадкову величину) при цьому називають ознакою.
Нехай із генеральної сукупності взята вибірка об’єктів об’єму , для вивчення ознаки . Тобто, значення є варіанти ознаки . Першим кроком обробки є впорядкування варіант. Розглянемо приклад:
Вибірка середньомісячної зарплати 100 співробітників фірми | |||||||||
Розташуємо дані у порядку зростання:
Впорядкована вибірка середньомісячної зарплати 100 співробітників фірми (у порядку зростання) | |||||||||
Варіанти, записані до таблиці у зростаючому (спадаючому) порядку, називають варіаційним рядом. При упорядкуванні (ранжуванні) можна отримати більше інформації, наприклад, про межі зміни середньомісячної зарплати.
РОЗПОДІЛ ЧАСТОТ.
Нехай у вибірці із варіант ознака прийняла значення раз, значення раз, …, значення раз.
Додатне число, що вказує, скільки раз та чи інша варіанта зустрічається в таблиці даних, називається частотою, а ряд називається рядом частот. Відмітимо, що сума усіх частот повинна дорівнювати об’єму вибірки: .
Статистичний розподіл вибірки встановлює зв’язок між рядом варіант, що зростає або спадає, і відповідними частотами. Як правило, його подають у вигляді таблиці:
… | ||||
… |
Заданий такою таблицею розподіл називають простим незгрупованим статистичним розподілом або розподілом частоти варіанти (рядом розподілу частоти варіанти).
Розподіл частоти середньомісячної зарплати співробітників фірми | |||||||
.
Подальшим кроком в обробці даних, що призводить до спрощення досліджень, є їх згрупування. Як видно із останньої таблиці максимальне та мінімальне значення варіанти будуть
.
Різниця цих чисел
називається варіаційним розмахом або розмахом варіант.
Введемо для варіанти інтервали зміни середньої зарплати: 280-290, 290-300,…, 380-390. Кожний інтервал називається класом інтервалів або класом, а число одиниць виміру у цих класах, тобто різниця , називається шириною класу. Використовуючи дані попередньої таблиці, отримуємо:
Згрупований розподіл частоти середньомісячної зарплати співробітників фірми | |
280-290 | |
290-300 | |
300-310 | |
310-320 | |
320-330 | |
330-340 | |
340-350 | |
350-360 | |
360-370 | |
370-380 | |
380-390 | |
сума |
Така таблиця, яка встановлює зв’язок між згрупованим рядом варіант, що зростає або спадає, та сумами їхніх частот по класах, називається згрупованим розподілом частоти варіанти. У нашому прикладі ширина класів однакова і дорівнює , а кількість класів . Зазначимо, що введені величини варіаційний розмах, ширина класів та їх кількість пов’язані співвідношенням
.
Зауваження. Інколи неможливо або небажано вибирати ширину класів однаковою. Неоднакова ширина класів бажана, наприклад, коли значення частоти одного чи декількох класів набагато більша (менша) значень частот інших інтервалів. Як правило, ширина інтервалів зростає (або спадає) і може містити інтервали відкритого типу “більше ніж…”, “менше ніж…”.
ЗГРУПОВАНИЙ РОЗПОДІЛ НАКОПИЧЕНОЇ ЧАСТОТИ.
Часто поряд із розподілом частоти варіанти необхідно мати розподіл пакопиченої (кумулятивної) частоти. Такий розподіл одержується послідовним додаванням частот чергового інтервалу, починаючи з першого і зікінчуючи останнім (див.таблицю):
Згрупований розподіл частоти середньомісячної зарплати співробітників фірми | |||
інтервали платні | частоти | платня | накопичені частоти |
280-290 | <290 | ||
290-300 | <300 | ||
300-310 | <310 | ||
310-320 | <320 | ||
320-330 | <330 | ||
330-340 | <340 | ||
340-350 | <350 | ||
350-360 | <360 | ||
360-370 | <370 | ||
370-380 | <380 | ||
380-390 | <390 | ||
сума |
Розподіл накопиченої частоти дозволяє відповісти на питання: “Скільки існує варіант, менших, наприклад, 350?” Із таблиці знаходимо: .
РОЗПОДІЛ ЧАСТКИ (ВІДНОСНОЇ ЧАСТОТИ АБО ЧАСТОСТІ).
Часто замість значень частот використовуються відношення частоти варіанти до об’єму вибірки :
,
які називаються частками (відносними частотами або частостями), причому .
Залежність між впорядкованим рядом варіант і відповідними їм частками також називають статистичним розподілом вибірки (див.таблицю):
Згрупований розподіл частки та накопиченої частки середньомісячної зарплати співробітників фірми | |||||
інтервали платні | частоти | частки | платня | накопичені частоти | накопичені частки |
280-290 | 0,01 | <290 | 0,01 | ||
290-300 | 0,1 | <300 | 0,11 | ||
300-310 | 0,14 | <310 | 0,25 | ||
310-320 | 0,14 | <320 | 0,39 | ||
320-330 | 0,25 | <330 | 0,64 | ||
330-340 | 0,16 | <340 | 0,80 | ||
340-350 | 0,07 | <350 | 0,87 | ||
350-360 | 0,04 | <360 | 0,91 | ||
360-370 | 0,07 | <370 | 0,98 | ||
370-380 | 0,00 | <380 | 0,98 | ||
380-390 | 0,02 | <390 | |||
сума |
Розподіл накопиченої частки дозволяє відповісти на питання: “Яка частка варіант, що менші, наприклад, 350?” Із таблиці знаходимо: частка цих варіант становить 0,87.
ЗГРУПОВАНИЙ РОЗПОДІЛ ЩІЛЬНОСТЕЙ ЧАСТОТИ ТА ЧАСТКИ.
Якщо поділити всі частоти на ширину інтервалу, то отримаємо розподіл щільності частотивибірки:
.
Відзначимо, що поняття щільностей мають глибокий імовірністний смисл.
Уведемо до попередньої таблиці стовпці щільностей частот та часток:
інтервали платні | часто-ти | частки | щіль-ність часто-ти | щіль-ність частки | платня | накопичені частоти | накопичені частки |
280-290 | 0,01 | 0,1 | 0,001 | <290 | 0,01 | ||
290-300 | 0,1 | 1,0 | 0,010 | <300 | 0,11 | ||
300-310 | 0,14 | 1,4 | 0,014 | <310 | 0,25 | ||
310-320 | 0,14 | 1,4 | 0,014 | <320 | 0,39 | ||
320-330 | 0,25 | 2,5 | 0,025 | <330 | 0,64 | ||
330-340 | 0,16 | 1,6 | 0,016 | <340 | 0,80 | ||
340-350 | 0,07 | 0,7 | 0,007 | <350 | 0,87 | ||
350-360 | 0,04 | 0,4 | 0,004 | <360 | 0,91 | ||
360-370 | 0,07 | 0,7 | 0,007 | <370 | 0,98 | ||
370-380 | 0,00 | 0,0 | 0,000 | <380 | 0,98 | ||
380-390 | 0,02 | 0,2 | 0,002 | <390 | |||
сума |
ЗАГАЛЬНА СХЕМА ПОБУДОВИ ЗГРУПОВАНОГО РОЗПОДІЛУ ЧАСТОТ.
1. Визначити найбільше та найменше значення варіанти і визначити варіаційний розмах .
2. Задатися певним числом класів , яке рекомендується брати непарним, при об’ємах вибірки доцільно , а при менших об’ємах вибірки можна .
3. Визначити ширину класів . Для спрощення розрахунків, отримане значення ширини класів слід округлити до найближчого цілого.
4. Встановити границі класів і підрахувати кількість варіант у кожному класі.
5. Визначити частоту для кожного класу і записати ряд розподілу.
ЕМПІРИЧНА ФУНКЦІЯ РОЗПОДІЛУ.
Нехай є статистичний розподіл частот деякої ознаки .
Означення. Емпіричною функцією розподілу (або функцією розподілу вибірки)називають функцію , яка визначає для кожного дійсного значення частість події , тобто:
,
де - кількість (частота) варіант, які менші від , а - об’єм вибірки.
Зауваження. Інтегральну функцію розподілу генеральної сукупності в математичній статистиці називають теоретичною функцією розподілу. Вона відрізняється від емпіричної функції розподілу тим, що визначає імовірність події , а не її частість. Із теореми Бернуллі випливає, що частість події прямує до імовірності цієї події. Тому доцільно використовувати емпіричну (вибіркову) функцію розподілу для представлення теоретичної фунції розподілу генеральної сукупності.
Між емпіричною функцією розподілу і функцією накопичених частот на кожному класі інтервалів існує простий зв’язок:
.
ГРАФІЧНЕ ЗОБРАЖЕННЯ СТАТИСТИЧНИХ РОЗПОДІЛІВ.
Полігоном частотназивають ламану, відрізки якої з’єднують точки .
Полігоном часток (частостей або відносних частот)називають ламану, відрізки якої з’єднують точки .
Полігон часток є аналогом полігону розподілу імовірностей.
Ці полігони слугують для графічного зображення дискретних варіаційних рядів. А для зображення інтервальних варіаційних рядів використовують гістограми.
Гістограмою частотназивають ступінчасту фігуру, що складається з прямокутників, основами яких є частинні інтервали варіант довжиною , а висоти дорівнюють (щільність частоти). Площа гістограми частот дорівнює об’єму вибірки.
Гістограмою часток (частостей або відносних частот)називають ступінчасту фігуру, що складається з прямокутників, основами яких є частинні інтервали варіант довжиною , а висоти дорівнюють (щільність частки). Площа гістограми частки дорівнює 1. Гістограма частки є аналогом розподілу щільності імовірностей для генеральної сукупності.
Полігони накопиченої частки (або накопиченої частоти)в статистиці називають огівою або кумулятивною кривою.
Графіки статистичних розподілів для розглянутого прикладу побудовані на окремих листах засобами Excel (див. додатки ).
ОСНОВНІ ВИМОГИ ДО СТАТИСТИЧНИХ ОЦІНОК ПАРАМЕТРІВ РОЗПОДІЛУ.
У багатьох випадках потрібно дослідити кількісну ознаку генеральної сукупності, використовуючи результати вибірки. Часто для цього достатньо знати наближені значення математичного сподівання , дисперсії , середньоквадратичного відхилення , початкові або центральні моменти. Іноді з деяких міркувань вдається встановити закон розподілу . Тоді треба вміти оцінювати параметри цього закону розподілу.
Означення. Статистичною (точковою) оцінкоюневідомого параметра випадкової величини генеральної сукупності (теоретичного розподілу ) називають функцію від випадкових величин (результатів вибірки), що спостерігаються.
Нехай є статистична оцінка невідомого параметра теоретичного розподілу. Припустимо, що за вибіркою об’єму знайдена оцінка . При інших вибірках того ж об’єму одержимо деякі інші оцінки . Саме оцінку можна розглядати як випадкову величину, а числа як її можливі значення. Точкова статистична оцінка повинна задовольняти певним умовам, які сформулюємо у вигляді означень.
Означення. Статистичну оцінку параметра називають незсунутою, якщо . Оцінку називають зсунутою, якщо ця рівність не виконується.
Означення. Статистичну оцінку параметра називають ефективною, якщо вона при заданому об’ємі вибірки має найменшу можливу дисперсію.
Означення. Статистичну оцінку параметра називають обгрунтованою (значимою, показною, репрезентативною), якщо вона при прямує за імовірністю до оцінюваного параметра.
Відмітимо, що якщо дисперсія незсунутої оцінки при прямує до нуля, то оцінка буде і обгрунтованою.
ЧИСЛОВІ ХАРАКТЕРИСТИКИ ВИБІРКИ.
Окрім табличних та графічних методів представлення даних широко застосовуються їх числові характеристики. Найбільш важливі із них: середнє значення, дисперсія, середнє квадратичне відхилення (стандартне відхилення). Ці характеристики називають генеральними, якщо вони обчислені за даними генеральної сукупності, та вибірковими, якщо вони обчислені за даними вибірки.
Числові характеристики, обчислені по вибірці або ті, що використовуються для опису даних вибірки, часто називають статистиками.
Числові характеристики, обчислені по генеральній сукупності або ті, що використовуються для опису даних генеральної сукупності, часто називають параметрами.
По аналогії із математичним сподіванням, дисперсією та середнім квадратичним відхиленням ДВВ обчислюються вибіркові характеристики (статистики), замінюючи при цьому відповідні імовірності частостями , що відповідають варіантам (якщо неперервна ознака задана інтервальним варіаційним рядом, то проводять його “дискретизацію”, замінюючи кожний інтервал його середнім значенням).
Означення. Вибірковою середньою або вибірковою зваженою середньоарифметичною називають середню арифметичну варіант вибірки із урахуванням їх частостей і позначають
,
де - об’єм вибірки, - кількість різних варіант, - частоти варіант (). Аналогічно визначається генеральна середня або генеральна зважена середньоарифметична із заміною об’єму вибірки на - об’єм генеральної сукупності і позначається .
Вибіркова середня є аналогом математичного сподівання і використовується дуже часто. Вона може приймати різні числові значення при різних вибірках однакового об’єму. Тому можна розглядати розподіли вибіркової середньої та числові характеристики цього розподілу. Неважко довести, що:
Теорема. Вибіркова середня є незсунутою, ефективною та обгрунтованою точковою оцінкою для генеральної середньої. Іншими словами, вибіркова середня є статистикою, яка задовольняє всі умови точкового оцінювання, для параметра – генеральної середньої кількісної ознаки.
Доведення.
Зауваження. Крім вибіркової середньої (середньозваженої) в статистиці застосовуються і інші середні, зокрема:
проста середньоарифметична;
степеневі середні (середньоквадратична, середня гармонічна, середня геометрична тощо);
структурні середні, які не залежать від значень варіант, що розташовані на краях розподілу, зокрема, мода (значення варіанти, яка має найбільшу частоту) та медіана (значення, яке “ділить розподіл навпіл”) та інші.
Означення. Вибірковою дисперсієюназивають середню (зважену) квадратів відхилення варіант від вибіркової середньої:
.
Зауважимо, що для спрощення обчислення вибіркової дисперсії можна застосовувати формулу: .
Означення. Вибірковим середньоквадратичним відхиленням (стандартом)називають квадратний корінь із вибіркової дисперсії .
Можна показати,що:
Вибіркова дисперсія є ефективною, обгрунтованою, але ЗСУНУТОЮ точковою оцінкою для генеральної дисперсії .
Зауваження. Вибіркова дисперсія дає занижені оцінки для генеральної дисперсії, але . Тому вибіркову дисперсію виправляють так, щоб вона стала незсунутою оцінкою. А саме, вводять так звану виправлену вибіркову дисперсію
.
Тоді виправленим стандартом вибіркибуде .
Очевидно, що при достатньо великих об’ємах вибірки ( ) вибіркова дисперсія та виправлена вибіркова дисперсія різняться дуже мало, тому в практичних задачах виправлені вибіркові дисперсію та стандарт використовують лише при об’ємах вибірок .
Окрім вищевказаних числових характеристик, використовують статистичні початкові та центральні моменти інших порядків, зокрема, коефіцієнт асиметрії , який характеризує “зкошеність” розподілу відносно його центра та коефіцієнт ексцеса , який характеризує “крутизну” розподілу.
Зауважимо, що для обчислення статистик вибірки часто користуються так званим методом добутків (методом моментів або умовних варіант).
У випадку оцінювання параметрів якісної ознаки , а саме генеральної частки (частості) за допомогою вибіркової частки , використовується наступна
Теорема. Вибіркова частка є незсунутою, ефективною та обгрунтованою точковою оцінкою для генеральної частки . Іншими словами, вибіркова частість є статистикою, яка задовольняє всі умови точкового оцінювання, для параметра – генеральної частості якісної ознаки.
ІНТЕРВАЛЬНІ ОЦІНКИ.
Точкові оцінки параметрів розподілу є випадковими величинами, їх можна вважати первинними результатами обробки вибірки, оскільки невідомо, з якою точністю кожна з них оцінює відповідну числову характеристику генеральної сукупності. Якщо об’єм вибірки досить великий, то точкові оцінки задовольняють практичні потреби точності. Якщо ж об’єм вибірки малий, то точкові оцінки можуть давати значні похибки, тому питання точності оцінювання у цьому випадку дуже важливе і необхідно використовувати інтервальні оцінки.
Означення. Інтервальноюназивають оцінку, яка визначається двома числами – кінцями інтервалу.
Інтервальні оцінки дозволяють встановити точність та надійність оцінок.
Нехай знайдена за даними вибірки статистична оцінка є точковою оцінкою невідомого параметра . Очевидно, що тим точніше визначає , чим меншим є модуль різниці . Іншими словами, якщо , тоді меншому відповідатиме більш точна оцінка. Тому число називають граничною похибкою вибірки і воно характеризує точність оцінки.
Але статистичні методи не дозволяють категорично стверджувати, що оцінка задовольняє нерівність . Таке твердження можна зробити лише із певною імовірністю.
Означення. Надійністю (довірчою імовірністю)оцінки параметра називають імовірність
,
яку можна записати у вигляді . З цієї рівності випливає, що інтервал містить невідомий параметр генеральної сукупності (часто кажуть, що інтервал покриває невідомий параметр).
Означення. Інтервал називають довірчим, якщо він покриває невідомий параметр із заданою надійністю .
Зауважимо, що кінці довірчого інтервалу є випадковими величинами.
За допомогою теорем закону великих чисел з уточненням Ляпунова (Чебишова для кількісної ознаки та Бернуллі для якісної ознаки) доводиться наступне твердження (класичні інтервальні оцінки або формули довірчої імовірності):
Теорема.Імовірність того, що модуль відхилення вібіркової середньої (або частки) від генеральної середньої (або частки) не перевищить число дорівнює:
(або ),
де - інтегральна функція Лапласа, , а - середньоквадратична похибка (стандарт) вибірки, яка може бути знайдена за наступними формулами:
а) при оцінюванні середньої кількісної ознаки:
у випадку повторної вибірки,
у випадку безповторної вибірки;
б) при оцінюванні частки якісної ознаки
у випадку повторної вибірки,
у випадку безповторної вибірки.
Зауваження. При визначенні середньоквадратичної похибки вибірки для частки якісної ознаки буває, що невідомі ні генеральна частка , ні її точкова оцінка – вибіркова частка . Тоді добуток покладають рівним максимальному можливому значенню - .
Наслідок. При заданій надійності (довірчій імовірності) гранична похибка вибірки дорівнює -кратній величині стандарту, тобто
.
Наслідок. Довірчі інтервали (інтервальні оцінки) для генеральної середньої та генеральної частки визначаються формулами:
та .
Із класичних оцінок, в яких точність оцінки визначається граничною похибкою , можна зробити наступні висновки:
1) при зростанні об’єму вибірки гранична похибка зменшується, тому точність оцінки збільшується (оскільки звужується довірчий інтервал);
2) збільшення надійності оцінки призводить до зростання (оскільки - зростаюча функція), а внаслідок цього, і до збільшення . Іншими словами: збільшення надійності класичної оцінки призводить до зменшення її точності;
3) аналіз формул для обчислення середньоквадратичної похибки вибірки дозволяє при об’ємах генеральної сукупності , або у випадках, коли (об’єм генеральної сукупності набагато більший об’єма вибірки), застосовувати більш прості формули повторної вибірки.
ТРИ ТИПИ ЗАДАЧ ВИБІРКОВОГО МЕТОДА.
1) Для заданих об’ємові вибірки та довірчому інтервалі знайти надійність оцінки (дано: і ; визначається ).
2) При заданих об’ємові вибірки та надійності оцінки знайти довірчий інтервал (дано: і ; визначається та або ).
3) При заданих надійності оцінки та довірчому інтервалі знайти необхідний об’єм вибірки ( дано: і ; знаходиться ).
Приклад 8.1. За умовами результатів вибірки зарплати 100 співробітників фірми із її 1000 робітників визначити: а) імовірність того, що середня платня всіх робітників фірми відрізняється від середньої вибіркової платні не більше ніж на 5грн. в ту чи іншу сторону; б) границі, в яких з надійністю 0,9545 знаходиться середня платня всіх робітників фірми; в) об’єм вибірки, при якому з надійністю 0,9973 модуль відхилення середньої платні усіх робітників від вибіркової середньої платні не перевищить 5грн. Розглянути випадки повторної та безповторної вибірки.
Розв’язування. Дано: ознака - платня (кількісна ознака).
Генеральна сукупність:
- кількість усіх робітників фірми (об’єь генеральної сукупності);
- середня платня усіх робітників (генеральна середня, яка оцінюється).
Вибірка:
<– Конец работы –
Эта тема принадлежит разделу:
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ... ОДЕСЬКИЙ ДЕРЖАВНИЙ ЕКОНОМІЧНИЙ УНІВЕРСИТЕТ... В М МАЦКУЛ...
Если Вам нужно дополнительный материал на эту тему, или Вы не нашли то, что искали, рекомендуем воспользоваться поиском по нашей базе работ: ТЕМА №8
Если этот материал оказался полезным ля Вас, Вы можете сохранить его на свою страничку в социальных сетях:
Твитнуть |
Новости и инфо для студентов