SocioDone

Социология: современные тенденции

Оценка доли признака
Страница 1

Для точечной оценки доли признака в генеральной совокупности (р) естественно взять выборочную долю

р*=

где n — объем выборки,

т — количество единиц в выборке, обладающих данным признаком.

Можно доказать, что эта оценка является состоятельной, несмещенной, эффективной.

Вопрос об интервальной оценке рассмотрим сначала для случая возвратной выборки.

При такой организации выборки случайная величина p*, как известно из теории вероятностей, имеет биномиальный закон распределения. Расчет доверительного интервала с применением формулы биномиального закона связан с определенными вычислительными трудностями. Однако при достаточно большом объеме выборки (примерно n ≥ 20, пр ≥ 10) биномиальное распределение хорошо аппроксимируется нормальным распределением с параметрами

М (p*) = p;

σ(p*) =

Следовательно, случайная величина имеет стандартное нормальное распределение (с параметрами M(z)=0; σ(z)=1).

Задавшись определенной вероятностью Р=1— α, имеем:

2Ф

(zα)=1- α (1.9.7)

где Ф

(zα)= — интегральная функция Лапласа, значения которой для различных значений z рассчитаны и приводятся в специальных таблицах.

Равенство (1.9.7) эквивалентно равенству:

P {│p*- p │<z1 · σ( p*)} = 2Ф

(zα) (1.9.7')

Таким образом, предельная ошибка выборки εα определяется из равенства:

(1.9.8)

Применение этой формулы затрудняется тем, что в нее входит неизвестный параметр р — генеральная доля. Однако при большом п можно заменить неизвестный параметр р его точечной оценкой р*. Тогда получим:

(1.9.9)

Приведенные выше формулы связывают между собой, в конечном счете, три величины: доверительную вероятность Р=1−α, предельную ошибку выборки ε и объем выборки п.

В каждой конкретной задаче две из этих величин задаются и определяется третья величина. Таким образом, мы имеем следующие три типа задач:

I. Даны п и Р, определить ε.

II. Даны п и ε, определить Р.

III. Даны Р и ε, определить п

Первые два типа задач связаны с анализом результатов уже произведенной выборки объема п, следовательно, и с найденной точечной оценкой р*.

Задачи третьего типа должны решаться до проведения выборки. По заданной доверительной вероятности P мы можем определить величину z (по таблице интегральной функции Лапласа). Из (1.9.9) получаем:

(1.9.10)

Но в (1.9.10) входит величина р*, получаемая в результате выборки, а речь идет об определении п до осуществления выборки.

Поскольку р* неизвестно, то определяем из этого равенства, при каком значении р* величина п будет максимальной. Используя обычный метод следования функции на максимум, получаем:

откуда р*=½

Следовательно,

(1.9.11)

Выборка такого объема наверняка обеспечит заданные надежность и точность.

Рассмотрим примеры на каждый из трех типов задач. Исследуется вопрос о доле поврежденных клубней картофеля после механической уборки.

Страницы: 1 2


Другие материалы:

Прогнозы на дальнейшее развитие демографических процессов
Исходя из характера демографических процессов последнего десятилетия, а также демографических предпосылок более ранних лет, можно сделать прогнозную оценку основных тенденций развития демографической ситуации в стране на перспективу. В ос ...

Практикум
Расходы бюджета РФ на социально-культурные мероприятия в 1995-2003 гг. (млрд. руб.; до 1998 г. – трлн. руб.) 1995 1996 1997 1998 1999 2000 2001 2002 2003 ВВП 1428,5 2007,8 2342,5 2629,6 48 ...

Общие выводы и рекомендации
Хотя большинство не изъявило желания посещать различные художественные кружки, по моему мнению, они принесли бы пользу для студентов. Студентам стоит чаще посещать культурные мероприятия, такие как театральные постановки. Так как большинс ...