SocioDone

Социология: современные тенденции

Оценка доли признака
Страница 1

Для точечной оценки доли признака в генеральной совокупности (р) естественно взять выборочную долю

р*=

где n — объем выборки,

т — количество единиц в выборке, обладающих данным признаком.

Можно доказать, что эта оценка является состоятельной, несмещенной, эффективной.

Вопрос об интервальной оценке рассмотрим сначала для случая возвратной выборки.

При такой организации выборки случайная величина p*, как известно из теории вероятностей, имеет биномиальный закон распределения. Расчет доверительного интервала с применением формулы биномиального закона связан с определенными вычислительными трудностями. Однако при достаточно большом объеме выборки (примерно n ≥ 20, пр ≥ 10) биномиальное распределение хорошо аппроксимируется нормальным распределением с параметрами

М (p*) = p;

σ(p*) =

Следовательно, случайная величина имеет стандартное нормальное распределение (с параметрами M(z)=0; σ(z)=1).

Задавшись определенной вероятностью Р=1— α, имеем:

2Ф

(zα)=1- α (1.9.7)

где Ф

(zα)= — интегральная функция Лапласа, значения которой для различных значений z рассчитаны и приводятся в специальных таблицах.

Равенство (1.9.7) эквивалентно равенству:

P {│p*- p │<z1 · σ( p*)} = 2Ф

(zα) (1.9.7')

Таким образом, предельная ошибка выборки εα определяется из равенства:

(1.9.8)

Применение этой формулы затрудняется тем, что в нее входит неизвестный параметр р — генеральная доля. Однако при большом п можно заменить неизвестный параметр р его точечной оценкой р*. Тогда получим:

(1.9.9)

Приведенные выше формулы связывают между собой, в конечном счете, три величины: доверительную вероятность Р=1−α, предельную ошибку выборки ε и объем выборки п.

В каждой конкретной задаче две из этих величин задаются и определяется третья величина. Таким образом, мы имеем следующие три типа задач:

I. Даны п и Р, определить ε.

II. Даны п и ε, определить Р.

III. Даны Р и ε, определить п

Первые два типа задач связаны с анализом результатов уже произведенной выборки объема п, следовательно, и с найденной точечной оценкой р*.

Задачи третьего типа должны решаться до проведения выборки. По заданной доверительной вероятности P мы можем определить величину z (по таблице интегральной функции Лапласа). Из (1.9.9) получаем:

(1.9.10)

Но в (1.9.10) входит величина р*, получаемая в результате выборки, а речь идет об определении п до осуществления выборки.

Поскольку р* неизвестно, то определяем из этого равенства, при каком значении р* величина п будет максимальной. Используя обычный метод следования функции на максимум, получаем:

откуда р*=½

Следовательно,

(1.9.11)

Выборка такого объема наверняка обеспечит заданные надежность и точность.

Рассмотрим примеры на каждый из трех типов задач. Исследуется вопрос о доле поврежденных клубней картофеля после механической уборки.

Страницы: 1 2


Другие материалы:

Сравнительная характеристика. Цель и задачи исследования
Цель: изучение отношения студенческой молодежи к лицам с ограниченными возможностями. Задачи: 1) Выявить, как студенты относятся к лицам с ограниченными возможностями. 2) Выявить, как лица с ограниченными возможностями относятся к обще ...

Арттерапия как средство коррекции девиантного поведения подростков из неблагополучных семей. Понятие, функции и виды арттерапии
Арт-технология – это метод профилактики, реабилитации, коррекции, досуга, социализации и развития личности посредствам художественного творчества. Он привлекает к себе в последнее время всё большее внимание во всём мире. Арт-технология ис ...

Социальные группы. Типология социальных групп
В процессе обмена - взаимодействия происходит оформление социальных отношений и формирование социальных групп. Социальная группа — коллектив или множество индивидов, ограниченных неформальными либо формальными критериями членства. Социал ...