Определение выборки

Слово и фраза:

Искать:

Сортировать по:

Форумы на Sostav.ru / Маркетинговые исследования / Определение выборки

Profile

_Danka_^©

Постов: 2
Дата регистрации: 01.12.2010

Добрый вечер!
Пожалуйста, помогите разобраться с расчетами выборки.
Проводится исследование эффективности почтовой рассылки. Речь идет о рынке b2b, но исследуются конечные потребители. ЦА: топ-менеджеры российских компаний. Для теста рекламной брошюры будет использован метод глубинных интервью. А для определения общих критериев оценки, мотивов при принятии решений - телефонный опрос. Вот как раз с определением выборки для последнего и возникли трудности.
Генеральная совокупность -собственная база клиентов, которые являются адресатами почтовой рассылки.
Если принять за определяющий признак - должность, то можно говорить об однородности.. т.е. эта выборка будет простой случайной?
Или же тот факт, что вся совокупность формировалась относительно необходимого признака, уже делает ее неслучайной...и тогда стоит квотировать ее по регионам, размеру бизнеса (крупный, средни, малый).

Я делала расчет по формулам из учебника Голубкова для вероятностных выборок, получилось 1111 респондентов... хотя в онлайн-калькуляторах выдается цифра в 2 раза меньше при вероятности 95%... Вопросы в анкете имеют больше 2-х ответов, имеются открытые вопросы..
Подскажите пожалуйста, какой подход все-таки в данном случае нужен для расчета? Или возможно я изначально неправильно рассуждала, начиная с совокупности.

Комментарий понравился?

09.12.2010 23:45

Profile

F3^©

Постов: 4827
Дата регистрации: 25.08.2004

для: _Danka_©
Если Вас интересует реакция только Ваших клиентов, то - все верно. Но что-то мне подсказывает, что задача стоит не только удержать имеющихся, но и привлечь новых.
С рынками b2b все изначально непросто. Так как сложно обеспечить равную вероятность попадания единиц генсовокупности в выборку. Мало информации. Нет полных списков единиц генсовокупности, доступность ЛПР оставляет желать лучшего.
Вот с этим я не могу согласится категорически: "Если принять за определяющий признак - должность, то можно говорить об однородности.. т.е. эта выборка будет простой случайной?" Сам факт однородности ни как не связан с типом выборки. ) Или Вы хотели сказать, что в Вашем случае МОЖНО применять простую случайную? Так данный факт тоже не является решающим при выборе типа выборки. Хотя и может учитываться. Разброс признака, в первую очередь, определяет размер, но не тип выборки.

Давайте начнем с начала.
Размер генсовокупности?
Какую именно формулу Вы применяли из учебника Голубкова?
Каким онлайн калькулятором пользовались?
Ну, и ответ в конце учебника. Как показывает опыт, в подавляющем большинстве случаев больше 500 респондентов опрашивать смысла нет. :)

--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Комментарий понравился?

10.12.2010 05:22

Profile

_Danka_^©

Постов: 2
Дата регистрации: 01.12.2010

Спасибо за ответ!
В базу данных, которая будет использоваться для исследования и которая будет принята за генеральную совокупность, входят настоящие и потенциальные потребители наших услуг (однако в исследовании мы не будем разделять их, т.к. нам интересно общее мнение топ-менеджеров интересующих нас компаний, получающих почтовые приглашения от нашей компании в течении последнего года). В таком случае ведь можно использовать простую случайную? выборку.

Тогда размер ген.совокупности: 5000
формула расчета (я за ночь нашла более понятную для моего понимания) n= z2pq/e2,
Z в квадрате– нормотклонение (брала данные из таблицы со значениями)
p – найденная вариация для выборки ( ЗДЕСЬ я думала долго, т.к. вариаций может быть очень много, учитывая сочетание открытых и закрытых вопросов. В итоге взяла максимальное возможные 50%)
q – (100 –p);
e – допустимая ошибка

По этой формуле у меня получилось прекрасное число 384,416, что получилось в человеческом выражении 385 респондентов - при 95% вероятности 5% ошибке, а при 3% - 1067
Или при 99% - 679 респондентов при 5% ошибке

Однако опять-таки разнятся с результатами калькуляторов:
http://www.webstarstudio.com/marketing/calc1.html
http://www.businessintegra.ru/kalkuljator-rascheta-vyborki.html

Комментарий понравился?

10.12.2010 11:17

Profile

Stics^©

Постов: 15
Дата регистрации: 26.05.2009

используемая Вами формула - это формуда расчета численности выборки для доли, а в калькулятарах скорее всего используется формула простой случайной выборки количественного признака

Комментарий понравился?

10.12.2010 13:26

Profile

Togda^©

Постов: 30
Дата регистрации: 25.04.2010

Как это не парадоксально прозвучит – «расчёт выборки» - это миф (также как «расчёт репрезентативности»).
Так называемый «расчёт выборки» основан на предположении, что распределение признака (никто не говорит - какого?) в ген. совокупности подчиняется нормальному распределению. И строится расчёт на различных играх вокруг отклонения от средней по некому абстрактному признаку (вот вы брали значения «Z» и «p» - откуда они и почему?). «Калькуляторы» - это просто рекламные ходы – они не имеют отношения к социологии. Это не имеет никакого отношения к вашей ген. совокупности и выборке – это просто мат. статистика, но не социология – логично предположить, что данные должны браться с поля.
К тому же основная часть признаков в социологии (пол, возраст, доход, предпочитаемая марка, частота потребления и проч.) не подчиняется нормальному распределению.
Т.о. в реальности «расчёт выборки» делается методом аналогии, исходя из опыта предшествующих опросов на схожую тему в схожей ген. совокупности. В этом смысле прав F3 – при ген. совокупности 5 000 можно ожидать, что репрезентативной окажется выборка в интервале от 500 до 1200 респондентов – в зависимости от схемы анализа. В схеме анализа исходным является размер выделяемой для анализа минимальной группы – она должна быть не менее 40 респондентов (например: менеджеры – должностной статус - мужчины – со стажем 3-5 лет – регион – отрасль – и т.д.).
Из того, что вы написали - для выборки вам надо использовать несколько шагов: 1)выделение и отбор квот, 2) внутри квот - случайный отбор.

Комментарий понравился?

13.12.2010 12:19

Profile

Алексей Николаев^©

Постов: 21
Дата регистрации: 12.10.2007

Цитата, автор Togda:
Как это не парадоксально прозвучит – «расчёт выборки» - это миф (также как «расчёт репрезентативности»).
Так называемый «расчёт выборки» основан на предположении, что распределение признака (никто не говорит - какого?) в ген. совокупности подчиняется нормальному распределению. И строится расчёт на различных играх вокруг отклонения от средней по некому абстрактному признаку (вот вы брали значения «Z» и «p» - откуда они и почему?). «Калькуляторы» - это просто рекламные ходы – они не имеют отношения к социологии. Это не имеет никакого отношения к вашей ген. совокупности и выборке – это просто мат. статистика, но не социология – логично предположить, что данные должны браться с поля.
К тому же основная часть признаков в социологии (пол, возраст, доход, предпочитаемая марка, частота потребления и проч.) не подчиняется нормальному распределению.
Т.о. в реальности «расчёт выборки» делается методом аналогии, исходя из опыта предшествующих опросов на схожую тему в схожей ген. совокупности. В этом смысле прав F3 – при ген. совокупности 5 000 можно ожидать, что репрезентативной окажется выборка в интервале от 500 до 1200 респондентов – в зависимости от схемы анализа. В схеме анализа исходным является размер выделяемой для анализа минимальной группы – она должна быть не менее 40 респондентов (например: менеджеры – должностной статус - мужчины – со стажем 3-5 лет – регион – отрасль – и т.д.).
Из того, что вы написали - для выборки вам надо использовать несколько шагов: 1)выделение и отбор квот, 2) внутри квот - случайный отбор.

Это вообще тема интересная. Может быть признаком являются физические данные респондента? Вот у меня тут где-то есть одна база от "Левада-центр", где есть пункты "рост" и "вес". Интересно бы посмотреть на досуге относительно их нормального распределения :) А в данном случае для оценки погрешности исходят из требования равной вероятности попадания в выборку. При наличии полного списка генеральной совокупности можно сделать систематическую выборку, размер которой можно определить этими калькуляторами. Не думаю, что в данном случае стоит заморачиваться многофазной выборкой.

Комментарий понравился?

06.01.2011 02:43

Profile

Togda^©

Постов: 30
Дата регистрации: 25.04.2010

Алексей Николаев©

1) Распределения по весу и росту, насколько помню, - правоскошенные, как, например, по доходу.

2) Понятно, что отбор должен быть приближен к случайному. Но это никак не говорит о величине выборки. Повторюсь - калькуляторы исходят из гипотезы нормального распределения некоего мифического признака. Но, например, нам нужно выявить, как потребители распределены по предпочтениям газировки (Кока, Пепси и проч.) - но этот вид распределения даже теоретически не может подчиняться нормальному закону - это номинальная шкала. "Калькулятор" и мат. статистика тут ничего не могут сказать - они же не знают, что происходит "в поле". А если бы мы всё знали заранее - зачем опрос? Смысл репрезентативности - чтобы распределение в выборке соответствовало генеральной совокупности, а это может определяться после опроса, а не до него.

Комментарий понравился?

24.01.2011 16:59

Profile

Stics^©

Постов: 15
Дата регистрации: 26.05.2009

Цитата, автор Togda:
калькуляторы исходят из гипотезы нормального распределения некоего мифического признака.

Калькуляторы как правило исходят из принципа собственно-случайного повторного отбора единицы наблюдения. Не нужно смешивать понятия "распределение признака" и "распределение его выборочной средней (выборочной доли)". Для использования выборочного метода абсолютно все равно как распределен изучаемый признак. А.М. Ляпуновым доказано что распределение выборочных средних (их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально. Распределение признака при этом может быть любым.

Цитата, автор Togda:
Но, например, нам нужно выявить, как потребители распределены по предпочтениям газировки (Кока, Пепси и проч.) - но этот вид распределения даже теоретически не может подчиняться нормальному закону - это номинальная шкала.

В задачи выборочного метода не входит анализ распределения признака. Его задачами являются:
- определение численности выборки, обеспечивающей заданную точность результатов при заданной достоверности
- определение возможного предела ошибки репрезентативности гарантированного с заданной вероятностью
- определение вероятности того, что ошибка выборки не превысит допустимой погрешности
Если изучаются номинальные признаки принимающие больше чем 2 значения, то при расчете численности выборки или ошибки выборки придется просто для расчетов модифицировать кодировку.
Например w11 - доля предпочитающих Коку
w01 - доля предпочитающих остальные газировки

w12 - доля предпочитающих Пепси
w02 - доля предпочитающих остальные газировки

w13 - доля предпочитающих Спрайт
w03 - доля предпочитающих остальные газировки

Комментарий понравился?

27.01.2011 09:18

Profile

Togda^©

Постов: 30
Дата регистрации: 25.04.2010

Цитата, автор Stics:
А.М. Ляпуновым доказано что распределение выборочных средних (их отклонений от генеральной средней) при достаточно большом числе независимых наблюдений приближенно нормально.

Обратите внимание - у номинальной шкалы не бывает среднего значения. Т.е. для определения репрезентативности выборки по номинальному признаку это не пригодно.

Распределение социологических признаков, как правило, не имеет никакого отношения к нормальному распределению и теореме Ляпунова.

Обратите внимание на определение: "Репрезентативность выборки - это её свойство правильно отражать распределение исследуемого признака в генеральной совокупности" - а мат. статистика никак не может определить каково это эмпирическое распределение - иначе не надо было бы проводить опрос.

Комментарий понравился?

04.02.2011 13:38

Постов: 15
Дата регистрации: 26.05.2009

Цитата, автор Togda:
Обратите внимание - у номинальной шкалы не бывает среднего значения. Т.е. для определения репрезентативности выборки по номинальному признаку это не пригодно.

Для номинальной шкалы рассчитывается показатель доли (удельного веса). А для доли альтернативного признака доказана теорема Бернулли (частный случай теоремы Чебышева-Ляпунова)

Цитата, автор Togda:Распределение социологических признаков, как правило, не имеет никакого отношения к нормальному распределению и теореме Ляпунова.

"Распределение признака" это одно, а "распределение его выборочной средней (выборочной доли)" это другое. Выводы теоремы Чебышева-Ляпунова используются для количественных признаков, выводы теоремы Бернулли - для альтернативных признаков (в т.ч. номинальных).

Цитата, автор TogdaОбратите внимание на определение: "Репрезентативность выборки - это её свойство правильно отражать распределение исследуемого признака в генеральной совокупности" - а мат. статистика никак не может определить каково это эмпирическое распределение - иначе не надо было бы проводить опрос.

Реперезентативность обеспечивается принципом случайного отбора выборочной совокупности, а математеическая статистика помогает оценить точность полученных результатов.

Комментарий понравился?

06.02.2011 14:36

Profile

F3^©

Постов: 4827
Дата регистрации: 25.08.2004

--------
Следует отличать неразвитые мысли от тщательно развитых не-мыслей.

Комментарий понравился?

06.02.2011 14:55

В настоящий момент эту тему просматривают: участников - 0, гостей - 60.

Только зарегистрированные пользователи могут оставлять сообщения в этом форуме

Форумы на Sostav.ru / Маркетинговые исследования / Определение выборки

© "ООО Состав.ру" 1998-2026

тел/факс: +7 495 225 1331 адрес: 109004, Москва, Пестовский пер., д. 16, стр. 2

При использовании материалов портала ссылка на Sostav.ru обязательна!
Администрация Sostav.ru просит Вас сообщать о всех замеченных технических неполадках на E-mail