Роздрукувати сторінку
Главная \ Методичні вказівки \ Методичні вказівки \ 4987 Выборка как основа репрезентативности, Социологическое исследование, Социология

Выборка как основа репрезентативности, Социологическое исследование, Социология

« Назад

Выборка как основа репрезентативности

Понятие репрезентативности

Познакомимся с тремя понятиями, которые необходимо знать любому, кто так или иначе соприкасается с социологическими исследованиями: генеральная совокупность, выборочная совокупность (выборка), репрезентативность.

Генеральная совокупность – это все единицы определенного программой объекта исследования. Если мы говорим о всероссийском опросе общественного мнения, это будет все взрослое население России. Или все московские студенты, если мы возьмемся провести среди них опрос. Или все беспризорные дети Калуги, если мы собираемся предпринять социсследование на эту тему.

Выборочная совокупность (выборка) – это часть генеральной совокупности, которую мы будет непосредственно исследовать, то есть это те люди, к которым мы обратимся с вопросами интервью или с анкетами; те материалы, которые мы будет изучать методом контент-анализа и т. п.

Иногда выборка равна генеральной совокупности (например, в случае, когда мы опрашиваем всех студентов первого курса факультета журналистики МГУ). Но обычно она меньше, иногда в несколько десятков и сотен раз. При этом практика социологических исследований доказала, что в общенациональных исследованиях достаточно выбрать для опросов 1,5–2 тысячи человек. Если выборка хорошо, правильно, репрезентативно сформирована, то она может дать объективную информацию о мнении всех россиян.

Итак, главное – это правильно сформировать выборку. Объем выборки зависит от целей исследования, специфики и степени однородности объекта исследования, дробности групп, которые предстоит изучить, и планируемой степени ее репрезентативности. Что же означает это магическое и самое важное в эмпирической социологии понятие – «репрезентативность»?

Репрезентативность – это соответствие, адекватность выборочной совокупности (выборки) по основным характеристикам генеральной совокупности. Если в структуре населения 55 % женщин и 45 %; мужчин, то и в выборке должно быть такое же соотношение. То же самое можно сказать о возрасте, профессии, типе поселения и т. п. Короче, конфигурация выборки должна совпадать с конфигурацией генеральной совокупности. Это можно изобразить на таком рисунке (рис. 8). 

Самое главное в социологическом исследовании – репрезентативность выборки, потому что именно с этим связана точность и объективность полученных результатов.

Выборка может формироваться разными путями. Но основных типов два репрезентативные и нерепрезентативные выборки.

Репрезентативные выборки

Вероятностная, или случайная, выборка строится на том, что любой из объектов генеральной совокупности имеет равную вероятность попасть в выборочную совокупность. Есть несколько подвидов вероятностной выборки.

1. Систематический отбор. Он весьма популярен и часто применяется в социсследованиях. Это значит, что в зависимости от величины выборки отбирается из генеральной совокупности каждый n-ый (6, 20, 45 и т. п.) объект. Например, мы опрашиваем взрослое население одного из избирательных участков. Берем избирательные списки. Предположим, в них будет 10 000 человек. А нам нужна выборка в 500 человек. Делим число 10 000 генеральной совокупности на число 500 выборки, получаем 20. Значит, из списков будем выбирать каждого двадцатого избирателя.

Предположим, что нам нужно опросить по телефону москвичей и выяснить у них, какую в данный момент они смотрят передачу по телевизору. Берем справочную телефонную книгу, считаем, сколько в ней номеров, делим это количество на то число, которое нам надо опросить, и получаем шаг, при котором мы будет вести систематический отбор номеров.

То же самое можно делать с домами на улицах, если мы будем опрашивать наших реципиентов дома. Например, на четной стороне улицы заходим в каждый пятый дом. И так далее.

2. Отбор по принципу лотереи или жребия. Этот способ вам хорошо знаком, когда вы бросаете в шапку, вазу, ящик, например, все улицы Москвы и выбираете 20, на которых будете проводить исследование. Так же могут быть выбраны регионы, населенные пункты, почтовые отделения и т. п.

3. Отбор методом случайных чисел. Для этого составляются специальные математические таблицы случайных чисел по количеству выборочной совокупности и выбирается объект, который промаркирован предварительно этой цифрой.

Квотная выборка формируется в соответствии с квотами (то есть объектами, имеющими определенный признак по полу, возрасту, месту жительства и т. п.), которые в процентном отношении соответствуют генеральной совокупности. Предположим, что мы исследуем население небольшого города и знаем, какое в нем процентное соотношение молодых, людей средних лет и пожилых, мужчин и женщин, работающих и пенсионеров. Мы должны отобрать для опроса людей с этими характеристиками в таком же процентном соотношении. Эта выборка по степени репрезентативности близка к вероятностной.

Разновидностью квотной можно считать маршрутную выборку, используемую обычно при выборе мест опроса, когда интервьюеру задаются определенные маршруты для работы.

Стратифицированная выборка отличается от квотной тем, что искусственно, в связи с целями исследования, формируются слои, страты, которые подлежат изучению и, как правило, в количественном отношении они равны. Страты должны быть более однородными, чем вся совокупность. Например, мы изучаем читателей разных изданий: «АиФ», «Известий», «Труда», «Комсомольской правды», «МК» и формируем равные страты читателей разных изданий, предположим, по 200 человек.

Районированная выборка обычно используется при исследовании районов, часто с применением географической карты, схемы населенных пунктов и т. п., из которых выбираются определенные единицы для исследования. Например, выбираются области из разных географических зон России, или округа Москвы. Иногда применяется так называемая методика географического креста, когда выбираются точки на горизонтали и вертикали этого географического креста. Так формировалась выборка в исследованиях общественного мнения в 60-е годы в Институте общественного мнения при «Комсомольской правде».

Серийная, гнездовая, кластерная выборка работает не с единицами, а с гнездами, однородными группами (семья, производственная бригада, студенческая группа, болельщики футбольного матча, телезрители, которые смотрят ТВ в одной комнате, городские районы и т. п.). Обычно в таком случае проводится сплошной опрос.

Нерепрезентативные выборки

Они, как правило, относятся к целевым и используются при глубоком исследовании отдельных объектов в так называемых качественных исследованиях. Этот тип выборок наиболее близок к журналистским способам отбора объектов для публикации. Опишем виды нерепрезентативных выборок.

Стихийная выборка, не претендующая на репрезентативность, – это выборка «первого встречного на улице». Таким правилом часто пользуются журналисты, когда опрашивают несколько человек на улице и выясняют их мнение по какой-то злободневной проблеме. Стихийны все выборки в интерактивных опросах на телевидении, прессовые опросы, опросы в Интернете. Конечно, результаты таких исследований никак не могут считаться репрезентативными и точными, но дают некоторую информацию или конкретные аргументы для демонстрации такой-то позиции. Они могут быть использованы как разведочные исследования. Стихийная выборка в таких случаях формируется самими опрошенными и, как правило, это обычно бывают люди, наиболее заинтересованные в теме исследования, а также имеющие время ответить на предлагаемые вопросы.

Типологической выборка называется тогда, когда выделяются типические объекты и проводится глубокое их изучение. С такой выборкой часто имеют дело журналисты, когда пишут, например, о типичном колледже с эстетическим направлением, типичном предпринимателе, имеющем небольшое дело и т. п. Вообще, журналисту, выбирающему объект, при всех вариантах полезно думать о том, насколько этот объект представляет (репрезентирует) аналогичные типы объектов.

Выборка максимальной вариации, при которой исследуются объекты, обеспечивающие максимальное разнообразие информации, которая позволит изучить проблемы с разных сторон. Например, при изучении беспризорничества мы будем выбирать для журналистского материала детей из разных семей, с разной судьбой, разного возраста и образования.

Выборка однородных (гомогенных) объектов, при которой, наоборот, в фокус исследования попадают люди с однородными признаками, и ставится цель как можно более глубоко изучить их ориентации или другие характеристики. Например, фокус-группа студенческой молодежи, зрителей канала СТС.

Цепная выборка по типу «снежного кома» обычно используется в экспертных опросах, при исследовании респондентов, которых нелегко найти. В таком случае опрашиваемых просят назвать имена, адреса, места пребывания тех, кто мог бы еще участвовать в данном исследовании. Обычно поиск завершают в том случае, когда респонденты начинают повторяться и не приносят уже новой информации. Этот тип выборки тоже полезно знать журналисту, потому что ему часто приходится по этому методу разыскивать компетентных или причастных к изучаемой проблеме людей, чтобы всесторонне изучить ситуацию. 

Но на самом деле в настоящем репрезентативном исследовании выборка обычно бывает не одноступенчатая и многоступенчатая, особенно если это касается широких общероссийских исследований. В таком случае сначала отбираются для исследования регионы, затем населенные пункты, потом места поиска респондентов, наконец, сами респонденты.

Классической пятиступенчатой была выборка в исследовании аудитории «Литературной газеты». Объектом исследования, напомню, была всесоюзная городская аудитория, поскольку газеты в основном выписывали жители городов. В расчет выборки включался очень важный для аудиторных исследований показатель плотности подписки на «ЛГ» по регионам.

1 ступень. Выбор регионов. Было сформировано три группы территорий по уровням плотности подписки: высокий, средний и низкий, которые, в свою очередь, делились на три подгруппы с уровнями высоким, средним и низким. В результате было сформировано девять типологических подгрупп. Естественно, что в каждой из подгрупп оказалось по несколько регионов, которые потом типологизировались еще с учетом экономических и административных показателей. Затем в подгруппе регионы выбирались путем жеребьевки, то есть случайного, вероятностного выбора. Например, в группе с высоким уровнем плотности подписки наибольшим числом административных единиц были представлены Северо-Западный, Волго-Вятский и Поволжский, Уральский и Западно-Сибирский, Восточно-Сибирский и Дальневосточный экономические районы. Например, из числа единиц Северо-Западного экономического района, входящих в подгруппу со средним уровнем, жребием была выбрана Мурманская область, из подгруппы с низким уровнем из состава Восточно-Сибирского и Дальневосточного экономических районов выбран Приморский край и т.д.

Общее число планируемой выборки 2 000 человек было распределено пропорционально общей численности подписчиков, попавших в выборку, например, в Московской области нужно было опросить 1 351 человека, а в Калмыцкой АССР – всего 4 человека.

2 ступень. Выбор представителей районов

Решено было проводить исследования в разных типах городских поселений – в административных центрах территорий и одном из городов областного и районного подчинения. Этот второй город был выбран путем деления всех городов данного региона на два, то есть n : 2, таким образом попадался средний в списке город. Итак, в 19 районах исследование проводилось в 36 городах. Например, в Узбекской ССР, где я была руководителем исследования, в выборку попали Ташкент – столица республики – и Бекабад.

3 ступень. Определение численности внутри выбранных районов

Объем выборки между административным центром и вторым городом был распределен пропорционально объему подписки в данных городах. Он проводился на месте.

4 ступень. Выбор мест наблюдения в городах

Приехав в город, где предстояло проводить опрос, нужно было выбрать количество доставочных почтовых отделений, исходя из того, что на каждом опрашивалось 25 человек. Таким образом, в Москве было выбрано каждое 55 отделение связи. Если в городах нужно было опросить 50 и более человек, выбиралось жребием три доставочных отделения.

5 ступень. Выбор подписчиков для опроса

В почтовых отделениях, тоже методом жребия, в зависимости от количества опрашиваемых выбирались доставочные участки. А внутри участка опрашивались все подряд. На тот случай, если по адресу не окажется подписчиков и читателей «ЛГ», формировался запас (25–30 %). Для формирования запаса существует тоже особая методика.

Еще один пример. Предположим, что изучается отношение студенчества Москвы к телепередачам. Как формируем выборку? Мы должны в программе исследования определить свой объект. Например, это будут студенты разных типов вузов: государственных и коммерческих, гуманитарных, технических и естественных. Предположим, что нам важно знать мнение студентов разных курсов. Выборка будет зависеть от того, какое количество групп нам важно изучить. Если число групп будет очень большим (например, нас будут интересовать многопрофильные университеты, институты по разным направлениям: экономические, филологические, литературные, институты культуры, искусства, машиностроительные, текстильные и т. п.), тогда и выборка должна включать группы всех этих типов.

Допустим, таких групп наберется 20. Минимальное количество людей, которых можно считать социологической группой – не менее 25 человек. Следовательно, 20 х 25 = 500 человек.

Если нас будут интересовать не только профили вузов, но разные внутривузовские специализации, разные формы обучения (дневная, вечерняя, заочная), разных уровней обучения (бакалавр, специалист, магистр) и разных курсов, то, естественно, количество групп увеличивается, и выборка – тоже.

В данном случае выборка может быть стратифицированной, то есть во всех типах вузов мы опрашиваем по определенному количеству студентов. Если же мы распределяем выборку в зависимости от реального количества студентов в разных вузах (тогда она будет репрезентативной), то, возможно, число выборки придется увеличить, чтобы в «малонаселенных» вузах, например в художественных, набрать необходимую группу для анализа.

Но, прежде всего, нужно выбрать (путем жребия или систематического отбора) сами вузы. А потом в вузах нужно опять путем жребия или типологического отбора выбрать факультеты, затем на факультетах опросить студентов разных курсов, используя при этом систематический отбор по списочному составу внутри каждого курса.

Вы убедились, что формирование и реализация выборки – это сложное и трудоемкое дело, особенно если речь идет о репрезентативных исследованиях. Поэтому самодеятельно в таких случаях составлять выборку нецелесообразно – этим должны заниматься профессионалы. Но тогда зачем здесь так подробно рассказывается о выборке? Чтобы вы поняли, что это основа социологического исследования. Даже если у вас будет хорошая программа и прекрасные методики, вы можете потратить напрасно время и деньги, но не получить объективных данных, потому что выборка будет сделана неправильно. Знание способов формирования выборки пригодится вам и для того, чтобы профессионально сформулировать заказ социологическим службам, суметь оценить качество их работы.

Но, конечно, знания о типах выборки и способах ее формирования нужны работникам редакций и для того, чтобы провести своими силами конкретное локальное исследование. В этом случае исследование может не претендовать на репрезентативность, но даст кое-какую информацию, например необходимую вам для материала. Если вы пишете про беспризорных, а работаете в одной из региональных газет, то ваша выборка может быть сформирована случайным путем – вы поговорите с теми подростками (можно точно определить границы их возраста, например от 13 до 15 лет), которых встретите на улицах, на вокзалах, на рынках. Но в таком случае вы не будете писать в своей публикации, что это мнение беспризорников города, а назовете количество опрошенных вами подростков и скажете о том, где вы их нашли.

Если вы хотите провести более строгое исследования, нужно обратиться в социальные органы, где есть статистика и адреса таких подростков и тогда постараетесь сделать более репрезентативную выборку. Если для журналистского опроса вы можете ограничиться 20–25 человеками, то для серьезного репрезентативного исследования вам понадобится большее число опрашиваемых. Но это будет зависеть от того, какие группы вы хотите изучать. Если, например, вас интересуют разные возрастные группы (дети до 7 лет, 8–10, 11–13, 14–16 лет), вы должны набрать в каждой группе по 25–30 человек, следовательно, выборка должна быть не менее 100 человек. Если вы еще хотите посмотреть, кто они по полу, кто их родители и т. п., количество выборки увеличится, потому что увеличится количество групп, которые вы хотите исследовать. Хотя при этом надо помнить, что компьютер, посчитав группы по возрасту, снова соберет их в один массив, и разделит по признаку пола, потом и по другим характеристикам.

Общий принцип такой: чем более локально исследование и более однородна группа, тем меньше может быть выборка. Общероссийские выборки обычно строятся на 1,5–2 тысячах опрошенных. При этом оказывается, что увеличение выборки приводит к весьма незначительному уточнению результатов и потому экономически нецелесообразно.

Если же вы решились сами заняться составлением выборки (особенно это касается квотной), то нужно знать процентное соотношение различных групп населения: мужчин и женщин, людей с разным уровнем образования, рода занятий и т. п. Обычно такая статистическая информация есть в статорганах любого региона. На уровне России существуют данные переписи населения, последняя из которых состоялась в 2002 г., или специальные статистические справочники. Соответственно процентному соотношению разных групп в репрезентативном исследовании и следует формировать выборку. Если же вы предпочитаете вероятностную, то нужно обязательно проверить результаты выборки, соотнеся их со статистикой по региону.

Важно не только правильно составить выборку, но и учесть время, когда следует, например, опрашивать население, чтобы застать всю семью в сборе. Если это опрос по месту жительства, нужно правильно рассчитать время опроса. Однажды в Москве по репрезентативной выборке провели опрос населения о проблемах, которые больше всего волнуют москвичей. Но время для опроса выбрали дневное, когда дома были в основном пенсионеры. Естественно, что для них главной проблемой было медицинское обслуживание. Исследователи так и не узнали, какие проблемы реально волнуют москвичей.

С уважением ИЦ "KURSOVIKS"!