Показано с 1 по 13 из 13
Тема: Оценить погрешность
-
10.06.2008, 14:25 #1
- Регистрация
- 06.12.2005
- Сообщений
- 236
Оценить погрешность
Уважаемые господа, добрый день!
Подскажите, пожалуйста, какими стат. тестами мне подтвердить валидность выборки, по которой я провожу свое исследования (по социологической тематике). Скажем, я провожу опрос некоторого количества людей (в интернете), получаю результаты. И потом мне хочется эти результаты экстраполировать на все население России. У меня есть количество людей в выборке и все население России. На основании только этого соотношения можно как-нибудь оценить погрешность? Поделитесь опытом и формулами, пожалуйста.
И второй вопрос. Кто-то встречал исследования, посвященные русскоязычной аудитории интернета с точки зрения "соответствия" интернетовской аудитории параметрам "всего русскоязычного населения России"?
Большое спасибо
-
10.06.2008, 19:01 #2
- Регистрация
- 06.12.2005
- Сообщений
- 236
Господа, еще такой вопрос. Попадались ли Вам исследования, в которых содержался бы ответ на вопрос - является ли язык Интернета языком масс? Я провожу исследование на базе текстов, размещенных в Интернете - расчитываю некую функцию. Теперь по-хорошему, мне нужно проверить соответствие выборки (русскоязычных текстов Интернета) всем русскоязычным текстам. На первый взгляд, это нереально, но может быть кто-то уже что-нибудь подобное, похожее проводил?
-
10.06.2008, 21:25 #3
- Регистрация
- 16.05.2006
- Сообщений
- 2,209
Сообщение от yaBB
-
10.06.2008, 21:32 #4
- Регистрация
- 16.05.2006
- Сообщений
- 2,209
Сообщение от yaBB
-
11.06.2008, 15:02 #5
- Регистрация
- 06.12.2005
- Сообщений
- 236
Сообщение от WLMike
Спасибо за идею.
-
11.06.2008, 18:11 #6
- Регистрация
- 16.05.2006
- Сообщений
- 2,209
Средние статистически неразличимы при разумных уровнях значимости. У вас большая дисперсия, несущественное различие и очень мало данных. Навскидку я прикинул, что вам нужно около 10000 испытаний для того, чтобы доказать различие, если оно конечно есть.
-
13.06.2008, 17:58 #7
- Регистрация
- 07.02.2007
- Сообщений
- 19
Ваша задача неразрешима, т.к. выборка не является случайной. У Вас - выборка доступных случаев.
-
03.07.2008, 21:11 #8
- Регистрация
- 06.12.2005
- Сообщений
- 236
Сообщение от WLMike
У вас большая дисперсия, несущественное различие и очень мало данных. Навскидку я прикинул, что вам нужно около 10000 испытаний для того, чтобы доказать различие, если оно конечно есть.
-
03.07.2008, 21:57 #9
- Регистрация
- 12.12.2005
- Сообщений
- 605
Сообщение от yaBB
Скажем, я провожу опрос некоторого количества людей (в интернете), получаю результаты. И потом мне хочется эти результаты экстраполировать на все население России.
И второй вопрос. Кто-то встречал исследования, посвященные русскоязычной аудитории интернета с точки зрения "соответствия" интернетовской аудитории параметрам "всего русскоязычного населения России"?
-
04.07.2008, 01:32 #10
- Регистрация
- 16.05.2006
- Сообщений
- 2,209
Сообщение от yaBB
Сообщение от yaBB
Сообщение от yaBB
-
04.07.2008, 20:16 #11
- Регистрация
- 06.12.2005
- Сообщений
- 236
Сообщение от WLMike
Спасибо большое за ответы, Wlmike!
Сообщение от nchuvakhin
-
04.07.2008, 22:47 #12
- Регистрация
- 16.05.2006
- Сообщений
- 2,209
Сообщение от yaBB
-
05.07.2008, 17:49 #13
- Регистрация
- 09.07.2007
- Сообщений
- 724
yaBB
«Подскажите, пожалуйста, какими стат. тестами мне подтвердить валидность выборки, по которой я провожу свое исследования (по социологической тематике). Скажем, я провожу опрос некоторого количества людей (в интернете), получаю результаты. И потом мне хочется эти результаты экстраполировать на все население России. У меня есть количество людей в выборке и все население России. На основании только этого соотношения можно как-нибудь оценить погрешность? Поделитесь опытом и формулами, пожалуйста.»
Вы задали интересные вопросы.
1.С одной стороны ст.методы для этих целей активно используются и литературы для это есть достаточно много.
Впрочем социология для меня неблизкая тема, но одну близкую книгу укажу – Сидоренко Е. Методы математической обработки в психологии, С.Петербург, Речь, 2000 г.
Там есть ссылки на некоторые другие книги.
2.Но это хорошо для общества, относительно СТАБИЛЬНОГО, где мнения и настроения НЕ ПОДАВЛЕНЫ (или придавлены) и интересы групп населения как-то относительно объективно представлены. А групп населения разных - МНОГО. И интернетовская (рунетовская) группа СОВСЕМ НЕ ПРЕДСТАВЛЯЕТ ОБЩЕРОССИЙСКУЮ, а лишь один из сегментов.
Кроме того, сама интернетовская группа весьма разнородна. Например, в ней присутствует как минимум несколько групп (государственных или приближенных к нему), которые оказывают очень сильное воздействие на Рунет. Подавляют отдельные сайты, форумы, отдельных участников и это делается масштабно по всей стране. Сам наблюдал, как активно подавляли в 2003-2004 гг. форум общероссийской общественной организации малого бизнеса «Опора», -оскорбляли, клеветали, угрожали, срывали обсуждения и т.п.
И в конце концов – открытый форум тогда подавили, а организация постепенно превратилась в союзника действующей власти. Естественно все это отражается и очень существенно на все опросы и голосования, которые происходят в российском рунете.
3.Для анализа в этой ситуации без методов технологий DataMining не обойтись. Обычная статистика, даже с базированием на западные источники методов, - Вас все равно приведет к ложным (или сильно искаженным) результатам. Это если Вас действительно интересует существо результатов.
4.Есть еще интересная сторона темы. В России, явно одной из немногих стран мира, существует малоизвестная широкой публике масштабная (с подключением если не всех, то многих регионов страны) автоматизированная система оценки общественного мнения, как по регионам, так и по стране в целом, в т.ч. по совершенно разным темам, интересующих органы власти. Источники информации -совершенно разные, например, печатные и Рунет. Но есть конечно и специфические – потоки писем в органы власти, оперативная – спецслужб и т.п. На мой взгляд, это одна из причин, почему некоторые средства СМИ, явно оппозиционные власти, – не закрываются. – эта автоматизированная система лишится важных источников информации, уже на них настроенная.
Кое-кого может и удивит существование такой мощной системы, но я бы и сам не поверил. Если бы сам не присутствовал на открытой всероссийской конференции (где-то в 2000 или 2001 г.), которое устраивалось коммерческой организацией, где было около 1000 участников. Тогда выступал один из руководителей ФАПСИ (тогда она еще в ФСБ не входила), доктор наук. Рассказывал все вполне подробно и структуру системы и основные методы работы с хорошей компьютерной презентацией. Мне все понравилось, вполне хороший и проработанный научный уровень. Явно, что эта масштабная работа велась давно, начиная с советских времен, но в 90-е годы была активизирована и доведена до неплохого уровня.
Больше об этой системе я не слыхал, кроме разве что отдельных намеков отдельных политиков, – весьма изредка.
В ней конечно уже есть ответы на некоторые Ваши вопросы.
Но вряд ли Вы доберетесь до тех закрытых исследований в этой области, которые были применены в этой системе.
«Я провожу исследование на базе текстов, размещенных в Интернете - расчитываю некую функцию. Теперь по-хорошему, мне нужно проверить соответствие выборки (русскоязычных текстов Интернета) всем русскоязычным текстам. На первый взгляд, это нереально, но может быть кто-то уже что-нибудь подобное, похожее проводил?»
В принципе, рунетовский язык конечно отличается от русского. Для этого Вам просто надо иметь исследования по этому самому языку. В принципе такие источники, даже книги есть, сам в руках держал – но у меня нет, а авторов не помню, посклльку они мне не нужны. Но тут уже исследования мало отличаются, например, от исследования влияния фразеологизмов.