?

Log in

No account? Create an account
ru_spss

SPSS в психологии и социальных науках

Сообщество пользователей SPSS

Памятка всем

ПРАВИЛА СООБЩЕСТВА:
  1. Приветствуются публикации, касающиеся статистического анализа вообще и в программе SPSS в частности; касающиеся анализа данных и интерпретации его результатов в науках о поведении; касающиеся любых технических вопросов о программе SPSS.
  2. Не приветствуются публикации, касающиеся технических вопросов других программ и языков, если это не связано с SPSS.
  3. Запрещается обсуждение взломов программы SPSS, поиска "пиратских" копий, "кряков" и т.п.
  4. Запрещается публикация сообщений с просьбой о помощи за деньги, о вакансиях на работу.
  5. Запрещается публикация рекламных сообщений (о платных курсах по SPSS, консультаций, вакансий и т.п.). Реклама в сообществе может быть опубликована лишь с разрешения модератора - LJ-user: propulsive (e-mail: uralakme(at)mail.ru).
Сообщения с нарушением вышеуказанных правил будут удаляться без предупреждения.

ОФОРМЛЕНИЕ ПУБЛИКАЦИЙ:
  1. Длинные записи прячьте частично под врезку ("под кат").
  2. Озаглавливать вашу запись необходимо информативно (посты без указания темы - отклоняются).
  3. Если вы задаете вопрос, позаботьтесь дать "ключи" ответить на него: вероятно, что вам следует привести данные, синтаксис ваших команд, сообщить вашу версию SPSS (данные, синтаксис рекомендуем помещать между html-символами <pre> и </pre>).
  4. Если вы вставляете в запись рисунок как ссылку на где-то хранимое изображение, то обеспечьте пожалуйста, чтобы изображение хранилось там постоянно, а не временно, иначе ваша запись однажды потеряет свой рисунок и вместе с ним смысл.
  5. Старайтесь дать своей записи метки (теги) из предлагаемого сообществом списка таковых. Если хотите предложить метку, какой нет в списке, укажите ее в конце записи: возможно, мы сочтем ее полезной и включим в список.
  6. Пожалуйста, соблюдайте русские правописание и пунктуацию, чтобы донести мысль верно: ведь это сообщество ученых.
  7. Употребляя принятые сокращения названий процедур, пожалуйста, при первом упоминании в записи сопроводите и расшифровкой, например: дисперсионный анализ (ANOVA).


Заполнение пропусков в массиве
я
_germanik_

Коллеги, добрый день!

Предположим есть массив типа:

ID V1 V2 V3 V4 V5
1 1 5 2
2 1 3 2
3 3 5 4
4 2 3 2


Как можно с помощью синтаксиса можно оперативно заполнить пропуски, таким образом, чтобы значения автоматически рассчитывались примерно следующим образом (для V3):
1. Если в массиве НЕТ значений в переменных V1, V2, то V3=0
2. Если в массиве есть значения в переменных V1 или V2, то V3 рассчитывается по формуле:
(a)Значение из ближайшей заполненной ячейки слева +
(b)разность между ближайшей заполненной ячейкой и ближайшей заполненной ячейкой справа
(c)деленная на общее число пустых ячеек между V3 и ближайшей заполненной ячейкой слева +1
(d)и умноженная на число пустых ячеек между V3 и ближайшее заполненной переменной слева)
V3=a+b/c*d
То есть для ID=1,
V2=1+(5-1)/3*1=1+1.33*1=2,66
V3=1+(5-1)/3*2=1+1,33*2=3,66.
Таким образом в итоге массив должен выглядеть следующим образом (новые значения выделены жирным):

ID V1 V2 V3 V4 V5
1 1 2,33 3,66 5 2
2 0 1 1,5 3 2
3 3 4 5 4 0
4 0 2 3 2,5 2


Как сделать это долго и мучительно, я знаю, но я уверен, что есть быстрое и изящное решение.
Буду очень благодарен за помощь.


Обновления Kirill's SPSS macros page (на SPSStools.net)
inostrancevia1
gorgonops
Коллекция "Кластерные критерии" существенно обновлена на Странице SPSS макросов Кирилла. Кластерные критерии используются для сравнения результатов кластерного анализа и для решения о наилучшем числе кластеров в нем.

Продвинутые пользователи, программирующие в сеансе MATRIX - END MATRIX: не забывайте о пополняемой время от времени коллекции "MATRIX - END MATRIX functions". Работа в матричном сеансе удобна тем свойством, что, подобно как в R или Matlab, можно использовать матричные операции вместе с обыкновенными. Благодаря функциям, содержащимся в упомянутой коллекции, можно делать многие вычисления и анализ, не выходя из матричного сеанса; это удобно!

Как поделить данные по выраженности признака и анализ гипотезы о различии
мысли
katty_nia

Всем доброго времени суток.

Я честно пыталась понять все сама, но тревожность берет свое :) посему прошу о помощи.

Дано: магистерская диссертация. Исследование с гипотезой о различии (идентичность людей, имеющих определенные установки, характеризуется особенностями по сравнению с не имеющими таковых). 3 выборки (по трем разным странам). 3 количественные методики, одна из них - фильтр, которая и определяет установки (две другие на особенности идентичности). Везде по ним Лайкерт, результаты по каждой шкале в 2 и 3 методиках - средние, в методике-фильтре высчитывается средний балл между ее 3 шкалами, получается общая цифра, выражающая установку.

Здесь у меня встала первая проблема: научница дала понять, что нужно высчитать, у кого в методике-фильтре признак (установка) выражен, а у кого нет. Я попробовала просто через средние (поделила на 3 уровня выраженности признака, исходя из средней + дисперсии) - она сказала, что так нельзя, и это можно сделать правильно с помощью таблиц сопряженности или Манна-Уитни. Пыталась разобраться, но так и не поняла, как это можно сделать.

Еще проблема осложнилась тем, что я проверила распределение (Колмогоров-Смирнов) по этой методике-фильтру, и в 2 странах из 3 гипотеза о нормальном была отвержена. Возможно, это потому что в этих выборках вышло по 40 чел., а в третьей 80.
Ладно, я попробовала выделить категории через процентили. Но там тоже вышло на 3 части разделение - а насколько я поняла слова научницы, нужно только 2 категории. Тогда возникла мысль: насколько правильно в данном случае будет перевести все в стены (и решит ли это проблему с распределением)?

И поэтому вопросы в следующем:
 - как можно поделить данные по выраженности признака (выражен/не выражен)? (учитывая, что везде количественная шкала)
 - и если дальше мне нужно выявлять различия с помощью U, то могу ли я сразу вбить все шкалы всех методик для проверки? (может ли Манна-Уитни сделать одну большую таблицу, как в случае с корреляциями, а не только попарно?)
 - если Манна-Уитни не дает сведений о характере различий, то правильно ли я понимаю, что анализировать такие данные можно только по типу " между __ и ___ шкалами различий (не) обнаружено - возможно, потому что... *здесь данные из теории + возможные подтверждения своих мыслей корреляциями* " ?
 - так ли это, что если данные не по нормальному распределению, то их нельзя соотносить на всю генеральную совокупность?


Эксперимент с балансировкой порядка и сочетания стимулов
carpodacus
Решил опубликовать результаты своей студенческой курсовой в сколько-нибудь приличном месте,а для этого, видимо, нужно подправить стат.методы.

Курсовая посвящена восприятию эмоций по лицу при естественном и искусственном совмещении лиц с фоновыми контекстными сценами (предположительно эмоциогенными).

Сформировано 4 группы испытуемых в зависимости от предъявляемого типа стимульного материала:

I) Присутствуют и эмоциональное лицо, и контекстная сцена, естественно совмещены

II) Присутствуют и эмоциональное лицо, и контекстная сцена, лицо искусственно наложено

III) Присутствует только эмоциональное лицо (наложено на белый шум вместо сцены)

IV) Присутствует только контекстная сцена (человек-транслятор эмоции не добавлен).

В каждой группе по 16 испытуемых, каждый испытуемый последовательно просматривал и оценивал 4 стимула, итого по 64 пробы на каждую группу. Различия между стимулами сводятся к 4 факторам:

А) 2 модальности эмоций на лице (страх/радость; все группы, кроме IV)
Б) 2 интенсивности эмоций на лице (25%/75%; все группы, кроме IV)
В) 2 пола транслятора эмоции (все группы, кроме IV)
Г) 4 контекстные сцены («корпоративный праздник», «тёмная подворотня», «американские горки», «аплодисменты на выступлении»; в группе III вместо контекстов соответствующее по размеру и расположению лица поле белого шума)

Применена балансировка порядка предъявлений и сочетаний:

* Каждый вариант по каждому фактору одинаковое количество раз встречается на 1-м, на 2-м, на 3-м и на 4-м предъявлении.
* Все возможные комбинации стимулов («лицо мужчины, выражающее страх силой 25% на фоне горок», «лицо женщины, выражающее радость силой 75% на фоне подворотни» и т.п.) в рамках одной группы встречаются по 2 раза.

Половой состав испытуемых не выровнен внутри группы, но сохранён постоянным от группы к группе (12 респондентов женского пола, 4 респондента мужского пола).

Испытуемому предлагается выбрать один или несколько из 7 вариантов эмоции (печаль, радость, страх, гнев, удивление, отвращение, нейтральность) и для первых 6 вариантов оценить силу переживания от 1 до 4 баллов (нейтральности автоматически ставится 0 баллов). Результаты фиксируются 2 способами:
1) Все эмоции считаются качественно различными, отмечается угадывание или неугадывание верной эмоции
2) Рассчитывается вектор различий между названной и реальной эмоцией (исходя из сферической модели Измайлова-Соколова-Коршуновой). Если названо несколько эмоций, то подставляются их усредённые координаты в векторном пространстве.

Когда писал курсовую, то:

* 1) обсчитывал хи-квадратом, кодируя «1» - указана верная эмоция, «0» - верной эмоции не указано, при этом указание верной эмоции в числе n вариантов засчитывал с весом 1/n
* 2) обсчитывал дисперсионным анализом для независимых выборок (главным образом, внутри групп) различия в длине вектора и относительной длине вектора по факторам «модальность эмоции», «насыщенность эмоции», «тип контекста» (относительная длина - по сравнению со средней длиной вектора для данного контекста).

Основным результатом было то, что при естественном (и только естественном) монтаже лица и контекстной сцены модальность эмоции значимо взаимодействует с содержанием контекста (p=0,009) по относительной длине вектора: есть контексты, релевантные страху и релевантные радости (по исходной длине вектора это взаимодействие тоже есть, но вдобавок в одних контекстах обе эмоции распознаются лучше или хуже, чем в других).

Насколько я понимаю, применение дисперсионного анализа для независимых выборок здесь натянуто, т.к. 4 результата, поступавшие от одного человека, конечно, ненезависимы друг от друга.

Каким методом ДА/СМ тогда можно получить действительно корректные результаты? Менять сумму квадратов?

Сложный вопрос на собеседовании
norka_0
Originally posted by norka_0 at Сложный вопрос на собеседовании

Вчера в ботанической фирме задали мне сложный вопрос.

Есть 100 тарелочек. В каждой 100-150 росточков. У каждого росточка измерян корень. В каждую тарелочку добавлено какое то вещество. Всего 100 разных веществ. Есть еще контрольная тарелка с ростками что проросли в воде без удобрений. Как сравнить длину корня в 100 тарелках относительно контрольной?!

ANOVA тут не подходит,  потому что хоть групп и больше 2, но очень много. И это влияет на df (degree of freedom).

Я предложила сделать 100 раз T-test :) Сравнивая каждый раз 1 тарелку с удобрением и тарелку с водой.  Но это долго и мне сказали что есть еще способ.

Еще известно что некоторые из проростков вообще умерли.

Задача: отобрать удобрения которые significantly увеличивают корни лучше других.

Что посоветуете? Какой стат анализ?


Пишу про распространённые студенческие ошибки в работе со статистикой
carpodacus
По опыту хождения на защиты курсовых и дипломных работ по психологии подметил ряд распространённых и коварных ошибок в работах. Задумал черкнуть текст, предостерегающий от таких ошибок. Буду благодарен, если специалисты по статистике проверят.

Чтобы не вываливать сразу много, пока первые пять пунктов.

Читать дальше...Свернуть )

Анализ влияния многих факторов, взаимодействующих друг с другом
carpodacus
Имеется большая (около 400 валидных кейсов) выборка студентов, в которой учтён ряд социально-демографических факторов. Однако факторы неустранимо и значимо взаимодействуют друг с другом (например, пол с факультетом обучения - ну реально так устроены некоторые специальности, что там практически только девушки или только мужики).

Из-за такой связи сравнивать факторы по одному нецелесообразно (например, сравнение результатов по специальностям через Крускала-Уоллиса подозрительно похоже на опосредованное влияние пола). Знаю, что многофакторный дисперсионный анализ при значимой корреляции факторов производить не стоит.

Какая может быть альтернатива? Структурное моделирование позволяет задавать детерминирующие переменные в номинативной шкале?