/
Автор: Толстова Ю.Н.
Теги: социология учебное пособие шкалирование многомерное шкалирование
ISBN: 5-98227-100-4
Год: 2006
Текст
УДК 316
ББК 60.5
Т52
Рецензенты:
Кафедра социальной информатики социологического
факультета МГУ им. М. В. Ломоносова
(канд. физ.-мат. наук О. В. Иванов);
Зав. каф. мат. методов в социологии ГУГН,
доктор соц. наук, проф. Г. Г. Татарова
Толстова Ю. Н. Основы многомерного шкалирования:
Т52 учебное пособие. — М.: КДУ, 2006. — 160 с, ил.
ISBN 5-98227-100-4
Одной из наиболее важных задач, интересующих социологов,
является выявление характеристик, которыми человек руководствуется,
голосуя за того или иного кандидата, переключая телеканалы, покупая
какой-либо сорт товара и т. д. Решить эту задачу позволяет многомерное
шкалирование (МШ). Настоящая книга посвящена описанию этого
подхода. Издание дополнено приложениями, написанными А. И.
Орловым (сравнение методов понижения размерности) и А. В. Ермолаевым
(обзор методов МШ).
Учебное пособие написано на базе спецкурса для студентов
социологических факультетов и рассчитано на читателя-гуманитария. Книга
будет полезна всем, кто хочет познакомиться с основными идеями и
применением методов МШ для решения широкого круга задач,
возникающих в любой области науки и практики.
УДК 316
ББК 60.5
ISBN 5-98227-100-4
© Толстова Ю. Н., 2006
© Орлов А. И., приложение 2, 2006
© Ермолаев А. В., приложение 3, 2006
© Издательство «КДУ», 2006
ОГЛАВЛЕНИЕ
Предисловие 6
Тема 1. От пространства «объект-признак» к другим видам
исходных данных. Гносеологическая сущность методов
многомерного шкалирования 11
Общее представление о пространстве восприятия 11
Традиционные способы выявления пространства восприятия.
Их недостатки 14
Недостаточность информации вида матрицы «объект-признак»
для поиска пространства восприятия 16
Признаковое пространство и механизмы восприятия человеком
объектов 17
Виды получаемой от респондента информации, отличной
от матрицы «объект-признак» 20
Тема 2. Основные элементы формализма 28
Основная идея классического МШ. Евклидово расстояние.
Евклидово пространство. Общее представление о функции
стресса 28
Функция расстояния (аксиоматическое определение) 35
Формальное определение близостей 39
Формальные аспекты МШ, затрудняющие интерпретацию
его результатов: проблемы определения размерности искомого
евклидова пространства, вращения определяющих его осей
координат 40
Тема 3. Метрическое и неметрическое МШ. Соответствующие
функции стресса 47
Многомерное шкалирование с точки зрения теории измерений 47
4
Оглавление
Определение метрического и неметрического многомерного
шкалирования 51
Функция стресса в метрическом МШ (ММШ) 52
Функция стресса в неметрическом МШ (НМШ) 53
Тема 4. Индивидуальное многомерное шкалирование 55
Постановка задачи 55
Вид входных данных 57
Вид выходных данных 58
Функции стресса в индивидуальном МШ 61
Тема 5. Неметрическое многомерное развертывание 62
Одномерное развертывание: нерешенные проблемы 62
Неметрическое многомерное развертывание (НМР) 65
Тема 6. Проблемы формирования исходных данных 69
Возможные способы получения исходных данных 69
Непосредственное получение близостей от респондентов,
классификация соответствующих способов опроса
(«психологический» подход к получению данных) 70
Примеры расчета матрицы близостей на основе анализа данных
«непсихологического» характера 72
Пример получения ранжировок для применения НМШ 75
Роль социолога при формировании исходных данных 76
Тема 7. Проблемы интерпретации результатов МШ 78
Способы обеспечения адекватной интерпретации на этапе
сбора данных 78
Комплексное использование нескольких математических
методов при интерпретации результатов МШ 84
Роль социолога при интерпретации
результатов МШ 88
Тема 8. Применение МШ для решения задач понижения
размерности и визуализации данных 91
Понижение размерности изучаемого признакового пространства 91
Оглавление _ jf_
Визуализация данных 94
Методологические аспекты 95
Список литературы 97
Контрольные вопросы 102
Приложение 1 104
Принципы монотонной регрессии 104
Приложение! ИЗ
Методы снижения размерности 113
Приложение 3 121
Краткий обзор современного состояния
разработки методов многомерного шкалирования 121
Предметный указатель 156
ПРЕДИСЛОВИЕ
Предлагаемая работа написана автором на базе спецкурса по
многомерному шкалированию (МШ) для студентов
социологических факультетов Московского государственного университета
им. М. В. Ломоносова, Государственного университета — Высшей
школы экономики, Государственного университета управления.
В наше время методы МШ находят широчайшее применение
в прикладных социологических исследованиях (об этом
косвенно свидетельствует, например, тот факт, что краткое изложение
принципов соответствующего подхода дается во всех солидных
современных учебниках по маркетинговым исследованиям, в тех
фрагментах, которые касаются социологических аспектов
маркетинга). Однако удовлетворительного описания методов МШ,
ориентированного на пользователя-социолога, в современной
отечественной литературе практически не существует. Имеется
довольно много изданных у нас работ, написанных в 70-80-е годы
XX века (как переводных, так и принадлежащих перу советских
авторов). Среди них имеются и предназначенные для читателя-
гуманитария (социолога, психолога). Однако этой литературы
недостаточно для успешного применения в социологической
практике методов МШ.
Во-первых, упомянутые работы давно стали
библиографической редкостью.
Во-вторых, те из них, которые претендуют на то, чтобы
служить учебными пособиями для социологов, имеют отдельные
недостатки, обусловленные тем, что их авторы в принципе не могли
иметь соответствующего педагогического опыта (как известно,
высшее социологическое образование у нас в стране существует
с 1989 года).
Предисловие '_
В-третьих, в последние годы методы МШ на Западе (впрочем,
насколько нам известно, и в Японии тоже) активно развиваются
(чего, к сожалению, нельзя сказать о России) и это, несомненно,
должно найти отражение в литературе, ориентированной на
российского читателя, что пока не имеет места.
Третий аспект затронут в одном из приложений к работе, и речь
о нем пойдет ниже. Здесь следует заметить, что освоение
описанных в основной части книги классических схем является
необходимым базисом для того, чтобы социолог смог воспринимать
современные работы по МШ.
По существу, в данной работе речь идет о том, как практически
использовать МШ в решении реальных социологических задач:
как социолог может убедиться в целесообразности применения
МШ; как, используя вместе с МШ другие методы, эффективно
формировать исходные данные и интерпретировать результаты.
Формирование подобных соображений тесно связано с
содержательным смыслом решаемой задачи, это — дело скорее
искусства, чем науки. Поэтому многие моменты поясняются ниже на
заимствованных из литературы конкретных примерах.
В настоящей работе представлена попытка описать
методические соображения, использованные цитируемыми авторами при
решении конкретных социологических задач на основе
применения МШ. Причины этого требуют некоторого пояснения.
Несмотря на то что каждый метод (в том числе методы МШ)
был создан для решения каких-то реальных задач, механическое
его использование для решения той или иной новой проблемы
всегда чревато неприятностями.
Социальные явления настолько сложны, что, каким бы
хорошим метод ни был, всегда требуется определенная его подгонка
под конкретную ситуацию.
Любой метод всегда обрастает методическими наработками,
связанными с его адаптацией, привязкой к реальной
социологической задаче. Чаще всего упомянутая подгонка осуществляется
за счет создания нетривиальных методик сбора данных и
интерпретации получаемых с помощью выбранного метода результатов.
8
Предисловие
При этом каждая конкретная задача требует своих собственных
и теоретических, и практических разработок. Насколько нам
известно, учеными еще не была проведена систематизация тех
практических методик подобного рода, которые требуются при
использовании именно МШ. Не претендуя на подобную
систематизацию, мы все же попытаемся показать читателю, о чем
именно здесь может идти речь, продемонстрируем это на конкретных
примерах.
Настоящее издание ориентировано в основном на
студента-социолога.
В качестве факторов, определяющих актуальность предлагаемой
работы, можно назвать то, что в ней осуществляется следующее.
1. Рассматриваются основные алгоритмы МШ, отвечающие тем
классическим схемам, которые были описаны в упомянутых
выше, ставших раритетами отечественных публикациях.
2. Приводится более или менее полный перечень работ по МШ,
опубликованных на русском языке.
3. Изложение, на наш взгляд, предельно просто (во всяком
случае, автор стремилась к тому, чтобы это было так); сложные
подходы объясняются «на пальцах»; степень сложности
изложения определялась опытом автора по чтению
упомянутого выше спецкурса.
4. Более подробно, чем это делалось ранее в отечественных
работах, рассматривается главная социологическая
задача, решающаяся с помощью МШ, — построение
пространства восприятия — и предпринимается попытка раскрыть
гносеологический смысл этого подхода, сравнить его с
более привычными для социологов способами измерения.
5. Коротко описывается, какими дополнительными
методическими приемами обрастает процесс использования МШ при
решении конкретной социологической задачи.
Следует сделать некоторое замечание по поводу
использованной литературы.
Дело в том, что в тексте есть ряд ссылок на работы, не имеющие
непосредственного отношения к МШ, но касающиеся определенных
Предисловие
9
методологических принципов сбора и анализа данных в
социологическом исследовании. Подобные ссылки для нас являются
принципиальными. Мы полагаем, что нельзя говорить об
использовании в социологии какого-либо конкретного метода анализа данных,
не вписывая этот процесс в общую канву социологического
исследования. А тут — свои законы.
Особенно активно мы будем опираться на некоторые
рассуждения, приведенные в книге [Толстова, 1998]. Лекции, которые
легли в основу настоящей книги, автор читала студентам,
прослушавшим курс по теории социологического измерения,
отраженный в названной книге. И многие сформулированные там
положения при этом активно использовались.
Соответствующие ссылки потребуются по крайней мере по двум
причинам.
Во-первых, в названной книге подробно описывается
методологическая платформа, определяющая взгляд автора на измерение
в социологии. Основу этой платформы составляет рассмотрение
совокупности результатов измерения как некоторой модели
реальности.
Этот подход базируется на идеях теории измерений1,
определенным образом привязанных автором к потребностям
социологии. Привязка состоит в основном в рассмотрении приемлемых
для социолога моделей восприятия.
Методологические взгляды автора в значительной мере
определяют и стиль приведенного ниже описания методов
многомерного шкалирования.
Во-вторых, мы считаем целесообразным связывать
«идеологию», заложенную в методах МШ, с теми соображениями,
которые лежат в основе ряда методов одномерного шкалирования. И мы
намереваемся избежать описания последних с помощью ссылок
на названную работу.
1 См., например: Суппес П., ЗипесДж. Основы теории измерений //
Психологические измерения. М: Мир, 1967. С. 9-110; Пфанцагль И. Теория измерений.
М.: Мир, 1976.
10
Предисловие
***
Приложения 2 и 3 к основному тексту брошюры написаны
другими авторами. Эти приложения существенно дополняют все
сказанное Ю. Н. Толстовой. Однако их восприятие требует
несколько более высокой математической подготовки читателя, чем
остальное содержание книги (хотелось бы надеяться, что
пониманию текстов упомянутых приложений будет способствовать
знакомство читателя с основным текстом книги).
Приложение 2 написано А. И. Орловым. Оно позволяет шире
взглянуть на методы МШ, рассматриваемые как методы
понижения размерности исходного признакового пространства (это—одна
из важных задач, решаемых с помощью МШ), соотнести
соответствующий подход с другими подходами, позволяющими решать
ту же задачу.
Автор Приложения 3 — А. В. Ермолаев. В приложении дан
краткий обзор методов МШ, разработанных за весь период
существования этого подхода к анализу данных. В частности, упомянуты
основные западные работы последних лет.
В указанных Приложениях в какой-то степени повторено то,
что сказано в основном тексте. Однако сделано это в ином ключе.
Представляется, что рассмотрение одних и тех же положений с
разных точек зрения будет весьма полезно для молодого читателя.
Тема 1. ОТ ПРОСТРАНСТВА «ОБЪЕКТ-ПРИЗНАК»
К ДРУГИМ ВИДАМ ИСХОДНЫХ ДАННЫХ.
ГНОСЕОЛОГИЧЕСКАЯ СУЩНОСТЬ МЕТОДОВ
МНОГОМЕРНОГО ШКАЛИРОВАНИЯ
Термин «многомерное шкалирование» относится к области
анализа данных.
Речь идет о совокупности алгоритмов, позволяющих
реализовать определенный взгляд на природу некоторых (часто стоящих
перед социологом) задач, отвечающий определенной стратегии их
решения. Имеются в виду задачи изучения так называемого
пространства восприятия респондента.
Осознание необходимости решения таких задач произошло
примерно в 50-60-х годах XX столетия. Оно повлекло за собой
кардинальное изменение взглядов исследователей на то, какого рода
данные можно получать от респондента, какие из них можно считать
адекватными, относительно какой интерпретации данных можно
быть достаточно уверенными в ее корректности и т. д.
Возникновение МШ можно расценивать как закономерный
результат протекания соответствующих процессов. Более подробно
описание задачи изучения пространства восприятия с точки зрения
того подхода, который заложен в методах МШ, представлено ниже.
Сделаем это на фоне исторического экскурса, касающегося
развития представлений об измерении в социологии.
Общее представление о пространстве восприятия
В работе [Толстова, 1998, с. 16-19] мы говорили о важности для
социолога построения эффективных оценочных шкал, позволяющих
12
Тема 1
как-то измерить отношение изучаемой совокупности людей к
некоторым объектам (напомним, что имеется в виду отношение,
усредненное по всей совокупности). Так, социолога могут
интересовать типичные для жителей какого-либо региона рейтинги
политиков, претендующих на пост президента страны; оценки
зрителями тех или иных телепередач; отношение покупателей
к определенным видам товаров и т. д.
Одним из основных вопросов, встающих перед исследователем
при построении таких шкал, является вопрос о том, по каким
именно признакам респондент оценивает рассматриваемые объекты,
определяя свои симпатии или антипатии по отношению к ним,
выбирая тот или иной вид поведения (голосуя за или против
претендента на должность, включая или выключая телевизор во время
какой-либо передачи, покупая тот или иной товар) и т. д.
Например, вряд ли стоит доказывать, что исследователю, изучающему
электоральное поведение, очень важно знать, какие качества
ценят избиратели в том или ином кандидате на должность
президента: умение навести порядок в стране, наличие собственной
экономической платформы, способность произносить зажигательные
речи или что-нибудь еще.
Социологу, изучающему зрительские предпочтения,
необходимо понимать, что именно нравится человеку в той или иной
передаче: симпатичный ведущий, юмор, удобное время выхода в эфир
или что-то еще.
Маркетолог должен представлять себе, чем руководствуются
покупатели, выбирая сорт мыла: наличием в мыле смягчающих
кожу веществ, запахом или ценой и т. д.
Другими словами, в социологии весьма важной является
задача поиска того пространства, в котором люди представляют себе
интересующие исследователя объекты, определяя свое отношение
к ним. Именно такое пространство мы и будем называть
пространством восприятия.
Конечно, сам термин «восприятие» подразумевает указание
того, что и кем воспринимается. Ниже будем считать само собой
разумеющимся, что, говоря о пространстве восприятия, мы имеем
От пространства «объект-признак» к другим видам исходных данных 13
в виду восприятие респондентами интересующих исследователя
объектов.
Подчеркнем, что выражение найти пространство восприятия
означает решение нескольких проблем: выявить количество
характеристик, которыми руководствуется респондент, определяя свое
поведение (или симпатии-антипатии), дать названия этим
характеристикам, найти координаты каждого оцениваемого объекта
в соответствующем пространстве1.
Традиционными способами сбора данных при этом служат
такие, которые получаются, когда респондентов просят, к
примеру:
• приписать каждому объекту число, означающее
расположение объекта на оси (либо соответствующим образом
проранжировать объекты), и полагают, что шкальной
оценкой объекта будет среднее значение приписанных ему
чисел;
• назвать лучший (наиболее подходящий на должность
президента, нравящийся, часто покупаемый и т. д.) объект, и
полагают, что шкальной оценкой объекта будет доля
указавших его респондентов и т. д.
Следует отметить, что такого рода данные нельзя считать
адекватно отражающими реальность не только потому, что здесь
остается нерешенным вопрос о выборе признакового пространства,
но по другим причинам, о которых говорится в другой книге [Тол-
стова, 1998, с. 16-19].
1 Предполагается, что актуальность решения задачи выявления пространства
восприятия очевидна. Однако необходимо отметить, что в реальных
социологических исследованиях такая задача часто даже не ставится. Без особых
объяснений (как правило, неявно) принято считать, что ось — одна, и вопроса о ее
названии не возникает. Считается также, что каждый респондент, располагая тем или
иным образом какой-либо объект на оси, просто определяет, насколько ему этот
объект нравится (иногда исследователь при этом задает соответствующую точку
зрения: так, определяя симпатии к политическому лидеру, можно спросить о том,
насколько последний подходит на должность президента, а можно — о том,
насколько респондент ему доверяет).
14
Тема 1
Каждая из упомянутых характеристик отвечает одной
координатной оси этого пространства. Количество таких характеристик
(число координатных осей) называется его размерностью.
Следует отметить еще один немаловажный момент: размерность
пространства восприятия должна быть небольшой.
Это соображение вряд ли может быть формально обосновано.
Оно вытекает из наших представлений о том, что такое
статистическая закономерность в социологии [Толстова, 2000, с. 26-34].
Можно лишь отметить, что размерность 2, 3, 4 в большинстве
случаев разумно считать небольшой. А размерность 35, вероятнее
всего, не может быть признана таковой: вряд ли будет разумно
полагать, что, определяя свое поведение относительно выбора того
или иного объекта, респондент руководствуется таким количеством
характеристик, и вряд ли при использовании косвенных способов
выявления пространства восприятия (а именно это и позволяет нам
делать МШ) мы сможем толково проинтерпретировать 35
получившихся осей.
Традиционные способы выявления пространства
восприятия. Их недостатки
Одним из традиционных способов поиска упомянутого
пространства является следующий. Изучив проблему с помощью
литературы, неформализованных опросов и т. д. и придя к выводу,
что, вероятнее всего, потенциальные респонденты при
определении своего отношения к рассматриваемым объектам
руководствуются некими свойствами этих объектов, исследователь
перечисляет в анкете соответствующие признаки (например, для сортов
мыла — цена, запах, экономичность и т. д.) и просит респондента
отметить, в какой мере каждое из рассматриваемых свойств
присутствует в том или ином объекте (то есть каково значение для
того или иного объекта каждого признака).
Но при таком подходе возникает одна из главных проблем,
источником которых является «жесткость» используемой
анкеты — отсутствие гарантии того, что исследователь не навязы-
От пространства «объект-признак» к другим видам исходных данных 15
вает свое мнение респонденту (вполне может оказаться, что
социолог включил в анкету признак, на самом деле не интересующий
респондента как покупателя мыла, и, напротив, не включил
признак, отражающий весьма волнующее покупателя свойство
товара).
Во избежание указанного недостатка для выявления тех
характеристик, в терминах которых респондент мыслит себе какие-то
объекты, исследователь зачастую прямо обращается к
респонденту с просьбой указать, какие же качества объектов его
волнуют (спрашивает: почему Вы голосовали за того или иного
кандидата? Чем Вам нравится та или иная передача? Какие свойства
товара Вас привлекают?). Однако и такой подход, как правило,
приводит к некорректным результатам. И дело не в том (или не
только в том), что респондент может обмануть исследователя. Это
еще полбеды (существуют способы проверки искренности
ответа). Ответ может быть неадекватным из-за того, что респондент
никогда не задумывался над соответствующим вопросом и при
ответе сказал первое, что пришло в голову, или же (сознательно
или бессознательно) повторил какой-то штамп, вспомнил некий
стереотип, механически воспроизвел то, что много раз слышал
в СМИ, и т. д.
Это многократно было продемонстрировано на практике. Так,
в работе [Ядов, 1991] описывается интересное
микроисследование сознания студентов МГУ, проведенное в присутствии автора
Дж. Робинсоном.
«Надо было в пятибалльных шкалах дать оценку наиболее
острым проблемам нашей жизни. Высшим баллом многие студенты
отметили нехватку товаров массового спроса. После опроса
Робинсон устроил групповую дискуссию, выясняя причину такой
оценки. В ходе обсуждения тема товарного дефицита резко
сместилась в сторону проблемы человеческих взаимоотношений»
[Ядов, 1991, с. 17].
Содержание процитированной статьи дает основание
утверждать, что если бы после проведенной дискуссии студентам был
задан тот же вопрос, что и вначале, то вероятнее всего на первое
16
Тема 1
место вышла бы не проблема товарного дефицита, а проблема
возрастания эгоистических, враждебных отношений между людьми.
Возникает естественный и, надеемся, ставший уже
риторическим вопрос: в какой же степени стоит верить респондентам, если
напрямую спросить их о том, по каким параметрам следует
оценивать те или иные периоды развития государства с точки зрения
благополучия жизни его населения?
Итак, оба описанных выше популярных способа поиска
пространства восприятия не дают нужного эффекта. Что же делать?
Для ответа на этот вопрос попытаемся понять, так ли нужно уже
на этапе сбора первичных данных выяснять, в каком пространстве
восприятия «работают» респонденты.
Недостаточность информации вида матрицы
«объект-признак» для поиска пространства
восприятия
Со времен Кондорсе, который явился одним из первых
исследователей, призвавших научное сообщество изучать мнение
людей [Давыдов, 1995, с. 221-222], примерно до середины XX века
считалось само собой разумеющимся, что собранная
социологом статистическая информация имеет вид матрицы (таблицы)
«объект-признак». Другими словами, предполагалось, что в
результате сбора данных каждый изучаемый объект оказывается
описанным совокупностью значений некоторых признаков, то есть с
формальной точки зрения — представленным как точка некоторого
признакового пространства1. Для примера заметим, что это имеет
место при традиционном анкетном опросе, когда исследователь
интересуется теми или иными характеристиками респондентов:
в качестве объектов в таком случае выступают респонденты, а
признакам отвечают вопросы анкеты.
10 понятии признакового пространства, о его гносеологической роли в
социологическом исследовании см., например, [Толстова, 2000]); ряд изложенных в этой
книге положений заимствован из ставшей классической работы [Ноэль, 1993].
От пространства «объект-признак» к другим видам исходных данных 17
Возникает логичный вопрос: не связаны ли описанные выше
проблемы поиска пространства восприятия с нашим
стремлением получать от респондентов информацию в виде матрицы
«объект-признак»?
Может быть, в соответствующих способах сбора данных
имеется некий гносеологический порок?
Утвердительный ответ на этот вопрос (точнее, причины,
обусловливающие этот ответ) и привел ученых к идеям МШ.
Ответ на этот вопрос как раз и состоял в предложении
изменить метод сбора данных (форму обращения к респондентам с
вопросами) и затем, обработав определенным образом собранную
нетрадиционным способом информацию, самому найти искомое
латентное пространство — и те оси, которые лежат в его основе,
и соответствующие координаты рассматриваемых объектов.
Прежде чем описать вид исходных данных, позволяющих
решать подобные задачи, более подробно рассмотрим вопрос о роли
матрицы «объект-признак» как информации, исходной для
получения социального знания.
Признаковое пространство и механизмы
восприятия человеком объектов
Итак, до поры до времени получение данных в виде матрицы
«объект-признак» воспринималось учеными как естественное
положение дел и сопрягалось с самим представлением о научном
изучении общества (и с наукой в целом).
Исследовательская рефлексия по поводу социологического
измерения вообще и методов построения оценочных шкал в
частности начала активно развиваться параллельно с бурным ростом
количества массовых анкетных опросов. Рассмотрим интересующие
нас аспекты такой рефлексии.
Во всех рассмотренных выше традиционных методах
получения оценочных шкал мы априори полагаем, что человек,
выбирая объекты, как бы расчленяет их на отдельные качества,
служащие значениями рассматриваемых признаков. Однако не лишено
Основы многомерного шкалирования
18
Тема 1
смысла и другое предположение, состоящее в том, что человек,
воспринимая те или иные объекты, не «раскладывает» свое
впечатление на отдельные признаки, то есть объект может
восприниматься как нечто цельное.
Какое из этих предположений верно? При более четкой
формулировке вопрос можно разложить на два:
• воспринимает человек предъявляемые ему для оценки
объекты как точки некоторого признакового пространства (то есть
как некие сущности, характеризуемые определенным
набором значений соответствующих осям этого пространства
признаков) или же как нечто целое, нерасчленимое на
значения отдельных признаков?
• если мы согласимся с тем, что человек воспринимает
объекты неразложимыми на отдельные признаки, можно ли
причиной этого считать то, что респондент просто не рефлекси- I
рует по поводу того, какими признаками в действительности
пользуется?1
Предположим, что мы положительно отвечаем на оба вопроса.
В таком случае от респондента мы должны получить
информацию в каком-то таком виде, который не связан с оценкой им
значений каких-либо признаков2, а поиск соответствующих осей
признакового пространства становится делом исследователя. Именно
на такой стратегии мы и остановимся.
Иначе говоря, лежащая в основе всех наших дальнейших рас- |
суждений модель восприятия (о понятии модели восприятия и ее
роли в процессе социологического измерения мы подробно
говорим в книге «Измерение в социологии» [Толстова, 1998, с. 33-35])
состоит в следующем.
1 Другие вопросы соответствующего плана мы рассматривать не будем
(адекватные ответы на некоторые из них приводят не к МШ, а к другим методам
измерения; об этом идет речь в работе [Толстова, 2002].
2 Считаем очевидным то обстоятельство, что говорить о построении какой бы
то ни было оценочной шкалы можно только на основе исходящей от респондента
информации.
пространства «объект-признак» к другим видам исходных данных
Будем полагать, что любой человек, формирующий какие бы
то ни было представления о рассматриваемых объектах (давая
ответы исследователю на вопросы, связанные с оценками этих
объектов- определяя свое поведение относительно них и т. д.), мыслит
эти объекты как точки некоторого признакового пространства. Но
происходит это чаще всего незаметно для самого человека. Он
может никак не рефлексировать по поводу осей такого
пространства.
Слово «мыслит» означает, как правило, подсознательную
мыслительную деятельность (в отдельных случаях, конечно,
респондент может вполне четко понимать, в рамках какого признакового
пространства он «работает», но, забегая вперед, отметим, что это
нас здесь интересует лишь постольку, поскольку сведения о такой
рефлексии могут помочь интерпретировать результаты МШ).
Будем полагать, что от самого человека можно получить
только такую информацию, которая предполагает, что каждый объект
воспринимается им как нечто цельное, неразложимое на
признаки. Поиском же осей упомянутого выше признакового
пространства должен заниматься сам социолог.
Ниже речь пойдет о способах поиска, которые заложены в
подходах МШ, — о построении многомерной оценочной шкалы.
Иными словами, о поиске такого пространства, точками которого можно
было бы считать рассматриваемые объекты, будучи уверенными
при этом, что осям этого пространства отвечают те самые
характеристики, в пространстве которых «работает» (в основном на
подсознательном уровне) любой человек, так или иначе оценивая
рассматриваемые объекты, предоставляя исследователю ту или
иную информацию о своем к ним отношении. Выше такое
пространство названо пространством восприятия.
Отметим, что это пространство, вообще говоря, многомерно,
то есть имеет не одну координатную ось; но в частном случае
может быть и одномерным — задаваться всего одним признаком,
иметь одну координатную ось.
В соответствии со сказанным выше, пространство
восприятия является латентным. Ясно, что здесь понятие латентности
2*
20
Тема 1
имеет ту же природу, что и понятие латентности переменной,
введенное ранее [Толстова, 1998, с. 12], — пространство
латентно потому, что нельзя определить составляющие его оси путем
прямого обращения к респонденту, путем задавания ему прямых
вопросов.
Виды получаемой от респондента информации,
отличной от матрицы «объект-признак»
Одним из первых исследователей, обративших внимание на
целесообразность получения от респондента информации, не
имеющей вид матрицы «объект-признак», был Л. Л. Терстоун,
предложивший внедрить в социологию так называемый метод парных
сравнений1.
Данные об осуществленных каждым респондентом
сравнениях объектов в парах уже не сопрягаются непосредственно с
признаковым пространством. Правда, при определенных
предположениях признаковое пространство может быть найдено2, но,
вообще говоря, его поиск не является обязательным [Толстова,
1998, с. 69].
Оцениваемым респондентами объектам отвечают
расположенные в этом пространстве точки; в классических, восходящих к Тер-
стоуну, методах парных сравнений пространство предполагается
одномерным.
Метод сбора данных с помощью парных сравнений объектов
выгодно отличается от других (более традиционных) способов
сбора данных прежде всего тем, что полученная с его помощью
информация более надежна. Однако нам метод парных сравнений
не очень подходит.
1 Термин «парные (paired) сравнения» принят в нашей литературе. Однако
более адекватным представляется употребление слова «попарные» вместо
«парные». Тем не менее, ниже используется традиционный подход.
2 См. [Дэвид, 1978].
пространства «объект-признак» к другим видам исходных данных
21
Конечно, предположение о том, что, сравнивая какие-то два
объекта друг с другом, респондент не «разлагает» их на части,
отвечающие отдельным признакам, а рассматривает как нечто
единое выглядит правдоподобным. Но, как было отмечено выше,
обсуждаемый метод направлен (в классическом варианте Терстоуна)
на поиск одномерной шкалы. Мы заранее ограничиваем себя
довольно жестким предположением о размерности (одномерности)
искомого пространства восприятия.
Однако следует напомнить читателю [Толстова, 1998, с. 73-76],
что сам процесс сбора данных с помощью парных сравнений
объектов может привести исследователя к выводу о том, что строить
одномерную шкалу бессмысленно из-за многомерности
восприятия объектов респондентами. Такой вывод можно сделать в том
случае, если среди данных будет много нарушений
транзитивности отношения порядка (имеется в виду ситуация, когда человек
говорит нам, что, с его точки зрения, для трех объектов а, Ь, с
одновременно имеют место соотношения: a>b, b > с и с > а) или
будет наблюдаться симметричность этого отношения (то есть
ситуация, когда респондент утверждает, что, по его мнению, для
каких-то двух объектов а и b одновременно имеют место
соотношения а > b и b > а).
Такие факты наблюдаются очень часто1. Все это служит
косвенным подтверждением того, что человеческое восприятие
окружающего мира не является одномерным.
1 Автором в течение ряда лет проводился следующий эксперимент. Студентам-
социологам предлагалось тремя способами высказать свои предпочтения
относительно нескольких выбранных для оценки объектов: проранжировать эти объекты,
заполнить правый верхний угол матрицы попарных сравнений, заполнить левый
нижний угол аналогичной матрицы (если сравниваются объекты а,,..., ар, то
матрица ||n..||, ij = 1,..., р называется матрицей парных сравнений, если
{1, еслиа^а,
0, еслиа;<ар.
Один опрос отделялся от другого временным интервалом. Было опрошено
в общей сложности около 300 студентов. И только несколько человек не дали
противоречивых результатов.
22
Тема 1
Вероятно, разумно было бы предположить, что восприятие
людьми практически любых объектов, как правило,
многомерно (правда, можно говорить о том, что это положение зависит,
с одной стороны, от того, насколько хорошо респонденты знают
объекты, а с другой — насколько сложно сознание самих
респондентов)1.
В большей мере нам подходят другие способы сбора данных —
направленные на выявление того, какие объекты респонденты
считают близкими, а какие — далекими, какие — похожими, а
какие — непохожими.
О важности способов сбора таких данных мы говорили в
другой книге [Толстова, 1998, с. 147-169] в связи с обсуждением
некоторых аспектов деятельности известного американского
ученого — К. X. Кумбса, творчество которого стало большим шагом
в направлении обоснования возможности и необходимости
получения информации, не сводящейся к матрице «объект-признак»
и за счет этого более надежной.
Именно идеи Кумбса (учет возможности упорядочения
расстояний между объектами, анализ модели восприятия респондентом
1 Не следует, однако, воспринимать как противоречие тот факт, что, с одной
стороны, речь идет о том, что при парных сравнениях респондент воспринимает
объекты как нечто цельное, неделимое на отдельные признаки, а с другой—о том,
что наличие логических противоречий в полученной матрице парных сравнений
заставляет предполагать, что соответствующее пространство восприятия
многомерно (тем самым подразумевается, что респондент мыслит объекты в
некотором признаковом пространстве). Вопрос не так прост, как кажется на первый
взгляд, и требует специального рассмотрения.
Здесь следует упомянуть лишь два «оправдательных» замечания. Во-первых,
можно полагать, что разделение на признаки происходит в сознании
респондента неявно, то есть он не отдает себе в этом отчета.
Во-вторых, многомерное восприятие совсем не обязательно нужно понимать
как восприятие в четко выраженном признаковом пространстве; основания этой
многомерности могут быть достаточно общими (скажем, можно говорить как о
цельном о когнитивном восприятии объекта и как о цельном же — об
эмоциональном восприятии).
От пространства «объект-признак» к другим видам исходных данных 23
предлагаемых ему объектов — векторной или модели идеальной
точки) можно считать лежащими в основе того подхода, который
получил название МШ. Аналогичные идеи рассматривались не
одним Кумбсом.
В числе создателей того направления анализа данных,
которое получило название МШ, можно упомянуть У. С. Торгерсона
(одна из основополагающих работ этого автора переведена на
русский язык [Торгерсон, 1972]), Л. А. Гудмена, Дж. В. Краскала,
Р. Н. Шепарда, Ф. В. Юнга.
Одной из первых работ по МШ, вероятно, можно считать
работу [Young, Householder, 1938]1.
Важно отметить несколько моментов в работах этих ученых,
связанных с исходными «содержательными» положениями МШ.
Во-первых, названные ученые показали, что респондент может
оценивать и сравнивать друг с другом не только объекты (что
всегда считалось неоспоримым), но и степень схожести между
объектами, величину близости (или, напротив, различия) между ними.
Следует иметь в виду, что такие близости мы пока понимаем
исключительно в содержательном смысле. Приведем примеры.
При обсуждении вопроса о пригодности неких лиц на
некоторую должность респондент вполне может нам сообщить, к
примеру, что, с его точки зрения, степень сходства между лицами А и Б
больше, чем степень сходства между лицами В и Г. «Может» —
в том смысле, что такие оценки и сравнения зачастую совсем не
затрудняют респондента и являются вполне адекватными с точки
зрения их естественной интерпретации (а сомнения в том, что
человек способен адекватно производить обсуждаемые операции,
нередко возникают у социологов).
Какие-то оценки указанных близостей могут быть сделаны и без
обращения к респонденту. Все примеры соответствующего плана
О рождении и начальном развитии методов МШ можно прочесть в работах
советских авторов [Каменский, 1977; Сатаров, 1982; Шрайбер, 1982], а также
[Дэйвисон, 1982].
24
Тема 1
по существу опираются на анализ поведения респондента.
Поведение при этом понимается очень широко.
К примеру, при изучении электоральных механизмов это
может быть вербальное поведение — ответы на вопросы о том, за
кого бы проголосовал респондент, если бы тот, за кого он в
первую очередь хочет голосовать, сошел с предвыборной дистанции.
Близкими можно считать таких претендентов на выборную
должность, которые чаще в указанном смысле «подменяли» друг
друга. Так, если, скажем, почти все респонденты, считающие
нужным голосовать за кандидата А, в случае его «исчезновения» готовы
голосовать за Б, то А и Б близки. А вот если среди тех, кто хотел
бы голосовать за В, практически никто не готов заменить его на Г,
то В и Г — далеки (речь идет только о самой идее измерения
близостей; для ее реализации необходимо вводить определенные
формулы, которые пока приводиться не будут).
При шкалировании телепередач близкими можно считать
такие передачи, которые респондент в одинаковой степени
способен досмотреть до конца: близки передачи, которые респондент
почти сразу выключает, как только на них «натыкается». Также
близкими можно считать и такие, которые он в среднем
досматривает до середины, а также те, которые всегда досматриваются
респондентом до конца, и т. д.
Подобный подход может быть скорректирован: близкими
могут считаться такие передачи, которые большинство
респондентов в одинаковой степени игнорируют (все, кто выключает
первую, как правило, выключают и вторую; кто всегда целиком
смотрит первую, тот целиком смотрит и вторую, и т. д.).
В маркетинге при изучении пространства восприятия каких-то
сортов товара можно осуществить наблюдение за покупателями в
магазине. Скажем, при сравнении сортов мыла два сорта могут
считаться близкими, если отсутствие в продаже одного сорта
легко восполняется другим. Напротив, если один сорт никогда не
подменяется неким другим, то эти два сорта логично считать
максимально далекими друг от друга. О подобных примерах пойдет
также речь при обсуждении Темы 6.
0т пространства «объект-признак» к другим видам исходных данных 25
Вместо словосочетаний «степень близости», «степень
схожести» обычно употребляют просто термины близость, схожесть1.
Ниже, говоря о конкретных алгоритмах МШ, мы более точно
определим эти термины. Пока лишь отметим то, что по своей
языковой сущности термин «близость» является чем-то
противоположным известному геометрическому термину «расстояние»: чем
ближе объекты, тем меньше между ними расстояние.
Иногда в ситуациях, аналогичных описанным, говорят не о
близостях (степенях близости), а, напротив, о различиях
(степенях отличия) между объектами. Принципиальной разницы
между этими подходами нет. Более того, иногда термин «близость»
используют, по существу, как меру различия между объектами:
полагают, что чем меньше значение близости, тем сходнее
объекты2.
Во-вторых, создателями подхода МШ было блестяще
показано, как на базе информации о том, какие объекты респонденты
считают близкими, какие—далекими, может строиться
пространство, в которое объекты можно поместить, сохранив данные о
близостях.
Разработано огромное количество алгоритмов
соответствующего плана. Ясно, что это пространство можно называть
пространством восприятия, если имеются основания полагать, что
причиной возникновения используемых представлений
респондентов о близостях является именно то, что респонденты хотя бы
неявно мыслили себе эти объекты как точки некоторого
признакового пространства.
1 Следует отметить, что еще в 50-е годы XX века американскими учеными,
работы которых лежат в основе МШ (Кумбс и Шепард), было предложено
использование двух разных терминов для обозначения понятия близостей: термин
similarity было предложено применять для ситуации, когда сходство между
объектами непосредственно оценивают сами респонденты, а термин proximity — для
ситуации, когда близость между объектами оценивается другими способами. Более
подробно о способах оценки близостей см. Тему 6.
См., например, [Интерпретация и анализ... 1987, с. 176].
26 Тема 1
В-третьих, Кумбс и другие названные ученые убедительно
продемонстрировали, что построение признакового пространства
(пространства восприятия) на базе информации о тех или иных
сравнениях респондентами близостей между объектами,
ранжировок объектов и т. д. не может быть осуществлено без введения
в действие довольно серьезных (с одной стороны, естественных,
а с другой — спорных) моделей, включающих в себя
исследовательские предположения о том, как упомянутая информация
связана с искомым признаковым пространством.
Ранее нами [Толстова, 1998, с. 150-152] уже обсуждались две
модели такого рода—векторная и модель идеальной точки. К
числу таких же модельных предположений относится последняя
фраза предыдущего абзаца.
Итак, Кумбсом и другими учеными было показано, что
исходные данные о близостях между объектами не только могут быть
собраны (то есть быть вполне адекватными и даже лучшими по
своему качеству, чем данные, полученные более традиционными
способами), но и должны собираться, если у исследователя есть
желание эффективно находить то признаковое пространство, в
котором респонденты мыслят рассматриваемые объекты, определяя
свое поведение по отношению к ним.
Как уже отмечалось выше, поиск пространства восприятия —
основная задача, на решение которой направлено МШ. И делает
это большинство соответствующих алгоритмов с помощью
анализа матрицы близостей (исходящей от респондентов) между
шкалируемыми объектами. Но возможна опора и на другие виды данных.
В частности, ниже мы покажем, как требующаяся для построения
пространства восприятия информация может быть извлечена из
обычных ранжировок (неметрическое многомерное
развертывание). Выбор конкретного способа сбора данных в значительной
мере ложится на плечи исследователя. И для анализа данных
любого подходящего вида существует много алгоритмов. Выбор
конкретного алгоритма также остается за исследователем.
Описание основной задачи, решаемой с помощью МШ, пока
носит весьма приблизительный характер.
0т пространства «объект-признак» к другим видам исходных данных 21
Мы оставили в стороне целый ряд весьма важных для
социолога вопросов: используем ли мы данные о близостях, полученные
от каждого респондента, или как-то усредняем информацию,
полученную от разных лиц? Что делать, если в строящемся
пространстве не удается в точности сохранить все соотношения между
близостями? Что такое близости с формальной точки зрения — по
каким шкалам они получены, могут ли они как-то быть
соотнесены с тем, что в математике называется расстоянием?
Вряд ли социолог может грамотно использовать
математический аппарат МШ, не умея отвечать на подобные вопросы.
Чтобы показать, каким образом может быть осуществлен
поиск ответов, перейдем к следующей теме — формальной
постановке задачи.
Тема 2. ОСНОВНЫЕ ЭЛЕМЕНТЫ ФОРМАЛИЗМА
Основная идея классического МШ.
Евклидово расстояние. Евклидово пространство.
Общее представление о функции стресса
Итак, предполагаем, что исследователя интересует отношение
какой-то совокупности людей к некоторым объектам:
а,,а2, ...,ап. (1)
Исходными данными для самого распространенного,
«классического» варианта МШ служат близости между этими объектами.
Пусть s;j = s (a;, ар — каким-то образом измеренная близость
между объектами ai и &.} (i = 1,..., n; j = 1,..., п)1. И пусть исходные
эмпирические данные представляют собой совокупность таких
близостей, заданных в виде матрицы
II % II-
Если вместо близостей будут заданы различия между
объектами, то элементы соответствующей матрицы будем обозначать
через 8Г, а всю матрицу — через
II 5, ||.
Ниже речь пойдет о матрице близостей, но иногда будет
затрагиваться и матрица различий.
Надо помнить, что близости и различия — величины, в
определенном смысле обратные друг к другу: чем больше близости, тем
меньше различия. Если измерить близости (различия), то на их
основе легко искусственно построить различия (близости) (ска-
1 Буква s — первая буква слова similarity — сходство.
nrnriRHbie элементы формализма
29
жем если близости s^ будут изменяться от 0 до 1, то в качестве
различий можно взять разности 5^ = 1 - s-).
Работу МШ схематически, на «кибернетическом» языке (вход-
выход «черный ящик» посередине; «черный ящик» при этом
ассоциируется с теми модельными представлениями, которые
объясняют, каким образом «вход» должен быть связан с «выходом»),
можно изобразить следующим образом (рис. 1).
Вход
Матрица близостей || s;j ||
со своей структурой
близостей (например,
может иметь место
соотношение s17< s27)
Выход
модель Признаковое пространство,
► в котором те же объекты
представлены точками1;
структура соответствующей
матрицы расстояний || d. ||
отвечает структуре матрицы
близостей (в частности,
должно быть d|7 > d21Y
2 +
, а7
а,
Рис. 1. Принцип действия простейшего алгоритма МШ
Другими словами, алгоритм МШ ищет такое числовое
признаковое пространство (термин «числовое» означает, что каждой оси
отвечает шкала, тип которой не ниже типа интервальной шкалы)
Выражение «объекты представлены точками в пространстве» означает, что
Для каждого объекта заданы координаты соответствующей ему точки. Объекты
обозначаются теми же буквами, что и отвечающие им точки.
Буква d — первая буква слова distance — расстояние.
30
Тема 2'
и такое расположение рассматриваемых объектов в этом
пространстве (на «выходе» задаются координаты всех точек-объектов), что]
структура расстояний между этими объектами отвечает структуре ]
исходной матрицы близостей. Термин «отвечает» трактуется
довольно сложно.
Пока нужно отметить следующее. В алгоритме задается
некоторый критерий различия матрицы близостей и матрицы
расстояний. Этот критерий называется функцией стресса1 (более
подробно о ней см. ниже); эта функция изменяется от 0 до 1: равна нулю
при полном сходстве структур матриц и тем ближе к 1, чем это
сходство меньше. Компьютер выдает значение этого критерия.
Реализация алгоритма обеспечивает то, что среди всех возможных
расположений точек в пространстве с заданным количеством осей I
находится такое, при котором функция стресса принимает
минимальное значение. Алгоритм гарантирует то, что, как бы мы ни
старались расположить точки по-другому, нам не удастся сделать
так, чтобы значение функции стресса было меньше2.
Несколько слов требуется сказать о том, сколько
координатных осей имеет найденное пространство, то есть о размерности
последнего. Подробнее об этом речь пойдет ниже (следует также
отметить, что выбор количества осей — дело довольно трудное).
Иллюстрируя обсуждаемые положения с помощью рисунков,
мы будем полагать, что размерность рассматриваемого
пространства равна двум. Но делать это мы будем только в силу един-
1 Собственно, термин «функция стресса» впервые был использован Краска-
лом для обозначения введенной им меры расхождения между структурами
матрицы близостей и матрицы расстояний в случае неметрического многомерного
шкалирования. В данном случае это формула (6), см. Тему 3, а также с. 126.
2 В действительности дело обстоит не столь блестяще. Мы описали
идеальную ситуацию, к которой стремятся все разработчики алгоритмов МШ. Однако,
к сожалению, большинство алгоритмов обладают определенными недостатками,
по причине которых у исследователя не может быть стопроцентной гарантии
того, что нельзя так изменить расположение объектов в искомом пространстве,
чтобы функция стресса приняла меньшее значение. Но в настоящей работе мы
не будем касаться этих вопросов (см., однако, с. 129).
рсирриир^лементы формализма
31
ственной причины — трехмерное пространство и тем более
пространство еще большей размерности очень трудно изобразить на
бумаге.
Заметим, что процесс реализации любого алгоритма МШ — это
процесс измерения: мы действительно находим значения каких-
то переменных (отвечающих осям нашего пространства) для
исходных объектов. Поэтому эти объекты ниже мы будем иногда
называть шкалируемыми объектами (напомним, что
шкалирование — частный случай измерения).
Итак, несколько упрощая ситуацию, можно сказать, что при
использовании МШ «на входе»—матрица близостей, «на выходе» —
матрица расстояний со сходной структурой. Расстояния между
точками рассматриваемого пространства обычно рассчитываются так,
как этому обучают в школе: на основе теоремы Пифагора. Такое
расстояние называют евклидовым. Напомним его точное определение.
Пусть заданы какие-то две точки а и b двумерного евклидова
пространства. И пусть эти точки имеют координаты,
изображенные на рис. 2.
2-
h
■
rh
а
►
а, Ь, 1
Рис. 2. Пример расположения двух точек а и b в двумерном
евклидовом пространстве
Заметим, что здесь несколько изменены обозначения. Вместо
символов а, и а2 для обозначения точек рассматриваемого
двумерного пространства используются буквы а и Ь, а координаты этих
32 Тема ?
точек обозначаем одноименными буквами с индексами,
отвечающими номерам осей: а = (ар а2), b = (bp b2). Для того чтобы
указанные координаты не путались с обозначениями объектов из
последовательности (1), координаты пишутся курсивом.
Тогда евклидово расстояние между этими точками будет
вычисляться по формуле:
DeBKJI(a, Ь) = V(a,-b,)2+(a2-b2)2.
Формула легко обобщается на тот случай, если количество осей
пространства больше двух. Так, если размерность пространства
равна к, то точки будут иметь следующие координаты:
а = (а„ а2,..., ак) и b = (bp b2,..., bk),
и евклидово расстояние между ними выразится по формуле:
Оевкл (a,b) = >/(a,-b1)2+(a2-b2)2+...+ (ak-bk)2.
Пространство, в котором расстояния между точками
вычисляются по приведенной формуле, называется евклидовым (ниже
будет рассматриваться ситуация, когда имеет смысл использовать и
неевклидово расстояние и, стало быть, неевклидово пространство).
Пока не будет оговорено противное, будем полагать, что в
результате МШ получается евклидово пространство (другими словами, то
пространство, в котором мы отображаем наши объекты, точки
которого служат моделями этих объектов, является евклидовым). Итак,
предположим, что мы применили алгоритм МШ к некоторой
матрице близости и получили пространство, условно изображенное на
рис. 1. Встает вопрос об интерпретации полученного результата.
В основе такой интерпретации лежат следующие рассуждения.
Предполагается, что наши эмпирические данные — оценки
исходных близостей — так или иначе исходят от респондентов.
То есть, сообщая исследователю соответствующую
информацию (не важно, как — прямо, в результате опроса, или косвенно,
предоставляя материал для наблюдений, и т. д.), респондент как бы
руководствуется расположением объектов в некотором латентном
OcHQBHbiejj^MgHTN формализма
33
анстве восприятия. И если исследователю удалось найти
какое-то пространство, в котором структура расстояний между
точками-объектами та же самая, что структура исходных близостей, то
можно предположить, что найдено то самое пространство
восприятия Предположение это — довольно сильное и, вообще говоря, не
очевидное (может быть, та же структура расстояний имеет место
для какого-то пространства, отнюдь не являющегося пространством
восприятия). Но... другого нам не дано.
Далее следует проинтерпретировать оси.
Для интерпретации каждой из них проектируем на нее все
рассматриваемые точки и, опираясь на свое знание объектов,
пытаемся понять, каким должно быть то свойство, которое отвечает
оси, если объекты расположились именно указанным образом. При
этом надо учитывать, что мы имеем дело с числовым
пространством, то есть предполагаем, что каждой оси отвечает шкала, тип
которой не ниже типа интервальной шкалы.
Это означает, что требуется учитывать структуру интервалов
между проекциями наших объектов. Если, к примеру, проекции
точек, отвечающих трем шкалируемым претендентам на
рассматриваемую должность, расположились вдоль интерпретируемой
оси так, как расположились проекции точек, отвечающих
объектам с номерами 1, 7,2, то, во-первых, наблюдается некий порядок
объектов. И приходим к выводу, что этот порядок отвечает,
скажем, возрасту претендентов, которым 30,40 и 50 лет
соответственно. Первое желание — интерпретировать ось как возраст. Однако
анализ соотношений между интервалами позволяет отвергнуть
такое предположение, поскольку различие первого и седьмого
претендентов по возрасту равно различию седьмого и второго
(40 - 30 = 50 - 40 = 10), а соотношение между интервалами
соответствующих точек-проекций на рассматриваемую ось имеет
совсем другой вид: различие между первым и седьмым примерно
в три раза больше различия между седьмым и вторым.
Представим себе, что мы анализируем различные
характеристики претендентов далее и, к примеру, оказывается, что их
ежемесячные доходы, равны соответственно 20,35 и 40 тыс. руб. Теперь
Основы многомерного шкалирования
34
Тема 2
мы имеем полное право интерпретировать первую ось как ось до-[
хода. Заметим, однако, что если вдруг выяснится, что рост претен-|
дентов равен, скажем, 180, 189 и 192 см, то мы уже будем в заме-,
шательстве и без какой-либо дополнительной информации (без
обращения к респондентам с лобовым вопросом о том, чем они1
руководствуются, выбирая того или иного претендента, или, к
примеру, выяснения, знают ли они что-либо о доходах претендентов)'
уже никак не сможем выбрать, что лучше: считать первую ось осью
дохода или осью роста (рис. 3).
1,2
*а7
та2
1 7 2 1
Рис. 3. Проектирование точек объектов, изображенных на рис. 1,
на первую ось с целью интерпретации последней
Следует обратить внимание на то, что на рис. 1 между
«входом» и «выходом» над стрелкой, означающей переход от первого
ко второму, стоит слово «модель».
Оно означает совокупность априорных исследовательских
предположений, лежащих в основе того математического
алгоритма, который позволил перейти от матрицы близостей к
признаковому пространству. В этом алгоритме много чисто математической
специфики (алгоритмы МШ сложны, базируются на довольно
громоздких математических построениях), однако ряд формальных
элементов алгоритма самым непосредственным образом
связаны с содержательным пониманием решаемой задачи, и поэтому
должны быть известны социологу: он должен четко выразить свое
псиные элементы формализма
35
отношение к этим элементам, четко понять, отвечают ли они
имеющимся у него представлениям о характере изучаемого явления.
Под элементами формализма в первую очередь
подразумевается строгое понимание расстояний и близостей (оказывается, здесь
есть о чем говорить — отнюдь не любой набор чисел может
служить расстояниями либо близостями), а также соответствия
между структурами отвечающих им матриц (по сути, речь пойдет о
точном выражении функции стресса).
Функция расстояния
(аксиоматическое определение)
Понятие функции расстояния используется во многих методах
анализа данных. Наиболее активно оно применяется в методах
классификации объектов. Как уже указывалось, задействовано оно и в МШ.
Рассмотрим совокупность объектов (1).
Функцией расстояния называется двуместная функция d (а,, а2),
в качестве аргументов которой служат объекты совокупности (1),
и такая, что для всех i, j, k (= 1,..., п) удовлетворяется следующая
система соотношений (аксиом):
d (as, а.) = 0 в том и только в том случае, если объекты а( и а}
совпадают (рефлексивность расстояния);
d (aj> &j) = d (aj, a{) (симметричность расстояния);
d (ap a.) + d (aj; ak) > d (a, ak) (правило треугольника; \ (2)
такое название указанная аксиома получила вследствие того,
что она по существу говорит о том, что сумма двух сторон
треугольника не может быть меньше третьей).
Следует отметить, что перечисленные свойства являются
привычными, знакомыми каждому человеку, окончившему среднюю
школу. Всем эти свойствам удовлетворяет, например,
определенное выше евклидово расстояние — единственное расстояние, с
которым знакомятся в школе.
Поэтому очень трудно бывает представить себе, что эти свой-
Ства могут не выполняться. Тем не менее такая возможность отнюдь
з*
36
Тема
не является экзотичной для социологии. Причина в том, что здес.
объекты представлены точками не в геометрическом пространстве
а в социометрическом1.
И совсем не очевидно то, что свойства, связанные с расположе
нием точек на плоскости, которые выявляли древние греки (напри
мер, Пифагор и Евклид), рисуя палкой на песке или раскладывая на
земле камушки, должны совпадать со свойствами социальных
объектов, задаваемых какими-то своими характеристиками.
И подобные рассуждения отнюдь не являются пустыми. Все три
аксиомы могут нарушаться в социометрическом пространстве. |
Это можно продемонстрировать с помощью полуинтуитивного1
рассмотрения некоторых примеров, не вводя строгих критериев. ]
Рассмотрим первую аксиому из системы (2). Вполне может
оказаться, что с содержательной точки зрения будет иметь смысл
такое понимание близости между двумя респондентами, в
соответствии с которым два респондента тем более близки, чем в большей
мере они взаимно симпатизируют друг другу. При этом
утверждается, что в таком случае существуют люди, далекие сами от себя —
не любящие себя, постоянно недовольные собой, критикующие и
даже ненавидящие себя. Подобного рода люди-«самоеды» не так
уж редко встречаются в жизни.
Переходя к обсуждению второй аксиомы из (2), уместно
рассмотреть следующий пример.
Каким образом можно измерять «социологическое» расстояние
между городами? Сегодня никто не ходит из города в город
пешком. Поэтому такое расстояние нет смысла выражать километрами.
Если при решении какой-либо социологической задачи встает
вопрос о том, может ли тот или иной человек «преодолеть»
расстояние между какими-либо городами, то здесь, очевидно, следует
обратиться не к анализу физических возможностей этого человека,
а скорее к выяснению того, имеются ли у него деньги на покупку
билета (известно, что связи между многими родственниками—быв-
1 Здесь речь идет о социометрии в некотором абстрактном широком смысле,
а не в том смысле, который принят в литературе и который обычно связывается
с именем Морено и с изучением малых групп.
CnrPMkipjneMeHTbi формализма
37
тиими гражданами СССР в настоящее время нарушены именно
в силу их материальной необеспеченности). Другими словами,
«социологическое» расстояние имеет смысл измерять с помощью
денежных единиц. Вот тут-то и может нарушиться свойство
симметричности расстояния: стоимость билета от Москвы до Киева одна,
а от Киева до Москвы—другая. Расстояние «туда» может быть для
какого-то человека относительно малым (хватит денег на билет),
а «обратно» — большим (денег на билет не хватит).
И, наконец, правило треугольника (третья аксиома из системы (2)).
Это — самое «болезненное» (для социолога) свойство. Когда
исследователь, опираясь на неформальные рассуждения, пытается
выразить свое представление о расстояниях между объектами (а это
требуется в очень многих алгоритмах классификации, а иногда—ив МШ),
он обычно интуитивно соблюдает первую и вторую аксиомы из (2).
Привыкнув с детства к геометрии, исследователь даже в
подсознании не мыслит себе такой способ измерения расстояний
между объектами, который был бы нерефлексивным и
несимметричным. А вот правило треугольника, как менее очевидное, им часто
не учитывается. В результате «хорошее» (с содержательной точки
зрения) расстояние становится непригодным.
Почему все-таки нельзя допустить практическое использование
функций расстояния, не удовлетворяющих правилу треугольника?
Может быть, требования выполнения этого условия —
«игрушки» математиков, а социологу это и ни к чему? Конечно, это не
так. Это можно продемонстрировать на примере использования
Функции расстояния в процессе классификации
(классифицировать объекты часто требуется при интерпретации результатов МШ,
см. с. 84; кроме того, применение МШ может и не быть
окончательной целью исследования: как и всякое шкалирование, МШ
требуется в первую очередь для того, чтобы затем анализировать
объекты в рамках найденной системы координат).
Предположим, что для используемой функции расстояния
не выполняется правило треугольника: для каких-то трех объек-
Тов а, Ь, с выполняется соотношение
d (a, b) + d (b, с) < d (а, с). (3)
Большинство методов классификации, грубо говоря, «устро
ены» так, что объекты, расстояния между которыми не превыша |
ет некоторого порога, попадают в один класс, а объекты, расстоя
ние между которыми превышает порог, — попадают в разны.
классы.
Если предположить, что расстояния d (a, b) и d (b, с) мень
ше выбранного порога, а расстояние d (а, с) — больше этого по '
рога, что вполне может быть именно из-за нарушения правига
треугольника, то объект а попадет в тот же класс, что и объект Ь,
объект с — в тот же класс, что и объект Ь, а объекты а и с долж '
ны попасть в разные классы. Налицо явное логическое проти-,
воречие, компьютер может «сломаться» в попытках его
разрешения.
Что же делать? Имеет ли смысл вообще «изгнать» из
рассмотрения функции расстояния, не удовлетворяющие правилу
треугольника?
Вряд ли это разумно, поскольку, как уже отмечалось,
содержание социологических задач часто требует использования именно
таких «нехороших» функций расстояния. Анализ этих
«нехороших» функций, однако, показывает, что правило треугольника для
них все же выполняется, но в несколько ослабленном варианте:'
соотношение (3) для них может иметь место, но при этом величи-1
ны d (a, b), d (b, с), d (а, с) должны быть величинами одного поряд-1
ка. Левая часть соотношения (3) может быть лишь ненамного мень-'
ше правой части. Это приведет к тому, что описанное выше
противоречие, возникающее в процессе классификации, легко
может быть преодолено: стоит лишь немного увеличить порог
различимости и объекты а и с будут попадать в один класс
(естественно — в тот, куда попал объект Ь)1.
1 На практике при классификации объектов никогда не задается некий
единственный, заранее известный порог различимости. Напротив, обычно алгоритмы
бывают устроены таким образом, чтобы исследователь имел возможность
сравнить целый ряд классификаций, полученных при разных порогах, и выбрать ту.
которая в наибольшей степени отвечает его априорным представлениям о том,
какого типа классификацию он ищет.
Таким образом, если использовать какую-то функцию для
измерения расстояния, следует в первую очередь проверить для нее
первое и второе соотношения из (2) и либо правило треугольника,
либо его ослабленный вариант1.
Формальное определение близостей
Понятие близости по самой своей сути должно быть менее
формализованным, чем понятие функции расстояния, поскольку
величина близости так или иначе получается непосредственно от
респондента. А к такой информации, естественно, должно
предъявляться меньшее количество формальных требований. Тем не
менее полное отсутствие каких бы то ни было требований не может
привести ни к чему хорошему.
Итак, близостью называется двуместная функция s (a, a.) (= s;.),
в качестве аргументов которой служат объекты совокупности (1),
и такая, что для всех i, j, k (= 1,..., п) удовлетворяются
соотношения (аксиомы):
s (а, а) > s (а., а) (это свойство означает, что объект
к самому себе ближе, чем к любому другому объекту);
s (ai> aj) = s (а, а) (симметричность близости);
для больших значений s (а, а) и s (a., ak) величина s (а(, ак)
имеет по крайней мере тот же порядок \ (4)
(ослабленное правило треугольника: оно означает,
что если i-й и j-й объекты, равно как j-й и k-й, близки
ДРУГ к другу, то i-й и k-й не могут слишком сильно
отличаться друг от друга).
Аналогичные аксиомы можно было бы ввести для различий 8;.
Доказано, что ослабленному варианту правила треугольника удовлетворя-
> в частности, коэффициент корреляции, используемый в качестве функции
сст°яния в одном из алгоритмов классификации, задействованном в известном
пакете SPSS [Толстова, 1977].
ULnwuM-"
Формальные аспекты МШ,
затрудняющие интерпретацию его результатов:
проблемы определения размерности искомого
евклидова пространства, вращения
определяющих его осей координат
Ряд проблем при интерпретации результатов многомерного
шкалирования возникает из-за того, что сама постановка задач!
не позволяет однозначно определить вид координатных осей
искомого признакового пространства. ,
От алгоритма требуется только одно: чтобы он обеспечил
максимально возможное соответствие между исходной матрицей
близостей и той матрицей расстояний, которая рассчитывается для
найденного расположения точек (моделей объектов) в
упомянутом пространстве. Почему же при такой постановке задачи
невозможно однозначно задать оси?
Во-первых, компьютер не может точно определить размерность
пространства. Нетрудно понять, что величина функции стресса
будет тем меньше, чем больше размерность того пространства
в которое помещаются объекты1.
1 Чтобы лучше понять этот факт, полезно было бы обратиться к
рассмотрению одного из известных методов шкалирования — одномерному
развертыванию (метод описан, например, в работе [Толстова, 1998, с. 147-161]). Правда,
модель многомерного развертывания (о которой пойдет речь ниже, см. Тему 5
не совсем похожа на ту, которая рассматривается в данном примере. Однако эт
обстоятельство не должно помешать использовать анализ логики одномерного
развертывания для иллюстрации обсуждаемого положения. Нетрудно убедиться
(проанализировав, например, ситуацию, подробно описанную в названной
работе), что при использовании одномерного развертывания не так-то просто
расположить объекты на прямой, чтобы между ними сохранились определенные
отношения порядка (речь идет о согласовании ранжировок, данных несколькими
экспертами). Надеемся, что после знакомства с одномерным развертыванием
читатель поймет, что задача намного упрощается, если от одномерного
пространства перейти, скажем, к двумерному (располагать точки не на прямой, а на
плоскости). Еще проще будет соблюсти все необходимые требования, если от
плоскости перейти к трехмерному пространству и т. д.
Если размерность искомого пространства будет примерно
равна количеству шкалируемых объектов, то всегда можно будет
добиться того, чтобы функция стресса равнялась нулю. Однако
количество объектов обычно бывает равным нескольким десяткам,
и если мы найдем, скажем, 40-мерное пространство, то вряд ли
сможем хорошо проинтерпретировать найденные оси. Нам
захочется «сжать» это пространство, для того чтобы появилась реальная
возможность расценивать оси координат как латентные
переменные, обусловливающие восприятие респондентами
рассматриваемых объектов1.
Каков же выход из положения? Как преодолеть противоречие
между двумя требованиями: желанием одновременно иметь и
малую размерность искомого пространства, и малое значение
функции стресса? Четкого ответа на этот вопрос нет в принципе.
Иногда в литературе даются некоторые рекомендации,
опирающиеся на имеющийся исследовательский опыт.
Так, предлагается определенным образом анализировать
характер кривой, выражающей зависимость значения функции стресса
от размерности пространства. Если находится такое значение
размерности, в котором происходит как бы «перелом»
соответствующей кривой (до этого значения величина функции стресса резко
падала, а после начала убывать медленно), то такую точку
предлагается считать искомой2.
Но, вообще говоря, при определении размерности искомого
пространства исследователь должен «лавировать» между «сцил-
Здесь идет речь о проблеме понимания термина «закономерность». Поиск
пространства восприятия — это поиск статистической закономерности. А само
понятие закономерности неразрывно связано с возможностью человеческого мозга
(.имеется в виду мозг исследователя) воспринимать нечто как таковую. Если
найдется 3-хмерное пространство—возможно, исследователи будут считать, что сде-
али социологическое открытие, найдется 40-мерное пространство —обязатель-
0 будет предполагаться, что задача не решена. О соответствующих рассуждениях,
асающихся общей трактовки понятия статистической закономерности в
социологии см. [Толстова, 2000, с. 26-30].
2 См., например, [Малхотра, 2003, с. 784].
42
Тема
43
лой» и «харибдой», найдя в итоге такую ситуацию, когда и раз
мерность пространства небольшая (3-5 осей), и функция стресс,
«сносная» (достаточно близка к 0), и интерпретация удачная. Си
туация типичная для анализа данных: все строится на постояннол
человеко-машинном диалоге. Отметим, однако, что в статистщ >
нечисловых данных разработаны методы состоятельного оцени
вания размерности пространства (см. Приложение 2).
В заключение обсуждения вопроса о размерности искомого
пространства важно напомнить, что, как уже отмечалось выше,
в большинстве случаев восприятие людьми любых объектов явля-,
ется многомерным. Крайне редко встречаются случаи, когда
достаточно адекватным окажется расположение объектов в
одномерном пространстве. Это всегда надо иметь в виду при интерпретации
и определении размерности искомого пространства восприятия.
Во-вторых, оси пространства всегда бывают определены лишь
с точностью до поворота (такое положение дел роднит МШ с
факторным анализом). Объясняется это тем, что при повороте осей
расстояния между объектами не меняются. И если найдено
удовлетворительное расположение объектов в пространстве (то есть
такое расположение, при котором соответствующая матрица
расстояний в достаточной мере сохраняет структуру исходной
матрицы близостей) с каким-то набором осей координат, то оно
останется столь же хорошим при любом повороте осей вокруг начала
координат (ведь расстояния между объектами остаются теми же,
от поворота они не меняются). Интерпретации же осей при
разных поворотах могут сильно отличаться друг от друга.
Ситуация иллюстрируется рис. 4. На нем изображена та же
ситуация, которая фигурировала на рис. 1 и 3. Нетрудно увидеть, что
при повороте осей, то есть превращении оси 1 в ось Г, а оси 2
в ось 2', с расстояниями ничего не произойдет.
Если оси адекватно отражали эмпирическую матрицу
близостей, то и дальше будет то же самое. А вот интерпретация может
стать другой.
Если при проектировании объектов на ось 2 объекты aj и а2
отобразились в одну точку, не совпадающую с проекцией объекта а7,
Основные^леменг^
проектировании тех же объектов на ось 2' объектам а, и а2
б°лут отвечать разные точки, причем различие между проекция-
о и я будет больше, чем различие между проекциями а2 и а7.
Ясно что оси 2 и 2' отвечают разным свойствам объектов, то есть
по-разному интерпретируются.
Рис. 4. Роль вращения осей в процессе интерпретации результатов МШ
(оси 1 и 2 с рис. 1 и 2 при вращении перешли в оси V и 2'
соответственно)
Какой же поворот выбрать? Как и выше (при рассмотрении
вопроса об определении размерности искомого латентного
пространства), здесь оказывается невозможно дать четкий ответ. Можно
«заставить» компьютер предоставлять координаты
точек-объектов при разных поворотах осей (скажем, постепенно поворачивать
оси и выдавать результат через каждые 30°) и пытаться
проинтерпретировать результаты при каждом повороте. Остановиться
можно будет тогда, когда интерпретация окажется удовлетворитель-
44
Тема
1 Автору неизвестны примеры подобного рода, связанные с применением МШ.
Однако можно назвать пример удачной интерпретации при разных поворотах
осей, получившихся в результате применения факторного анализа
[Интерпретация и анализ... с. 226—234]. Там выявлялись латентные факторы, определяющие
отношение студентов к стилю работы преподавателей. При одном повороте осей
автору удалось интерпретировать их как некие переменные, связанные с
когнитивным восприятием студентами работы преподавателей, а при другом — как
переменные, связанные с эмоциональным восприятием того же самого.
2 Автор назвал эти способы методами соответственно главных компонент,
максимального расстояния, центров, максимальной корреляции. Исчерпывающее
изложение этой теории выходит за рамки выбранного для настоящей методики
жанра (оно потребует описания сравнительно сложного математического
аппарата, не входящего непосредственно в понятие МШ). Об интерпретации резуль
татов применения МШ речь пойдет в Теме 7.
(такой перенос называется сдвигом осей). О вращении уже
говорилось выше.
Было показано, что возможность вращения представляет собой
проблему, поскольку в результате вращения осей, вообще говоря,
изменяется интерпретация (может измениться даже порядок
расположения точек на координатной оси, не говоря уж об
изменении структуры интервалов между проекциями). А вот если оси
параллельно, без изменения угла наклона (без вращения), просто
переносятся в другое место пространства, то проблемы изменения
интерпретации не возникает. Дело в том, что, имея дело с
интервальной шкалой (а в данном случае мы полагаем, что каждой оси
отвечает именно интервальная шкала), мы можем допускать
операцию сдвига, поскольку интерпретация проекций точек при этом
не изменится. Это, в свою очередь, является следствием того, что
операция сдвига входит в число допустимых преобразований
интервальной шкалы1.
Для пояснения заметим, что числа (2, 5, 11) с точки зрения
ситуации, когда мы считаем используемую шкалу интервальной,
отражают ровным счетом ту же информацию о реальности, что и,
скажем, числа (190, 200, 220) (структура интервалов остается
неизменной: интервал между числами, отвечающими второму
и третьему объектам, вдвое больше, чем интервал между
числами, отвечающими первому и второму объектам).
В заключение подчеркнем, что описанные в настоящем
параграфе проблемы — типичные проблемы анализа данных. Именно
наличие подобных проблем делает анализ данных непохожим на
математическую статистику, призванную решать вроде бы
сходные задачи — задачи поиска статистических закономерностей.
Допустимыми преобразованиями интервальных шкал являются не только
операции сдвига, но и так называемые преобразования подобия (умножения всех
шкальных значений на одно и то же число). Они тоже не меняют интерпретации
проекций точек. Но если каждой оси будет отвечать свой множитель, то
структура расстояний может резко измениться. В данном параграфе такая ситуация не
Рассматривается. О ней пойдет речь при обсуждении методов индивидуального
ногомерного шкалирования.
46
Тема 2
В работе [Толстова, 2000, с. 82-94] подробно говорилось о
различии между двумя названными ветвями науки.
В качестве одного из основных различий фигурировало то, что
реализация алгоритмов анализа данных требует постоянного
человеко-машинного диалога. Именно поэтому анализ данных не
может считаться ветвью «чистой» математики. Надеемся, что
читатель хорошо прочувствовал соответствующее качество МШ на
примере решения проблем определения размерности искомого
евклидова пространства и вращения осей.
Тема 3. МЕТРИЧЕСКОЕ И НЕМЕТРИЧЕСКОЕ МШ.
СООТВЕТСТВУЮЩИЕ ФУНКЦИИ СТРЕССА
Многомерное шкалирование с точки зрения
теории измерений
При обсуждении предыдущей темы говорилось об
интервальной шкале и ее допустимых преобразованиях. При этом
предполагалось, что читателю известны соответствующие определения
теории измерений.
Здесь целесообразно вернуться к уже ставшим классическими
положениям этой теории, рассмотреть МШ как процесс
измерения в строгом смысле этого слова.
Использование такого ракурса даст возможность связать МШ
с другими известными методами социологического измерения и
будет способствовать более глубокому пониманию
содержательного смысла самого МШ. И самое главное с практической точки
зрения — позволит понять, почему в МШ выделяются два
мощных направления, указанных в названии темы.
Итак, попытаемся четко представить себе процесс реализации
методов МШ с точки зрения принципов теории измерений [Суп-
пес и Зинес, 1967; Пфанцагль, 1976]. Говоря точнее, мы имеем в
виду использование широкого определения измерения в смысле
[Толстова, 1998, с. 192-195].
Напомним, что в самом общем виде социологическое
измерение есть отображение типа
ЭС измерение >МС,
гДе ЭС — эмпирическая система, МС — математическая система.
48
Тема 3
Частный случай математической системы — числовая система, ЧС.
Классическим примером измерения может служить одномерное
шкалирование. Об этом подробно говорилось в [Толстова, 1998]. Там
же уделялось большое внимание социологическому анализу
понятий ЭС и МС. Здесь целесообразно кратко повторить некоторые
положения.
Как известно, эта ЭС есть определенная модель реальности.
Это — результат вычленения исследователем того фрагмента
последней, который он непосредственно намеревается изучать.
Например, если мы поставили своей целью измерить установку
респондентов по отношению к какому-либо предмету, то в качестве
ЭС будет служить совокупность изучаемых респондентов (это так
называемый множество-носитель ЭС), рассматриваемых только
с точки зрения того, как каждый из них относится к упомянутому
предмету. Мы отвлекаемся от пола, возраста и громадного
количества других свойств изучаемых людей. Респонденты выступают
перед нами как некие «усеченные» особи.
Между людьми как носителями изучаемой установки
существуют определенные отношения.
Так, один человек может относиться к предмету установки так
же, как второй, и не так, как третий. Один может иметь более
положительную установку, чем другой, и т. д.
В результате измерения следует приписать каждому
респонденту число таким образом, чтобы рассматриваемые отношения
между респондентами перешли в соответствующие числовые
отношения. Если два респондента имеют одинаковую установку, то им
должно быть приписано одно и то же число; респондентам с
разными установками должны быть приписаны разные числа. Если
один относится к предмету установки лучше, чем другой, то
первому должно быть приписано большее число и т. д. Другими
словами, следует построить модель ЭС с помощью элементов МС,
смоделировать первую во второй.
Совокупность чисел — шкальных значений — нельзя
отождествить с совокупностью действительных чисел. Это тоже некие
«усеченные» числа.
Метрическое и неметрическое МШ. Соответствующие функции стресса 49
Скажем, вполне может быть, что для них осмысленны, к
примеру, отношения равенства и порядка, но не имеют никакого
смысла отношения типа а - b = с - d. Именно поэтому речь идет о
совокупности шкальных значений как о числовой системе, а не как
о множестве действительных чисел.
Каковы же ЭС и МС в случае МШ?
Ясно, что в МШ носителем ЭС выступает совокупность
рассматриваемых (шкалируемых) объектов, а носителем МС —
точки искомого пространства. Заметим, что здесь речь идет о
нечисловой МС.
Нетрудно понять также, что теми свойствами ЭС (отношений
между составляющими ее объектами), которые мы намереваемся
моделировать с помощью МС, являются отношения близостей
между объектами. И моделироваться они должны с помощью
соответствующих расстояний.
Скажем, если какие-то два объекта ближе друг к другу, чем
какие-то другие два объекта, то расстояние между точками
пространства, отвечающими первым двум объектам, должно быть
меньше, чем расстояние между третьим и четвертым объектами.
Здесь имеются свои сложности.
Так, неясно, что именно следует понимать под
моделируемыми близостями. В идеале это должны быть близости, отвечающие
соответствующим представлениям, существующим в сознании
респондентов. И эти субъективно оцениваемые близости, казалось
бы, отвечают моделируемым свойствам ЭС. Но ведь в процессе
применения алгоритма МШ действия разбиваются как бы на два
этапа. Сначала эти неизвестные близости отображаются в
некоторые числа (скажем, если рассматриваемые объекты — это разные
виды товаров, то близость в соответствии со сказанным выше
оценивается, к примеру, с помощью измерения того, сколько раз
первый товар при продаже заменяется вторым). И уже этим числам
ставятся в соответствие упомянутые выше расстояния.
Получается, что исходя из описанной выше ЭС, которую
можно назвать первичной, строится сначала некая вспомогательная
ЭС — вторичная, имеющая то же самое множество-носитель
4 Основы многомерного шкалирования
50
Тема 3
(совокупность интересующих нас объектов), но, вообще говоря,
другую систему заданных на этих объектах отношений. Если в
первичной ЭС эти отношения непосредственно отражают
гипотетически существующие в сознании респондентов представления о
близостях, то во вторичной — те же отношения предстают перед
нами уже в некотором отраженном, формализованном виде. И
результат такого отражения, вообще говоря, вполне может быть не
совсем адекватным, как бы мы ни старались этого избежать.
Причины очевидны — сложность изучаемых представлений.
Даже при одной и той же первичной ЭС вторичная может быть
определена по-разному.
В частности, числа, ставящиеся в соответствие близостям,
могут быть получены по разным шкалам. Например, если перед
исследователем стоит цель — отобразить с помощью чисел то, что,
на взгляд респондентов, объекты а и b ближе друг к другу, чем
объекты с и d, то близости будут получены по порядковой шкале.
Если же мы, кроме того, сумеем отразить и те ситуации, когда
респонденты полагают, что близости между (а и Ь) и (с и d)
отличаются друг от друга в большей степени, чем близости между (е и f)
и (g и h), то можно будет считать, что близости получены по
интервальной шкале.
Различие описанных ситуаций для социолога очень важно.
Исходные данные, в том числе элементы матрицы близостей, в
социологических задачах могут быть получены по разным шкалам. А
разные типы шкал приводят к разным вариантам МШ.
Анализ описываемого процесса представляется очень полезным
для практической работы социолога. Ведь здесь речь идет о том,
что и каким образом моделируется в процессе исследования.
А формирование адекватного представления о тех моделях,
которые мы зачастую фактически используем, даже не отдавая себе в
этом отчета, равно как и стремление повысить степень
адекватности модели в том случае, когда процесс моделирования
реализуется вполне сознательно, является необходимым условием успеха
любого социологического исследования, ключевым моментом
последнего.
Метрическое и неметрическое МШ. Соответствующие функции стресса 51
Более того, нам представляется, что эффективным любое
исследование может быть только в том случае, если мы его будем
рассматривать как измерение в широком смысле этого слова, то есть
как процесс поэтапного моделирования социальной реальности.
Определение метрического и неметрического
многомерного шкалирования
Как уже было сказано, исходной информацией для
использования МШ является матрица близостей (различий). Совокупность
элементов этой матрицы — это та эмпирическая информация,
которой располагает социолог. Эта информация вполне может быть
получена от человека и как таковая может сопрягаться со
шкалами низких типов. Вопрос о том, по какой шкале получены
элементы матрицы близостей (различий), является принципиальным для
МШ. Ведь одним из ключевых элементов любого алгоритма МШ
является функция стресса, а вид этой функции в принципе не
может быть одинаковым для близостей (различий), полученных по
разным шкалам. Различие функций стресса влечет различие
используемых алгоритмов поиска оптимального расположения
точек-объектов в гипотетическом латентном пространстве.
В соответствии с традицией в данной работе рассматриваются
две ситуации: когда элементы матрицы близостей (различий)
получены по интервальным шкалам и когда аналогичные шкалы
являются порядковыми.
В первом случае МШ называется метрическим (ММШ), во
втором — неметрическим (НМШ).
Впервые различие между метрическим и неметрическим
шкалированиями было проведено Кумбсом, введшим в 1958 году эти
термины.
Подчеркнем важность для социологии НМШ: при изучении
пространства восприятия исследователей чаще всего интересуют
те оценки близостей (различий) между объектами, которые дают
сами респонденты, а человеку очень часто бывает легче дать
порядковую информацию, чем интервальную.
4*
52
Тема 3
Поскольку выделенные подходы отличаются в первую очередь
видом функций стресса, целесообразно рассмотреть эти функции
более подробно1.
Функция стресса в метрическом МШ (ММШ)
В настоящем параграфе речь пойдет не о близостях, а о
различиях между шкалируемыми объектами, поскольку для них
функция стресса выглядит проще.
Если элементы матрицы различий 6;j можно считать числами
(то есть считать их полученными по шкале, тип которой не ниж
типа интервальной шкалы), то осмысленным является
рассмотрение разностей между 5;j и aV. Функцию стресса S в таком случае
естественно строить в соответствии с принципом наименьших
квадратов, добиваясь минимизации выражения:
S= I (V6*)2" (5)
l<i<j<ri
Ясно, что значение этой функции тем меньше, чем ближе каждое
расстояние d. к различию бг. Точное решение задачи МШ
соответствует случаю, когда S = 0, то есть когда для всех i, j (i, j = 1,..., n)
8..= d..
Подчеркнем, что здесь различия 6у нельзя просто заменить
близостями sr, поскольку последние как бы противоположны
расстояниям —чем больше близость между какими-либо объектами, тем
меньше должно быть расстояние между ними. Однако и для
близостей нетрудно написать соответствующее соотношение. К
примеру, для получения функции стресса типа (5) можно s- заменить
показателем несходства объектов 6;.. Такой показатель можно
выразить, например, так:
би^-
и
шаху sy
1 См., например, [Интерпретация и анализ... 1987, с. 175-180; Клигер,
Косолапое, Толстова, 1978, с. 86-98; Типология и классификация... 1982, с. 117-126].
Метрическое и неметрическое МШ. Соответствующие функции стресса 53
функция стресса в неметрическом МШ (НМШ)
Теперь рассмотрим ситуацию, когда элементы матрицы
близостей (различий), то есть величины s;j (6(j) получены по порядковой
шкале (скажем, когда респонденты не оценили близости числами,
а указали только, в каком порядке эти близости расположены:
к примеру, указали, что а, и а5 можно считать самыми близкими,
объекты SLj и а23 — несколько дальше друг от друга, объекты а37
и ам — еще дальше и т. д.
В таком случае функция типа (5) становится бессмысленной
(то есть бессмысленно вычислять разности между числами, если
хотя бы некоторые из них получены по порядковой шкале). В
подобных случаях координаты рассматриваемых объектов ищутся
так, чтобы упорядочение расстояний dr максимально
соответствовало упорядочению, обратному упорядочению близостей sr
(соответствовало бы упорядочению последовательности бг). Критерий
вида (5) должен быть заменен критерием, который измеряет
степень упорядочения d. и последовательности, обратной sr
(последовательности бу). Такой критерий должен быть минимален
(равен нулю) при совпадении названных упорядочений, не должен
изменять своего значения при замене последовательности чисел
{Sy} ({6^}) последовательностью с тем же порядком элементов1.
Из литературы известно много коэффициентов,
удовлетворяющих этим требованиям. Один из самых известных коэффициентов
ввел Краскал (впервые употребив при этом словосочетание
«функция стресса»). Коэффициент носит имя этого ученого и имеет вид:
' Как мы знаем, при работе алгоритмов МШ ищется такое расположение
точек-образов объектов, которое обращает в минимум выбранную функцию
стресса. Естественно, делается это не перебором всевозможных точек пространства
(чего сделать в принципе нельзя), а нахождением таких координат объектов, при
которых производные функции стресса равны нулю (как известно, только в
таких точках может находиться экстремум функции). Это накладывает еще одно
ограничение на функцию стресса: она должна быть непрерывно
дифференцируема по координатам точек рассматриваемого пространства. Однако с развитием
вычислительной техники это ограничение становится все менее существенным.
Ч>- со сноской на с. 83.
54
Тема 3
S =
I (dij-dii)2
| l<i<j<n
I (d,-d)
l<i<j<n
2 ' (6)
/4
где J — среднее значение всех расстояний (L; dy — член
последовательности чисел, называемой «монотонной регрессией членов
последовательности {d^}»; числа da совпадают по упорядочению
с числами s;. и при этом минимально в смысле суммы квадратов
отклоненийЧотличаются от чисел dir Таким образом, величина в
числителе приведенной выше формулы для S показывает,
насколько велико минимальное изменение последовательности чисел {dj,
такое, чтобы их упорядочение совпало с упорядочением чисел s;j.
О монотонной регрессии более подробно см. Приложение 1.
Тема 4. ИНДИВИДУАЛЬНОЕ МНОГОМЕРНОЕ
ШКАЛИРОВАНИЕ
Постановка задачи
До сих пор предполагалось, что искомое пространство
восприятия является одним и тем же для всех изучаемых респондентов.
Однако какая бы социологическая задача ни решалась, с таким
предположением вряд ли можно безоговорочно согласиться.
Пространства восприятия, используемые отдельными людьми, могут
весьма сильно отличаться друг от друга. При этом основания
соответствующих различий тоже могут быть разными.
1. Могут отличаться названия осей искомого признакового
пространства. Так, один респондент в претенденте на должность
президента страны может ценить наличие собственной
экономической платформы и негативное отношение к национализации
крупнейших промышленных комплексов, а другой — умение
навести порядок в стране и хорошее здоровье.
В таком случае целесообразно перед осуществлением МШ
разбить потенциальных респондентов на отдельные группы, для
каждой из которых имеет смысл предполагать сходство
номенклатуры осей пространства восприятия, и осуществлять шкалирование
каждой группы отдельно (отдельно и собирать исходные данные
0 близостях рассматриваемых объектов, и строить
соответствующее латентное пространство).
2. Могут быть различными метрики искомых пространств.
Ниже представлен умозрительный пример, демонстрирующий,
Что означает различие метрик.
Для одного респондента расходы размером (в тыс. руб.) 2 и 3
Сличаются ровно в той же мере, как и 8 и 9.
56
Тема 4
Например, намереваясь купить вместо куртки стоимостью 2
куртку стоимостью 3, он должен затратить ровно столько же
дополнительных усилий, сколько при намерении купить диван
стоимостью 9 вместо дивана стоимостью 8: скажем, проработать 50 часов
сверхурочно при оплате 0,02 тыс. руб. в час.
А для другого респондента имеет место другая ситуация.
Дополнительные деньги он зарабатывает, скажем, путем
биржевой игры и денежных спекуляций. В таком случае
складывается ситуация, когда соответствующие различия между
стоимостями 1 и 4,4 и 9,9 и 16 оказываются равными. Чем больше исходная
сумма, тем меньше усилий надо приложить, чтобы увеличить ее,
скажем, на одну единицу. Нетрудно видеть, что в примере
фигурируют числа, равные квадратам первых натуральных чисел:
1 = 12,4 = 22,9 = 32, 16 = 42.
Используя это обстоятельство, нетрудно прийти к выводу, что
разница между какими-то стоимостями а и b для
рассматриваемого респондента будет отвечать (уа - vb) условным единицам тех
усилий, которые ему надо приложить, чтобы повысить свои
покупательские способности и вместо а тыс. руб. затратить на покупку
b тыс. руб.
Различие между стоимостями в 2 и 3 тыс. руб. для него будет
составлять (-у/3 -\2), то есть примерно (1,7 - 1,4) = 0,3 условной
единицы усилий, а различие между стоимостями в 8 и 9 тыс. руб. —
(>/9 - v8), то есть примерно (3 - 2,8) = 0,2 условной единицы
усилий. Другими словами, переход от 8 тыс. руб. к 9 для нашего
второго респондента (в отличие от первого) более легок, чем переход
от 2 тыс. руб. к 3. Одни и те же различия между числами нашими
респондентами видятся по-разному. Это и есть различие
соответствующих метрик1.
1 В микроэкономике [Пиндайк и Рубинфельд, 1992] разработана модель,
в которой показано, что полезность имеющихся денег измеряется логарифмом
их количества. Имеется в виду, что переход от 1 млн руб. к 2 млн руб. для него
столь же значим, как и переходы от 1 тыс. руб. к 2 тыс. руб., от 100 тыс. к 200 тыс
или от 1 млрд к 2 млрд — в каждом из этих случаев происходит удвоение
капитала.
Индивидуальное многомерное шкалирование
57
Процедура учета метрик, отвечающих отдельным
респондентам, — дело очень сложное. В качестве примера работ,
посвященных соответствующей проблематике, назовем [Крылов, 1988,
1989].
Отметим, что в этих работах, в частности, изучаются
субъективные метрики (строятся соответствующие субъективные
пространства), отвечающие представлениям отдельных респондентов
о временных интервалах между различными событиями их
жизни, о значимости для них различных жизненных ценностей,
отражающие структуру пространства предпочтений предметов
учебного цикла старшими школьниками.
3. Список осей пространства восприятия для всех
рассматриваемых респондентов считается одинаковым, а метрики —
разными. Однако мы выдвигаем гипотезу, что различие метрик
возникает только за счет того, что разные респонденты придают разные
веса разным осям.
Скажем, два человека оценивают кандидата на должность
президента с двух точек зрения — с точки зрения отношения
претендента к частной собственности на землю и с точки зрения его
здоровья. Однако первый респондент полагает, что точка зрения на
частную собственность — дело очень важное (и соответствующей
пространственной оси придает большой вес), а состояние
здоровья — дело второстепенное (и оси, отвечающей здоровью,
придает малый вес), а второй респондент—наоборот. Для поиска таких
весов и предназначен метод индивидуального многомерного
шкалирования.
Рассмотрим этот подход более подробно1.
Вид входных данных
Предполагается, что на «входе» несколько разных матриц
близостей вида || s ^Ц, где i = 1, ..., n; j = 1, ..., п; 1 = 1, ..., N;
' См. [Интерпретация... 1987, с. 180-181; Клигер, Косолапое,Толстова, 1978,
с- 98-101; Типология и классификация... 1982, с. 131-142; Терехина, 1978].
58
Тема 4
n — количество рассматриваемых объектов, N — количество
матриц. Каждая матрица может отвечать одному человеку, а
может отражать и мнение группы людей (скажем, являться
результатом усреднения нескольких матриц, отражающих взгляды
примерно одинаково смотрящих на жизнь респондентов).
Предположим для примера, что одна входная матрица
близостей отвечает одному респонденту (а не группе респондентов,
как нередко имеет смысл полагать на практике). Предположим
также, что в нашей задаче имеется только три шкалируемых
объекта: 1,2,3. Пусть первый респондент полагает, что из трех
рассматриваемых объектов ближе всего друг к другу объекты 1 и 2,
подальше — объекты 2 и 3, еще дальше — объекты 1 и 3. Второй же
рассуждает по-другому. С его точки зрения, ближе всего были
кандидаты в президенты 1 и 3, подальше — 1 и 2, еще дальше —
претенденты 2 и 3.
Пользуясь далее алгоритмом индивидуального многомерного
шкалирования, мы полагаем, что упомянутое различие
представлений о близостях у двух респондентов объясняется не просто
случайностью, а именно тем, что эти респонденты приписывают
разный вес рассматриваемым осям координат пространства
восприятия, но что оси эти являются для обоих респондентов одними
и теми же (скажем, такими, какие были описаны выше).
Вид выходных данных
Компьютер «перерабатывает» те N матриц близостей, которые
поступают к нему «на вход», и выдает:
1) общее для всех матриц расположение объектов в некотором
k-мерном признаковом пространстве;
2) для каждой (1-й) матрицы || s у'|| — набор действительных
чисел (wn w12,. -., wlk), являющихся весами рассматриваемых
координатных осей, отвечающих этой матрице.
Тогда ситуацию с наличием весов, воспользовавшись
упомянутым выше примером, можно описать, например, следующим
образом. Все положения иллюстрируются рис. 5.
Индивидуальное многомерное шкалирование
59
Здоровье
кандидата
Отношение кандидата к частной 1
собственности на землю
Рис. 5. Иллюстрация работы алгоритма индивидуального шкалирования
Черными кружочками задано расположение рассматриваемых трех
объектов, полученное в результате работы алгоритма.
Черными квадратиками задано расположение тех же объектов с
точки зрения первого респондента, матрице близостей которого отвечают
веса (2; 0,5). Звездочками задано расположение тех же объектов с точки
зрения второго респондента, матрице близостей которого отвечают веса
(0,5; 2). Треугольники отвечают расположению объектов с точки зрения
каждого респондента в отдельности.
Компьютер выдал такое «безличное» расположение объектов
в двумерном признаковом пространстве, которому на рис. 5
отвечают черные кружочки. Затем для каждого респондента был выдан
отвечающий ему индивидуальный набор весов (каждой оси
отвечает свой вес). Матрице, отвечающей первому респонденту (I = 1),
были приписаны, к примеру, веса (w,, = 2; w12= 0,5). Матрице,
отучающей второму респонденту (1 = 2), - веса (w21 = 0,5; w22 = 2).
Предположим, что, интерпретируя оси традиционным образом,
Удалось показать, что первая ось действительно может
рассматриваться как ось, отвечающая отношению кандидата к частной
60
Тема 4
собственности на землю (левая часть оси отвечает
положительному отношению, правая — отрицательному), а вторая ось — как
ось, отвечающая здоровью претендента на должность (нижняя
часть соответствует хорошему здоровью, верхняя — плохому).
Анализируя веса, можно увидеть, что гипотеза о весах
подтвердилась. Хотя оси пространства восприятия для обоих
респондентов одинаковы, но для первого респондента первая ось в четыре
раза важнее, чем вторая (координаты всех объектов по первой оси
для этого респондента по сравнению с «нейтральным», полученным
первоначально компьютером вариантом, умножаются на 2, то есть
вдвое увеличиваются, а координаты по второй оси — умножаются
на 0,5, то есть вдвое уменьшаются), а для второго респондента —
напротив, вторая ось в четыре раза важнее, чем первая.
Чтобы понять, каким видится расположение объектов (в
найденном пространстве восприятия) первому респонденту, сделаем
следующее: в соответствии с набором весов, отвечающим первой
матрице близостей, все координаты объектов по первой оси
увеличим в два раза (умножим на вес 2), а все координаты по второй
оси уменьшим в два раза (умножим на вес 0,5). Нетрудно видеть,
что рассматриваемые три объекта переместятся в пространстве
и займут места, отвечающие черным квадратикам. Треугольник,
соединяющий эти квадратики, говорит о соотношении расстояний
между объектами, которое имеется в сознании первого
респондента: сторона между объектами 1 и 2 — самая короткая, сторона
между объектами 2 и 3 — побольше, сторона между объектами 1 и 3 —
самая длинная. Такое соотношение расстояний отвечает тем
соотношениям между близостями, которые отвечали исходной
информации, поступившей от первого респондента. Значит, упомянутый
треугольник отвечает той метрике, которая при сборе этой
информации фактически имелась в сознании первого респондента.
Аналогичным образом нетрудно убедиться в том, что метрике,
имевшейся при сборе данных в сознании второго респондента,
отвечает треугольник, связывающий звездочки (именно
звездочками отмечены те точки, в которые переместятся объекты, если к
их исходным координатам применить веса, отвечающие второй
Индивидуальное многомерное шкалирование
61
матрице близостей, то есть матрице, полученной от второго
респондента).
Следует отметить, что перевода исходного набора
точек-объектов (отмеченных на рис. 5 кружками) в точки-квадратики и точки-
звездочки можно и не делать.
Нетрудно видеть, что те соотношения между расстояниями,
которые отвечают матрице близостей, исходящей от первого
(второго) респондента, можно получить, если вместо обычного
евклидова расстояния использовать так называемое взвешенное
евклидово расстояние с весами, отвечающими первой (второй) матрице
близостей.
В общем виде для первой матрицы близостей и для к-мерно-
го евклидова пространства такое взвешенное расстояние будет
иметь вид:
dU=^Zwi.2(xi.-xJt)2- (7)
Здесь (w„ w12,..., wlk) — набор из к положительных чисел,
приписанный первой матрице близости (первому респонденту)
(заметим, что если в соответствии с набором весов, приписанных
первой матрице, все координаты объектов по t-й оси должны
увеличиться в wltpa3, то в приведенной выше формуле
взвешенного евклидова расстояния на соответствующем месте должна
стоять величина w|t2, поскольку в эту формулу входит квадрат
разностей координат рассматриваемых объектов).
Функции стресса в индивидуальном МШ
Функция стресса (коэффициент соответствия), минимизация
которого и здесь является формальной целью применения
алгоритма МШ, образуется суммированием коэффициентов вида (5)
йли (6). (в случае метрического и неметрического шкалирования
с°ответственно) по всем матрицам близости с учетом формулы (7).
Тема 5. НЕМЕТРИЧЕСКОЕ МНОГОМЕРНОЕ
РАЗВЕРТЫВАНИЕ
Одномерное развертывание:
нерешенные проблемы
Выше уже упоминалось об оригинальном методе
одномерного шкалирования, предложенном Кумбсом, — так
называемом одномерном развертывании [Толстова, 1998, с. 147—161]. Этот
метод позволяет, используя в качестве первичной информации
осуществленные респондентами ранжировки рассматриваемых
объектов, получить некую усредненную ранжировку. Другими
словами, метод дает возможность построить одномерную
оценочную шкалу. Эта шкала, как правило, будет порядковой.
Иногда же (и только в случае, когда число ранжируемых объектов
больше трех) в результате одномерного развертывания
получается шкала, промежуточная между порядковой и интервальной:
оказывается возможным не только упорядочить объекты, но и
ввести отношение частичного порядка для расстояний между
объектами.
В качестве основного достоинства метода одномерного
развертывания выше уже рассматривалось то, что он не опирался ни на
какое «навязывание» чисел респондентам.
Мы не считали, что респондент, ранжируя объекты,
приписывает им числа. Так, полагали, что респондент, дав, например,
ранжировку b > с > а, просто сказал, что объект b нравится ему
больше, чем объект с, а объект с, в свою очередь, нравится больше, чем
объект а, и что никакого намека на то, в какой мере, с точки зрения
респондента, b лучше с, а с лучше а, в этой информации не
содержится.
Неметрическое многомерное развертывание
63
Заметим, что построение оценочной шкалы, то есть «посадка»
всех объектов на некоторую числовую ось, может быть
интерпретировано как измерение некоторой латентной переменной — той,
ориентируясь на значение которой респонденты осуществляют
требующиеся ранжировки. И такой подход роднит одномерное
развертывание с МШ. Это не случайно. Логика одномерного
развертывания действительно является логикой МШ. В этой связи
следует напомнить главное модельное предположение, лежащее
в основе метода одномерного развертывания.
Выше (при рассмотрении методов и одномерного, и
многомерного шкалирования) было показано, что ни один метод
шкалирования не может обойтись без определенной модели восприятия:
всегда нужно знать, почему используются те или иные исходные
данные, как эти данные следует интерпретировать и как они
соотносятся с искомыми латентными переменными.
И в рассматриваемом случае переход от ранжировок к
усредненной оценочной шкале невозможен без дополнительных
предположений о том, каким образом ранжировки сочетаются с
искомой латентной переменной.
В качестве соответствующих предположений фигурировала так
называемая модель идеальной точки. А именно предполагалось,
что, осуществляя ранжировку, респондент в неявном виде (может
быть, даже не отдавая себе в этом отчета) соотносит каждый
предъявляемый ему объект с неким идеалом, существующим в его
сознании. Объект, наиболее близкий к идеалу, он ставит при
ранжировке на первое место, более далекий — на второе, еще более
Далекий — на третье и т. д.
Так, ранжируя по вкусу чашечки кофе, респондент может
неосознанно пользоваться сохранившимися у него с детства впечатлениями
0 необыкновенно вкусном кофе, которым поила его бабушка,
когда он приходил к ней в гости. Человек при этом может не думать
ни о каких конкретных характеристиках кофе — ни о крепости, ни
0 сорте, ни о температуре и т. д. Он просто руководствуется (чаще
всего — бессознательно) тем, что в одной чашке был кофе, весьма
сХожий с бабушкиным, а в другой — совсем на него не похожий.
64
Тема 5
Задачей одномерного развертывания являлось такое
размещение на одной и той же прямой линии и рассматриваемых
объектов, и идеальных точек респондентов, при котором расположение
объектов относительно идеальной точки, отвечающей
конкретному респонденту, соответствовало бы осуществленной этим
респондентом ранжировке объектов. Ближе всего к идеальной точке
респондента должен оказаться тот объект, который этот респондент
при ранжировке поставил на первое место, несколько дальше —
тот объект, который стоял на втором месте, дальше всего от
идеальной точки респондента должен находиться тот объект,
который он при ранжировке поставил на последнее место.
Ранее [Толстова, 1998, с. 147-161] мы показали, насколько
сложным является одновременное соблюдение всех подобных
требований по отношению ко всем респондентам. Ясно, что задача
решается гораздо легче, если вместо прямой линии будет
использоваться плоскость, трехмерное пространство и т. д. (выше уже
говорилось, что восприятие любым человеком произвольных
объектов чаще всего является многомерным).
А наиболее правильной, очевидно, будет такая постановка
задачи, при которой поиск размерности пространства будет
основан на исходных данных — примерно так, как это было описано
при обсуждении Темы 2 (с. 40-42): «лавируя» между желанием
иметь пространство относительно малой размерности и
стремлением уменьшить функцию стресса, значение которой в данном
случае должно говорить о том, в какой степени исследователю
удалось соблюсти описанные выше соотношения между
идеальными точками респондентов и исходными данными (то есть
осуществленными респондентами ранжировками шкалируемых
объектов).
Удастся более или менее соблюсти все описанные требования
в одномерном пространстве (на прямой линии) — хорошо, нет —
следует опробовать двумерную плоскость. Если и в этом случае
не удастся требуемым образом расположить точки, отвечающие
объектам и идеальным точкам респондентов, следует перейти
к трехмерному пространству и т. д.
Неметрическое многомерное развертывание
65
Именно это и делает неметрическое многомерное
развертывание (идея метода была предложена Шепардом в 1962 году),
описание которого представлено ниже.
Неметрическое многомерное развертывание
(НМР)
Итак, исходными данными для НМР служат ранжировки
рассматриваемых объектов, данные опрошенными лицами. Такие данные
можно представить в виде матрицы || г~ ||, где т..—ранг,
приписанный i-м респондентом j-му объекту i = 1,..., N; j = 1,..., n; N — как
и выше, количество респондентов, п — количество объектов.
Предполагается, что различие ранжировок, полученных от
разных респондентов, объясняется не случайностью, а наличием
несовпадающих точек зрения. Точка зрения же каждого человека
отражается в том, каково расположение отвечающего ему
идеального объекта.
Модель идеальной точки в рассматриваемом многомерном
случае, как и в описанной выше одномерной ситуации, по
существу служит объяснением того, каким образом исходные
ранжировки связаны с искомым пространством восприятия. А именно
предполагается, что в сознании ранжирующего респондента
существует представление о некотором идеальном объекте (это
представление может быть и неосознанным).
Ранжируя объекты, респондент на первое место ставит тот,
который более всего похож на этот идеальный объект, на второе
место — тот, степень схожести которого с идеальным объектом
несколько меньше, на последнее место—тот, который в наименьшей
степени похож на идеальный объект.
В соответствии со сказанным, на выходе работы алгоритма НМР
фигурируют две совокупности точек — точки первой
совокупности отвечают объектам, точки второй — респондентам или,
точнее, их идеальным объектам. Объекты и респондентов удается
поместить в одно и то же признаковое пространство только потому,
Что они представляют собой явления одного порядка: и точки-
сновы многомерного шкалирования
66
Тема 5
объекты, и точки-респонденты по существу представляют собой
объекты, рассматриваемые как носители определенного
отношения к ним респондентов.
И задача многомерного развертывания сходна с описанной выше
задачей одномерного развертывания: целью применения метода
является такое размещение в одном и том же пространстве и
рассматриваемых объектов, и идеальных точек респондентов, при
котором расположение объектов относительно идеальной точки,
отвечающей конкретному респонденту, соответствует
осуществленной этим респондентом ранжировке объектов: ближе всего к
отвечающей респонденту идеальной точке окажется тот объект,
который рассматриваемый респондент при ранжировке поставил
на первое место, несколько дальше — тот объект, который стоял
на втором месте, дальше всего от идеальной точки респондента
должен находиться тот объект, который он при ранжировке
поставил на последнее место.
Для лучшего понимания сути алгоритма НМР поясним
сказанное на упрощенном примере.
Пусть имеются два респондента г, и г2, давшие следующие
ранжировки трех изучаемых объектов а, Ь, с:
Ту Ъ > а > с
г2: с > b > a.
Предположим, что уже в двумерном пространстве оказалось
возможным добиться идеальной ситуации (нулевой функции
стресса). Тогда картина, выдаваемая компьютером, будет иметь
примерно такой вид, который изображен на рис. 6.
Кружками помечены идеальные точки наших двух
респондентов, крестиками — точки, отвечающие объектам. Таким образом,
к первому респонденту ближе всего крестик Ь, подальше —
крестик а, дальше всего от идеала первого респондента — крестик с.
Это отвечает той ранжировке, которую дал первый респондент.
Нетрудно проверить, что аналогичные соотношения справедливы
и для второго респондента.
Неметрическое многомерное развертывание
67
Рис. 6. Упрощенный результат НМР
Кружками обозначены точки, отвечающие респондентам г, и г2
(точнее, их идеальным точкам). Крестиками обозначены точки, отвечающие
ранжируемым объектам. Расположение этих точек отвечает
ранжировкам г,: b> а> с и г2: О b> а.
Поскольку идеального варианта при относительно малой
размерности искомого пространства (а цель исследователя в данном
случае состоит в поиске пространства именно небольшой
размерности) практически никогда нельзя достичь (всегда найдутся
такие респонденты, для которых соотношение расстояний от их
идеальной точки до рассматриваемых объектов не будет отвечать
данным этими респондентами ранжировкам), для оценки качества
найденного компьютером расположения точек используется
функция стресса.
Функция стресса в алгоритмах НМР чаще всего имеет вид1:
1 N
Kdy-dij)2
\¥d,i
A)2
. ' См-> например, [Интерпретация и анализ... 1987, с. 181-182; Клигер и др.,
19?8, с. 101].
5*
68
Тема 5
du = JSfrb "xjs)2' i = 1, - , m; j = 1,... , n.
Y = (Уц> Yi2> ■ ■ •» Yik) — точка, соответствующая i-му респонденту;
X = (х-,, xj2, ..., xjk) — точка, соответствующая j-му объекту;
d.. — член последовательности монотонной регрессии расстояний
d. от Yj до X., по ранжировкам r^; d; — среднее значение
расстояний dy от точки, отвечающей i-му респонденту до всех п объектов.
Так же, как и в предыдущих случаях, решение задачи НМР
состоит из точек Y(, X, обеспечивающих минимальное значение
функции стресса S.
Следует сказать несколько слов об особенностях
интерпретации результатов НМР. Интерпретация здесь может быть более
богатой, чем та, которая получается в результате действия
методов обычного МШ.
К интерпретации осей искомого пространства восприятия здесь
прибавляется возможность судить о том, какие объекты близки
тому или иному респонденту, какие респонденты близки тому или
иному объекту.
Более подробно мы обсудим этот вопрос ниже при описании
конкретных примеров.
Тема 6. ПРОБЛЕМЫ ФОРМИРОВАНИЯ
ИСХОДНЫХ ДАННЫХ
Возможные способы получения исходных данных
Ниже мы обсудим вопрос о том, каким образом можно
получать матрицу близостей (таким образом, речь пока не будет идти
о НМР, исходными данными для которого служат ранжировки).
Следует сразу отметить важность роли самого социолога в
выборе способа измерения близостей между анализируемыми объектами.
Чтобы адекватно измерить близость, надо хорошо знать задачу,
хорошо представлять себе свойства изучаемых объектов,
психологию опрашиваемых людей. Важно понимать, что для
корректного использования МШ необходима твердая уверенность
исследователя в том, что респонденты, давая ему информацию о близостях,
руководствовались именно расположением объектов в искомом
пространстве восприятия. А это не всегда очевидный факт.
Можно выделить два подхода к нахождению элементов
матрицы близостей (ср. со сноской ' на с. 25).
Первый подход условно назовем «психологическим». Будем
предполагать, что при его использовании близости получаются
непосредственно от респондентов. Естественно, это связано с
достаточно сложными методами опросов, требующими большого
внимания исследователя к психологической стороне опроса.
Здесь очень важна квалификация социолога в области общения
с респондентами. Ведь возможны случаи, когда стремление
получить от человека достаточно тонкую информацию приведет к
неадекватности данных.
Скажем, при получении данных для неметрического МШ
исследователь может прямо задавать опрашиваемым вопросы: «Скажите,
70
Тема 6
пожалуйста, какие объекты ближе друг к другу—А и Б или В и Г?»
Далее можно использовать эти данные для ввода в компьютер,
а можно и засомневаться в том, адекватна ли информация. Мог ли
респондент, даже давший определенный ответ, в
действительности оценить то, о чем его спрашивают? Более подробно о
«психологических» методах получения близостей речь пойдет в
следующем параграфе.
Второй подход («непсихологический»), строго говоря, нельзя
назвать подходом в полном смысле этого слова.
Сюда включаются всевозможные способы получения
близостей, не требующие прямого обращения к респонденту с
соответствующими вопросами. Методов такого рода существует
довольно много. Все они, по существу, опираются на анализ поведения
респондента. Некоторые примеры были приведены при
обсуждении Темы 1.
Более подробно о конкретных способах измерения близостей,
лежащих в рамках второго подхода, будет говориться ниже, при
обсуждении конкретных задач.
Непосредственное получение близостей
от респондентов, классификация
соответствующих способов опроса
(«психологический» подход к получению данных)
Многие подходы (к получению близостей между
шкалируемыми объектами) из числа тех, которые условно были названы нами
«психологическими», подробно описаны в книге Дейвисона.
Для систематизации основных методов такого рода можно
воспользоваться известной классификацией шкал Кумбса, описанной,
например, в [Толстова, 1998, с. 166-169]. Эта классификация здесь
весьма подходит. Речь идет об оценочных шкалах, то есть о таких,
целью которых является приписывание некоторым объектам аг
а2, ..., аптаких чисел, которые отражали бы усредненное
отношение к этим объектам некоторой совокупности респондентов (МШ
имеет дело именно с такими шкалами).
Проблемы формирования исходных данных
71
Мы рассмотрим только одно основание этой классификации —
процедуры опроса. И это основание затронем только в той его
части, которая касается не самих объектов, а пар объектов. При этом,
говоря о тех или иных оценках пар, мы будем подразумевать оценку
с точки зрения сходства объектов внутри каждой пары.
Рассматриваются следующие процедуры опроса.
I. Оценка пар объектов.
1. Числовая оценка. Исследователь предлагает
респонденту всевозможные пары объектов и просит приписать
каждой паре число, например, от 1 до 7, в зависимости оттого,
насколько, по его мнению, эти объекты близки друг к другу
в каком-либо отношении. Например: «Если телепередачи
одной из пар нравятся либо не нравятся Вам совершенно
в одинаковой степени, припишите этой паре число 1, ...,
если, по Вашему мнению, передачи этой пары вызывают
у Вас совершенно различные эмоции, припишите этой паре
значение 7».
2. Вербальная оценка. Имеется в виду опрос,
отличающийся от описанного выше тем, что респонденту
предлагается не приписывать число каждой паре, а указать, с каким
из нижеприведенных выражений относительно каждой
пары он согласен: «объекты этой пары, с моей точки
зрения, очень похожи друг на друга»,..., «объекты этой пары,
по-моему, не имеют друг с другом ничего общего».
3. Графическая оценка. Аналогичный опрос сводится к
тому, что респонденту предлагается расположить каждую из
предъявляемых ему пар объектов на отрезке числовой
прямой от I до 7 (пределы могут быть изменены), концы
которого отождествляются соответственно с высказываниями
типа «объекты этой пары, с моей точки зрения, очень
похожи друг на друга» (конец 1),..., объекты этой пары, по-
моему, не имеют друг с другом ничего общего» (конец 7).
П. Сравнение пар объектов.
1. Ранжировка пар объектов. Исследователь предлагает
респонденту проранжировать, скажем, те же пары телепередач
72
Тема 6
с точки зрения того, насколько, по его мнению, передачи
каждой пары похожи с точки зрения их художественного
качества. На первое место надо поставить пару,
состоящую из передач, максимально схожих друг с другом, на
последнее —- пару, элементы которой по своим
художественным свойствам не имеют друг с другом ничего
общего.
2. Сравнение пар в парах. Исследователь для
всевозможных четверок телепередач (а, Ь, с, d) просит респондента
сказать, какие передачи ближе друг к другу по их
художественным качествам — (а, Ь) или (с, d).
Содержательные примеры, в которых данные для МШ
собирались таким образом, описаны в книге [Дэйвисон, 1982].
Представляется очевидным, что получение таких данных действительно
представляет собой определенную психологическую проблему.
Ниже будет показано, как должна осуществляться подготовка
данных для использования МШ в реальных социологических
исследованиях.
Дело в том, что реальное использование метода всегда
«обрастает» огромным количеством разного рода методических
наработок. И читатель, желающий «почувствовать», во что обычно
превращается практическое применение МШ, должен хотя бы
приблизительно с этим познакомиться.
Примеры расчета матрицы близостей на основе
анализа данных «непсихологического» характера
Как уже отмечалось выше, для получения данных о близостях
не всегда обязательно использование столь тонких опросных
методов, которые условно были отнесены к «психологическому»
подходу и о которых шла речь в предыдущем параграфе.
Приведем примеры другого рода. Соответствующие методы
«завязаны» на содержательном смысле задачи, и поэтому их
рассмотрение должно сопровождаться хотя бы кратким раскрытием этого
смысла.
Проблемы формирования исходных данных
73
Прежде всего целесообразно рассмотреть пример, описанный
Г. А. Сатаровым в работе [Сатаров, 1987].
Предметом исследования была политическая структура высших
законодательных органов США. Для ее изучения в числе прочих
методов использовалось и МШ. Рассматривались результаты
поименных голосований за 1971 год по вопросам внешней политики всех
членов сената США. Они образовывали прямоугольную матрицу
Е = 1К11
размера n x m, где п — число сенаторов, m — число голосований;
ву = 1, если i-й законодатель одобрил j-й законопроект; ег = 0, если он
же отклонил этот законопроект. В этих данных каждый сенатор
описывается одной строкой матрицы Е, в которой содержатся все
результаты его голосований. Предполагалось, что результаты
голосований определяются политической позицией сенатора.
Сходным результатам соответствуют сходные политические
позиции, а различающимся—разные. Тогда величина, характеризующая
сходство (близость) строк матрицы Е, будет отображать и сходство
политических позиций двух законодателей. В основу
исследования была положена гипотеза о том, что сходство-различие
политических позиций сенаторов объясняется небольшим количеством
скрытых факторов, для выделения которых можно использовать МШ.
В качестве функции близости между двумя сенаторами
фигурировала функция:
hij = Pi + Pj-2Pu.
где pj — доля законопроектов, одобренных i-м сенатором, р.—доля
законопроектов, одобренных j-м сенатором, р.. — доля
законопроектов, одобренных и i-м, и j-м сенаторами одновременно.
Функция h^ называется расстоянием Хэмминга (в данном
случае — между сенаторами). Нетрудно видеть, что она равна доле тех
голосований, в процессе которых i-й и j-й сенаторы голосовали
различным образом. Смысл такой меры близости представляется ясным.
Итак, для сбора данных при решении рассмотренной задачи не
использовались никакие «психологические» методы (напомним,
74
Тема б
что мы имеем в виду методы получения оценок близостей
непосредственно от респондента).
Небезынтересно отметить, что в работах [Сатаров и Станкевич,
1982, 1983], где решалась та же задача шкалирования сенаторов,
о которой шла речь выше, при подготовке данных для МШ
использовался метод классификации: на основе данных о
голосованиях сенаторы разбивались на классы, на базе чего было отобрано
относительно небольшое их число, адекватно представляющее всю
выборку. Вычислялась также матрица близостей для классов и
шкалировались классы сенаторов (сходство соответствующих
интерпретаций подтверждало разумность получающихся выводов
о структуре латентного пространства).
Другие яркие примеры того, как при использовании МШ могут
формироваться матрицы близостей, можно найти в работах
[Каменский и др., 1975; Михеев и др., 1975; Сатаров, 1992а, 19926;
Сатаров и Станкевич, 1982, 1983; Шрайбер, 1982].
Своеобразные методы измерения близостей между объектами
описаны также в [Сошникова и др., 1999] (эти примеры частично
заимствованы из [Дэйвисон, 1982]). Там речь идет об
использовании в качестве матриц близостей матриц условных вероятностей
и матриц перехода. Ниже приводится их краткое описание.
Матрица условных вероятностей (точнее, матрица выборочных
оценок этих вероятностей с помощью частот) может быть
получена, например, так.
Предположим, что мы хотим оценить близости между
некоторыми типами объектов, например, между разными типами рынков
автомобилей. Пусть эти типы обозначены буквами А, Б, В, Г.
Предлагаем экспертам название конкретного рынка и просим
сказать, к какому типу этот рынок принадлежит.
Известно, что рассматриваемый объект принадлежит, скажем,
к типу А, но эксперты с той или иной условной вероятностью
могут отнести его к другим типам. Если какие-то типы А и Б часто
«путаются» у экспертов друг с другом (скажем, 70 % объектов,
в действительности принадлежащих типу А, эксперты относят
к типу Б), то можно считать, что типы А и Б близки.
Проблемы формирования исходных данных
75
Если же подобной путаницы практически не происходит
(скажем, лишь 0,5 % объектов типа А эксперты относят к типу Б), то
типы А и Б можно считать далекими (мы сейчас отвлекаемся от
несимметричности рассматриваемого понятия близости: скажем,
60 % объектов класса А могут быть отнесены экспертами к классу
Б, и лишь 1 % объектов класса Б — к классу А; в таком случае для
определения степени близости типов А и Б эти проценты
определенным образом усредняются).
Матрица перехода как матрица близостей между некоторыми
объектами (такими как, например, профессии, факультеты вузов)
обычно получается за счет подсчета количества респондентов,
переходящих от одного объекта к другому (меняющих
соответствующим образом профессию, переводящихся с одного
факультета на другой).
Пример получения ранжировок
для применения НМШ
Пример мы заимствуем из работы В. М. Петрова [ Петров, 1991].
Основная цель работы — выявить факторы, определяющие
предпочтения в области авторской песни (мастера авторской
песни — поэты-музыканты-исполнители, называемые также
бардами) некоторой совокупности респондентов (посетителей клубов
авторской песни и их ближайшего окружения). В работе В. М.
Петрова эта задача решалась с помощью неметрического
многомерного развертывания (НМР).
В качестве гипотетических факторов априори рассматривались
следующие.
А. Простейшие социально-демографические характеристики
респондентов (пол, возраст, образование).
Б. Характеристики творчества различных бардов:
• популярность;
• интегральная оценка;
• качество стихов;
• социальная значимость песен;
76
Тема 6
• степень присущего им юмора;
• качество исполнения автором песни;
• музыкальность...
Опрос состоял в следующем.
Во-первых, респонденты указывали свои характеристики из
группы (А); во-вторых, каждый респондент оценивал каждого
барда по каждой из характеристик группы (Б) по 10-балльной шкале
(кроме первой характеристики, об измерении которой мы коротко
скажем ниже). Другими словами, использовалось так называемое
прямое шкалирование.
Данные по интегральной оценке, поступившие от каждого
респондента, «перекодировались» в ранги от 1 до 14 (по числу
бардов). Если оценки каких-либо бардов были одинаковыми, то
соответствующие ранги усреднялись. Именно полученные
последовательности служили данными, исходными для НМР.
Оценки, данные разными людьми по шкалам 3-7, усреднялись
по всем респондентам и тоже «перекодировались», превращались
в ранги, число которых, как и выше, равнялось количеству бардов.
Соответствующие наборы рангов использовались при
интерпретации результатов применения НМР.
О том, как это делалось (и о шкале 1), пойдет речь при
обсуждении Темы 7.
Итак, исходными данными служили ранжировки
респондентами шкалируемых объектов (бардов) по интегральной оценке.
Подчеркнем, что автор прибегает к методу НМР, продумав при этом
соответствующую модель восприятия: он полагает, что за каждой
ранжировкой не обязательно стоит одномерная латентная
переменная (как часто делается на практике), что интерпретация
ранжировки отвечает многомерной модели идеальной точки.
Роль социолога при формировании
исходных данных
Приводя описание того, как некоторые авторы готовили данные
для решения отдельных социологических задач с помощью МШ,
Проблемы формирования исходных данных
77
мы ни в коей мере не претендуем на полноту изложения.
Напротив, настойчиво советуем читателю самому обратиться к
цитируемым работам, чтобы достаточно серьезно «прочувствовать»
содержательную ткань решавшейся задачи. Тем не менее мы полагаем,
что приведенное выше достаточно подробное описание процесса
подготовки исходных данных в рассмотренных публикациях,
способствует пониманию того, что успешным решение
социологической проблемы может быть только тогда, когда используемый
математический аппарат органически связан с содержанием задачи.
Исследователь должен быть уверен в том, что адекватной
реальности является модель восприятия, в соответствии с которой
близости между объектами, измеряемые в начале работы (или
исходные ранжировки — для НМР), объясняются именно тем, что
упомянутые объекты определенным образом расположены в
некотором признаковом пространстве. Надеемся, что описанные
выше примеры показывают, как нелегко обеспечить
исследовательскую уверенность в том, что это действительно имеет место.
Конечно, вопрос о подготовке исходных данных неотделим от
вопроса об интерпретации результатов применения МШ. Поэтому
мы советуем читателю воспринимать этот небольшой параграф в
тесной связи с аналогичным параграфом, приведенном в конце
обсуждения следующей темы.
Тема 7. ПРОБЛЕМЫ ИНТЕРПРЕТАЦИИ
РЕЗУЛЬТАТОВ МШ
При интерпретации результатов МШ огромную роль играет
интуиция исследователя. Чтобы донести эту мысль до читателя,
вероятно, требуется просто привести реальные примеры
соответствующего плана.
Способы обеспечения адекватной интерпретации
на этапе сбора данных
Суть подхода к интерпретации сводится примерно к
следующему.
У исследователя имеется некоторая гипотеза о том, как ось
интерпретируется, и он ищет «внешний» (не использованный в
процессе получения матрицы близостей и шкалирования)
показатель, отражающий то же самое. Подсчитывается
коэффициент корреляции (обычный или ранговый) между этим внешним
показателем и признаком, отвечающим построенной
координатной оси. Проверяется статистическая гипотеза о его отличии от
нуля.
Если связь значима, то можно полагать, что априорная
исследовательская гипотеза о сути найденной оси была правильна. Если
не значима — надо искать другую интерпретацию. Таким
образом, упомянутый показатель работает как своего рода индикатор
правильности интерпретации.
Как же практически реализуется подобный метод?
В качестве первого примера мы продолжим обсуждение уже
упомянутой выше задачи из работы [Петров, 1991].
Проблемы интерпретации результатов МШ
79
Исходными данными задачи служили ранжировки по
интегральной оценке. Оценки же, данные респондентами по другим
шкалам, усреднялись по всем респондентам и превращались в ранги,
число которых равнялось количеству бардов. Полученные наборы
рангов использовались при интерпретации результатов
применения НМР.
Однако, прежде чем говорить о том, как это делалось,
остановимся на некоторых методических аспектах процесса сбора
данных, рассмотренных в цитируемой работе (несколько обобщив при
этом результаты автора). Хотя эти аспекты имеют лишь
косвенное отношение собственно к методам МШ, мы все-таки скажем о
них, поскольку хотим, чтобы читатель понял всю сложность
процесса применения в социологии математического аппарата.
Барды были подобраны так, чтобы обеспечить достаточное
разнообразие по всем характеристикам их творчества. Если
респондент не был достаточно знаком с творчеством барда, ему было
предложено поставить прочерк в соответствующей клетке
анкеты. Значение первой характеристики — популярности для
каждого респондента — оценивалось по числу респондентов, не
сделавших прочерка при простановке интегральной оценки.
Респонденты, давшие по какой-либо характеристике одну и ту
же оценку для всех бардов, выбрасывались из рассмотрения.
Опрос по первым двум характеристикам и по остальным
осуществлялся на разных совокупностях респондентов (чтобы
интегральная оценка и характеристики с третьей по седьмую,
касающиеся отдельных сторон творчества бардов, не связывались в сознании
респондентов друг с другом).
Упомянутое выше усреднение результатов прямого
шкалирования не совсем корректно (шкала порядковая, поэтому для нее
среднее арифметическое, вообще говоря, не является формально
адекватным)1. Для «оправдания» такого некорректного шага автор
1 Подробнее об этом см.: Толстова Ю. Н. Измерение в социологии. М.: Инф-
ра-М, 1998. С. 187-188; Орлов А. И. Эконометрика. Учебник для вузов. — Изд. 2-е,
исправленное и дополненное. М.: Изд-во «Экзамен», 2003.
80
Тема 7
рассматриваемой статьи предложил следующий подход (в
результате которого «оправдана» была не сама возможность
использования среднего арифметического для порядковых шкальных
значений, а возможность полагать, что полученные ранги — те,
в которые были перекодированы некорректные средние, —
отражают нечто объективное; проверялась надежность получаемых
ранжировок).
Респонденты были разбиты на две группы с практически
одинаковым распределением по полу, возрасту и образованию. В
каждой группе усреднялись данные по всем респондентам, то есть
вычислялись средние арифметические баллы каждого барда по
каждой характеристике и строились соответствующие
упорядочения (другими словами, все делалось так, как было описано выше).
Для каждой пары упорядочений, отвечающих одной
характеристике, рассчитывался коэффициент ранговой корреляции Спир-
мена. Если он был близок к единице, группы объединялись,
результаты усреднялись (рассчитывались для всех респондентов).
Значение коэффициента Спирмена оказалось низким лишь для
одной характеристики (музыкальности), которая вследствие этого
была исключена из дальнейшего анализа (не использовалась при
интерпретации результатов НМР). Остальные упорядочения были
признаны надежными (речь идет об упорядочениях, полученных
на всех респондентах).
Перейдем к рассмотрению методов интерпретации
результатов применения НМР. Рассматриваемые стороны творчества
бардов (характеристики 3-7) предположительно отвечали латентным
осям и служили для их интерпретации. Использовался алгоритм,
благодаря которому компьютер сам искал такие оси, которые
имеют наибольшую корреляцию с рассматриваемыми ранговыми
признаками (поиск происходил в процессе решения известных
проблем определения размерности и угла поворота осей). Заранее было
предположено, что если наибольшая корреляция окажется
маленькой, это будет означать отсутствие латентной переменной,
отвечающей соответствующей стороне творчества бардов. Не
исключалось и существование нескольких «пучков» связанных друг
Проблемы интерпретации результатов МШ 81
с другом признаков, каждому «пучку» тогда отвечала бы своя
латентная переменная)1.
С помощью анализа подобных связей (а также, конечно, на
основе использования функции стресса) автору удалось выбрать
такую размерность пространства (было выбрано двумерное
пространство) и угол поворота осей в нем, чтобы полученная картина хорошо
проинтерпретировалась. Подчеркнем также, что не последнюю
роль в интерпретации сыграл и анализ
социально-демографических характеристик респондентов. Яркость полученной картине
придало то, что на плоскости фигурировали точки, отвечающие
и бардам, и определенным респондентам. Респонденты
наглядно описывались своими характеристиками: треугольники
отвечали мужчинам, кружки — женщинам, белые кружки и
треугольники говорили о том, что отвечающие им респонденты обладают
неполным средним или средним образованием, черные—высшим
образованием и т. д. Работа показывает, что наглядность
геометрической картинки играет отнюдь не последнюю роль в
интерпретации. Анализируя, какие респонденты «кучкуются» около
тех или иных бардов (или наоборот), автор сделал интересные
выводы.
Вспоминая, о чем говорилось в начале настоящего параграфа,
можно резюмировать, что индикаторами правильности априорно
предполагаемой интерпретации гипотетических латентных осей
(переменных) в рассмотренной задаче служили переменные,
построенные на базе предварительного выяснения у респондентов,
как они оценивают бардов по тому или иному гипотетически
соответствующему латентной оси качеству (скажем, по качеству
стихов или степени гражданственности песен), и усреднения
полученных оценок по всем респондентам.
Перейдем к продолжению обсуждения второго примера,
рассмотренного в предыдущем параграфе, — задаче изучения
скрытых факторов, определяющих политические позиции
американских сенаторов [Интерпретация... 1987].
1 См. о тестовой традиции в социологии в работе [Толстова, 1998, с. 92-129].
6 Основы многомерного шкалирования
82
Тема 7
Автор использовал несколько своеобразных подходов к
интерпретации результатов НМШ1. Коротко остановимся на описании
лишь одного из них (и то весьма поверхностно; настойчиво
рекомендуем читателю обратиться непосредственно к цитируемой
работе).
Прежде всего была обоснована целесообразность рассмотрения
двумерного латентного пространства. С помощью НМШ автор
получил некоторую конфигурацию точек-моделей сенаторов в
таком пространстве при некотором первичном повороте осей и
перешел к задаче интерпретации одной из них. Хорошо зная
реальную ситуацию, автор проанализировал состав групп сенаторов,
расположенных на разных концах интерпретируемой оси, и
выдвинул предположение, что эти группы противопоставляются по
консервативно-либеральной ориентации. Для проверки этой
гипотезы был использован внешний критерий — данные, публикуемые
общественными организациями, комментирующими деятельность
конгресса США. Периодически такие организации публикуют
индексы оценки законодателей, исчисляемые как процент
голосований каждого законодателя, отвечающих направленности этой
организации. Если, например, организация консервативная, то по ее
расчетам высокий индекс должны иметь консерваторы и низкий —
либералы. Анализ разных индексов показал их высокую
согласованность. Для сравнения с результатами шкалирования были
выбраны данные определенной консервативной организации.
Идея, грубо говоря, состояла в том, чтобы оценить корреляцию
значений выбранного индекса, вычисленных для отдельных
сенаторов, с координатами проекций точек, отвечающих тем же
сенаторам, на интерпретируемую ось. Однако автор совершил шаг,
позволяющий найти латентное пространство, заведомо более
адекватное ситуации, чем то, которое было получено вначале.
Напомним, что предоставляемое с помощью компьютера
решение определено лишь с точностью до поворота координатных осей.
1 Об этом см. сноску 2 на с. 44, где речь идет о проблеме выбора угла поворота
искомых латентных осей.
Проблемы интерпретации результатов МШ 83
Это и было учтено. Алгоритм был модифицирован таким образом,
чтобы сам компьютер попытался, поворачивая оси, найти нужное
направление. Логика, определяющая это направление, состояла в
следующем. «Перебирались»1 возможные направления. Точки,
отвечающие сенаторам, проектировались на прямые, идущие в
каждом рассматриваемом направлении. Вычислялся коэфициент
корреляции между этими проекциями и выбранным
индексом-критерием (параллельно с помощью проверки статистической
гипотезы (Н0: г = 0) выявлялась степень значимости (надежности)
коэффициента корреляции). Находилось то направление, пользуясь
которым можно было достичь максимального значения
коэффициента корреляции. Таким образом, была найдена такая латентная
ось, которую с достаточной степенью уверенности действительно
можно было назвать осью консерватизма-либерализма. Заодно
была решена и проблема поворота осей.
Здесь необходимо сделать одно замечание. В работе
[Интерпретация... 1987, с. 199] выделяются два подхода к
интерпретации результатов МШ — методы поиска вращений и методы
поиска направлений в построенном признаковом пространстве. То,
что выше мы нашли определенное направление в построенном
двумерном пространстве, дает основание говорить, что
определенную ось имеет смысл повернуть так, чтобы она пошла именно
в найденном направлении. Но это, конечно, не является
гарантией того, что вторая ось в результате поворота хорошо проинтерпре-
тируется (а мы поворачиваем все оси сразу, как некое единое
жесткое целое). Говоря же о вращении, мы имеем в виду ситуацию,
когда, осуществив поворот всей координатной системы, мы получим
1 В действительности, конечно, никакого «перебора» не осуществлялось (это
в принципе сделать невозможно). Задача решалась так, как в математике часто
Решаются задачи поиска разного рода экстремумов — с помощью расчета
определенных производных и нахождения тех точек, где эти производные обращают-
Ся в нуль (ср. со сноской на с. 53). В цитируемой работе этот процесс подробно
°писывается. Здесь хотелось бы подчеркнуть, что приведенный пример лишний
Раз показывает, что дифференциальное исчисление — отнюдь не лишний
предает в учебной программе будущего специалиста-социолога.
б*
84
Тема 7
хорошую интерпретацию всех осей. Как быть? Вряд ли можно дать
конструктивный ответ на этот вопрос. Первая ступень обучения
методу должна содержать тщательный анализ успешно
реализованных примеров. Именно на такие примеры мы пытаемся
указать читателю.
Комплексное использование
нескольких математических методов
при интерпретации результатов МШ
Каким же образом интересующей исследователя
интерпретации может способствовать использование других методов
анализа данных?
Прежде всего упомянем, каким образом интерпретации
результатов МШ могут помочь методы классификации кластерного
анализа.
В работах [Терехина, 1977, 1982] использовался подход,
схематически отраженный нами на рис. 7. С помощью кластерного
анализа в пространстве, полученном с помощью МШ, были
выделены два кластера, которые удалось содержательно
проинтерпретировать. При этом интерпретация оказалась связанной всего с
одним признаком — именно по этому признаку объекты,
попавшие в один класс, оказались схожими, а объекты, попавшие в
разные классы, — различными. Было предположено, что это
свойство отвечает одной из искомых латентных осей. Для того чтобы
найти такой поворот первичных осей, который позволил бы четко
выделить эту ось, центры кластеров были соединены прямой
линией (прямая хх на рисунке) и параллельно ей была проведена ось,
проходящая через начало координат (ось X' на рисунке). Эта ось и
была одной из искомых осей координат (ось X должна быть
переведена в ось X').
В работе [Сатаров, 1985] подробно обсуждается вопрос об
использовании при интерпретации результатов МШ методов
многомерной классификации.
Проблемы интерпретации результатов МШ
85
Следует заметить, однако, что такое использование требует
определенной осторожности. Необходимо учитывать характер и
выбранного подхода МШ, и используемого алгоритма
классификации. Дело в том, что, как показано в работе [Краскал, 1980],
алгоритмы ММШ более «чувствительны» к соотношениям между
большими расстояниями, менее «чувствительны» — к соотношениям
между малыми, в то время как для ряда алгоритмов кластерного
анализа имеет место обратное утверждение.
Кластер 1
Рис. 7. Поиск направления латентной оси в процессе
интерпретации результатов МШ
Первое утверждение можно понять, если учесть, как обычно
строится функция стресса в ММШ (например, в соответствии с
описанной выше формулой (5)).
Относительно малые разности между большими различиями 5Г
и расстояниями d- (такие как, скажем, разница между различием
100 и расстоянием 95) могут как бы «подавить» относительно
большие разности между малыми различиями и расстояниями
(такие как разница между различием 1 и расстоянием 2). В
результате этого может случиться так, что экстремум для
функции стресса будет отражать такое расположение точек в
пространстве, при котором структура больших расстояний будет весьма
Похожа на структуру отвечающих им близостей, а для малых
86
Тема 7
расстояний даже порядок расположения их по величине не будет
иметь ничего общего с аналогичным порядком соответствующих
близостей1.
Как пишет Краскал в упомянутой выше статье, при
использовании алгоритмов МШ часто имеются «различные решения,
каждое из которых соответствует данным, как и любое другое,
и они обычно отличаются только некоторыми локальными
возмущениями. С другой стороны, общее расположение точек является
содержательным. Например, тот факт, что определенные точки
расположены около середины конфигурации, не претерпит
изменения, даже если в середине изменится взаимное расположение.
Поскольку локальное расположение отражает малые различия,
а глобальное расположение отражает большие различия, то видно,
что Mill извлекает информацию о больших различиях» [Краскал,
1980, с. 32].
«Чувствительность» алгоритмов кластерного анализа к малым
близостям имеет место, если речь идет, например, о так
называемых иерархических агломеративных алгоритмах (именно таким
алгоритмом является алгоритм CLUSTER из известного пакета
SPSS). Эти алгоритмы строят классификационное дерево.
Сначала в один класс объединяются самые близкие объекты
(рассматриваемые алгоритмы, как и большинство алгоритмов
кластерного анализа, в качестве исходной информации используют
примерно то же, что и алгоритмы МШ, — матрицу близостей или
расстояний между классифицируемыми объектами, причем
второе — чаще), затем матрица близостей (различий, расстояний)
пересчитывается с учетом того, что вместо нескольких самых
близких друг другу объектов стал фигурировать новый объект —
сформированный из этих объектов класс. Затем снова объединяются
самые близкие друг к другу объекты и т. д.
1 В устном разговоре с автором А. И. Орлов предложил во избежание такой
ситуации использовать функции стресса, заданные иными формулами, чем (5).
Например, в метрическом шкалировании — сумму квадратов относительных
отклонений (а не абсолютных, как в (5)).
Проблемы интерпретации результатов МШ
87
Естественно, что при этом помимо близостей (расстояний)
между объектами должны задаваться близости между объектами
и классами и между классами.
Высказанное выше утверждение о «чувствительности»
описанных алгоритмов кластерного анализа к малым расстояниям между
классифицируемыми объектами представляется очевидным. Ведь
построение классов начинается с выделения самых близких друг к
другу объектов. А на последующих шагах работы алгоритма
близости между объектами, попавшими в один класс, определенным
образом усредняются, в результате чего информация о близостях
между конкретными объектами все более и более теряется.
Происходит то, о чем говорится в той же работе: «Рассмотрим
иерархический кластер-анализ. На основании обобщенного опыта
многих приложений было обнаружено, что маленькие кластеры хорошо
соответствуют данным и часто являются осмысленными
группами, а вот большие кластеры, расположенные высоко на дереве,
соответствуют плохо и не выглядят осмысленными» [Краскал,
1980, с. 32].
«Некоторые исследователи группировали данные о близости
в кластеры, сначала подвергая эти данные многомерному
шкалированию (обычно в двух измерениях), а затем используя
полученную конфигурацию для визуального выделения кластеров.
Так делать не рекомендуется в силу причин, которые в данном
случае очевидны: конфигурация, полученная при шкалировании,
отражает большие значения различий и совершенно
нерегулярна по отношению к локальному расположению точек. Поэтому
такая конфигурация не дает хорошего понимания того, какие из
точек являются ближайшими к каким-то другим точкам»
[Краскал, 1980, с. 37] \
Это утверждение соответствует использованию функции стресса, заданной
формулой (5), и иерархических агломеративных алгоритмов кластер-анализа.
а иных ситуациях МШ или, например, метод главных компонент позволяют
снизить размерность, скажем, представить объекты точками на плоскости, после чего
Изуальная кластеризация может дать практически полезные результаты.
88
Тема 7
При интерпретации результатов МШ, при поиске хорошо
интерпретируемых направлений в найденном пространстве и т. д.
используются также и методы регрессионного анализа. О
соответствующих подходах можно прочесть, например, в обзорах
[Сатаров, 1982; Шрайбер, 1982].
В заключение обсуждения вопроса о возможности
комплексного использования разных методов для интерпретации
результатов МШ следует отметить, что здесь возникает та же проблема,
которая «преследует» социолога, использующего методы анализа
данных: центральным звеном в получении содержательных
выводов с помощью компьютера является грамотный выбор модели,
заложенной в используемом методе анализа. Необходимость
внимательной проработки этого вопроса делает логичным переход
к следующему параграфу.
Роль социолога при интерпретации
результатов МШ
Приведенные выше описания решений реальных задач с
помощью МШ делают очевидным то обстоятельство, что удачная
интерпретация возможна только при глубоком погружении
исследователя в содержание решаемой задачи. Без такого погружения
невозможны ни определение размерности искомого евклидова
пространства и угла поворота его осей, ни выбор формальных и
неформальных методов интерпретации, ни использование какой бы
то ни было дополнительной статистики.
Значение содержательных концепций исследователя при
решении соответствующих вопросов вряд ли может быть
подвергнуто сомнению. Именно для подтверждения этого положения выше
мы сравнительно подробно, с экскурсами в содержание задачи,
рассмотрели процесс интерпретации результатов применения МШ
(то же самое можно сказать и о подготовке исходных данных для
реализации алгоритмов МШ).
Нелишне будет обратить внимание еще на один аспект
интерпретации результатов МШ, иногда представляющийся очевидным,
Проблемы интерпретации результатов МШ
89
но в действительности таковым не являющийся. При обсуждении
Темы 2 уже было отмечено то обстоятельство, что найденное в
результате применения МШ евклидово пространство считается
пространством восприятия только потому, что структура расстояний
между образами объектов в этом пространстве отвечает структуре
исходной матрицы близостей. Принятие этого положения
базируется по крайней мере на двух «аксиомах», проверка которых вряд
ли возможна:
• думая о близостях между шкалируемыми объектами
(точнее, так или иначе «поставляя» социологу информацию о
таких близостях), респонденты руководствуются
размещением этих объектов в искомом признаковом пространстве
(в действительности — гипотетическом, модельном,
существующем только в воображении исследователя,
надеющегося на то, что и в сознании респондента что-то похожее
просматривается);
• совпадение структуры близостей со структурой расстояний
в некотором абстрактном пространстве возможно только в
том случае, если последнее — именно пространство
восприятия (почему бы не представить себе существование
какого-либо пространства, не имеющего ничего общего с
пространством восприятия и все же такого, в котором точки —
модели объектов — расположены таким же образом
относительно друг друга?).
Для оправдания первого положения вполне можно допустить,
что, может быть, в действительности респондент воспринимает
объекты как нечто целое, не «расчленяемое» на отдельные
признаки (об этом уже шла речь), поэтому-то речь и идет только о
близостях между объектами: получение близостей, вообще
говоря, не требует упомянутого «расчленения», а допускает
рассмотрение объектов как цельных сущностей.
Тем не менее дальнейшее выделение латентных признаков вряд
ли можно считать лишь исследовательской моделью, не имеющей
Никакого отношения к сознанию респондента. И то, насколько
Прав исследователь, придя к выводу о том, что за поведением
90 Тема 7
респондента стоят определенные латентные переменные, может
показать только практика.
Оправдание второго положения может опираться только на
привлечение какой-либо новой информации или на компетенцию
автора. А последний фактор не очень надежен. Об этом мы уже
говорили при обсуждении Темы 2, где на гипотетическом
примере показывалось, что и возраст респондента, и его доход могут с
одинаковым успехом претендовать на то, чтобы служить в
качестве искомой латентной переменной.
Другие показательные примеры того, как на практике могут
интерпретироваться результаты применения МШ, можно найти в
работах [Каменский и др., 1975; Михеев и др., 1975; Сатаров, 1992а,
19926; Сатаров и Станкевич, 1982, 1983; Шрайбер, 1982].
Упомянем также кандидатские диссертации [Тарасов, 1997;
Сыров, 2001] (хотя диссертаций, появившихся сравнительно
недавно, можно было бы назвать и больше). Отметим, что во второй
из названных диссертаций для интерпретации результатов МШ
использовались дополнительные переменные (изучалась их
корреляция с найденными в результате МШ латентными
признаками), найденные с помощью стандартного 16-факторного
личностного опросника Кэтелла и с помощью метода триад Келли1.
Примеры интерпретации результатов индивидуального МШ
приведены в другой нашей работе [Терехина, 1978].
1 Метод триад — одна из наиболее употребительных техник выявления
специфичного для конкретного респондента пространства восприятия,
разработанная Келли в рамках предложенной им теории репертуарных решеток (оси
пространства восприятия Келли называет конструктами).
Тема 8. ПРИМЕНЕНИЕ МШ ДЛЯ РЕШЕНИЯ
ЗАДАЧ ПОНИЖЕНИЯ РАЗМЕРНОСТИ
И ВИЗУАЛИЗАЦИИ ДАННЫХ
МШ, как и любой другой математический метод, вообще
говоря, является «безразличным» к тем данным, которые он
«перерабатывает».
На «вход» соответствующей компьютерной программы может
поступить любое множество чисел, количество которых равно Р2
(Р—любое целое число, Р > 2). Если, будучи расположенными в
виде квадратной матрицы || Sj. || f,.=t p эти числа будут удовлетворять
требованиям (4), то смело можно нажимать кнопки компьютера —
машина поступит с этими данными так, как предусматривает
алгоритм МШ, и выдаст расположение каких-то Р точек в некоем
пространстве заданной размерности.
Сказанное дает основание для применения МШ в таких
ситуациях, когда речь не идет о поиске пространства восприятия.
Конечно, использование МШ в таких случаях не имеет того смысла,
который вкладывали в него его создатели, однако и без
соответствующей психологической подоплеки метод может быть весьма
полезен. Ниже назовем две весьма важные для социолога задачи,
успешно решающиеся с помощью МШ, но не носящие того
содержательного характера, о котором шла речь выше.
Понижение размерности изучаемого
признакового пространства
Этот способ использования МШ часто употребляется в
маркетинге.
92
Тема 8
Приведем пример. В популярной книге по маркетинговым
исследованиям [Малхотра, 2004, с. 780-781] в соответствии с
распространенной традицией вьщеляются два вида подходов к сбору
данных для МШ: прямые и непрямые.
Под прямыми подходами понимается получение
непосредственно от респондента информации о сходстве объектов (то есть то,
что выше условно связывалось с «психологическим»
направлением в получении данных, исходных для МШ).
Под непрямыми подходами понимается методика сбора данных
о восприятии в МШ, основанная на характеристиках объектов и
требующая, чтобы респонденты оценивали объекты по
определенным характеристикам, например, с использованием
семантической дифференциальной шкалы или шкалы Лайкерта1.
Например, различные марки зубной пасты можно оценить на
основе следующих характеристик:
• отбеливает зубы /не отбеливает зубы;
• предотвращает кариес / не предотвращает развитие кариеса;
• приятный вкус / неприятный вкус.
Если респондент дал оценки каждой марки по всем таким
шкалам, то для любой пары марок выводят меру сходства (в
простейшем случае — евклидово расстояние) [там же, с. 781].
Совершенно ясно, что приведенная цитата свидетельствует
о том, что ее автор не учитывает многие описанные выше методы
сбора данных.
Но нас интересует не это. Для нас важно отметить, что
исходящими от респондента данными являются координаты
рассматриваемых объектов (марок зубной пасты) в многомерном признако-
1 Термины «семантическая дифференциальная шкала» и «шкала Лайкерта»
в книге Малхотры используются несколько не в том смысле, который обычно
имеется в виду в литературе по социологическому измерению. Здесь не имеются
в виду ни осгудовские понятия семантики, метафорических шкал, синестезии,
которые являются ключевыми для метода семантического дифференциала, ни
понятия явных и латентных переменных, связи наблюдаемых, отражающих одну
и ту же латентную, которые являются ключевыми для шкалы Лайкерта. В книге
Малхотры механически используется только соответствующая техника.
Применение МШ для решения задач понижения размерности 93
вом пространстве, близости же получаются с помощью
механического использования евклидова расстояния между
соответствующими этим объектам точек.
В результате механического же использования МШ
получается расположение точек, отвечающих тем же объектам в
некотором малоразмерном пространстве. Это может дать нам
возможность1 лучше разобраться в ситуации, понять, почему какие-то
объекты в глазах респондентов являются близкими, а какие-то —
далекими; может быть, позволит найти какие-то типы этих
объектов и т. д. И сделать это можно в основном за счет того, что малая
размерность пространства обеспечивает так называемую
визуализацию данных, о чем подробнее пойдет речь ниже.
Вряд ли можно быть уверенным в том, что на основе описанного
довольно механического определения близостей удастся
проинтерпретировать оси получившегося с помощью МШ пространства
малой размерности как некие латентные переменные (для обретения
такой уверенности нужно подходящим образом подобрать наблюдаемые
переменные: определенным группам наблюдаемых признаков
должны хотя бы гипотетически отвечать латентные характеристики).
В цитированной выше работе отмечается, что существенным
преимуществом описанного метода понижения размерности
(Малхотра такого словосочетания, правда, не использует) является то,
что после сбора данных у нас создается возможность «легко
разделить респондентов на однородные группы в соответствии с их
отношением к объекту, то есть исходя из оценок свойств объекта»
[Малхотра, 2003, с. 782].
Следует заметить, что без такой классификации респондентов вряд
ли возможно говорить о каком бы то ни было анализе данных:
информация, полученная с помощью описанной выше техники
семантического дифференциала, непосредственно не может
анализироваться, поскольку она являет собой не двух-, а трехмерную матрицу1.
Здесь скорее бы следовало говорить не о трехмерности информации (речь
Не идет о трехмерном признаковом пространстве), а о трех источниках вариации
данных: различии оцениваемых объектов, шкал и респондентов.
94
Тема 8
Усреднение же данных по множеству респондентов (тех, у
которых мнения близки, то есть тех, которые попали в один класс),
превращает трехмерность в двухмерность (об этом см. [Толстова,
1998, с. 140-144]).
Визуализация данных
Визуализация данных — это представление последних в таком
виде, который является удобным для анализа без компьютера, то есть
таким, когда основные интересующие исследователя
закономерности становятся видимыми «невооруженным глазом».
А сделать это бывает возможно только в одно-двух-трехмер-
ном пространстве. Удачно, наглядно представленная информация
способствует более глубокому пониманию исследователем
изучаемого явления, рождению новых гипотез.
Компьютер отнюдь не всегда может заменить человека. Он
действует по определенному, заранее заданному алгоритму. И каким
бы сложным этот алгоритм ни был, каким бы огромным ни было
количество учитываемых им разнокачественных случаев, все же
нередко возникают ситуации, когда какие-то получаемые с его
помощью результаты могут заставить исследователя прийти к
мысли о необходимости изменения цепочки запланированных шагов
алгоритма. Особенно часто это бывает при решении столь
сложных задач, какие возникают при изучении человеческого общества.
Чтобы заметить соответствующие моменты, необходимо
вмешательство человеческого разума в работу алгоритма. Но
плодотворным это вмешательство может быть только в том случае, если
результат работы алгоритма хорошо визуализирован. Иначе человек
просто не заметит изменения ситуации.
Визуализации во многих случаях может помочь использование
методов МШ. Это может быть сделано, например, так, как было
описано выше, — путем понижения размерности исходного
признакового пространства.
Скажем, анализируя многомерные данные, исследователь
может не заметить ярко выраженные компактные группы изучаемых
Применение МШ для решения задач понижения размерности 95
объектов. А если те же соотношения между расстояниями
представить в двумерном пространстве, он сразу заподозрит, что
имеет дело с определенной типологией и начнет активно проверять
соответствующую гипотезу. Выше мы говорили о том, что
понижение размерности пространства с помощью МШ зачастую
бывает связано именно с желанием исследователя визуализировать
данные.
Конечно, говорить о процессе визуалиции можно не только
в том случае, когда мы от пространства большой размерности
переходим к малоразмерному пространству. Любые структуры
близостей между реальными интересующими социолога объектами,
как правило, не поддаются содержательному анализу, если они (эти
структуры) не превращены в соотношения между теми же
объектами как точками пространства небольшой размерности. А
осуществить подобное превращение можно с помощью МШ.
Ярким подтверждением того, что методы МШ могут дать
полезную для получения новых практических выводов визуализацию
интересующей исследователя информации, служит содержание
работы [Терехина, 1973]. О том же косвенно свидетельствует
подзаголовок книги [Дэйвисон, 1982] («Методы наглядного
представления данных»).
Методологические аспекты
Говоря об использовании МШ как метода визуализации (или,
что почти то же самое, — понижения размерности), необходимо
иметь в виду ряд методических аспектов.
Прежде всего следует отметить, что при плохом знании
материала, при недостаточно развитой интуиции исследователь вряд
ли сможет получить интересные выводы даже при очень хорошей
визуализации.
Второй момент касается необходимости обеспечения
адекватности реальности заложенной в методе МШ модели. По существу,
именно это требование делает значимой ту роль социолога в под-
г°товке данных для МШ и в интерпретации получающихся с его
96
Тема 8
помощью результатов, о которой уже говорилось в конце
обсуждения Тем 6 и 7. Если вопрос о связи исходных близостей с
гипотетическим латентным пространством тщательно не проработан,
то вряд ли мы можем надеяться на хорошо интерпретируемый
результат1.
В этой связи вслед за Г. А. Сатаровым [Интерпретация... 1987,
с. 175] можно процитировать работу [Beals et al., 1968]: «Если
методы многомерного шкалирования рассматриваются скорее как
методы компактизации данных, а не как теоретические модели, то
возникает вопрос — откуда проистекает их пригодность. Любое
сокращение (сжатие) данных подразумевает некоторую потерю
информации для достижения большей ясности; некоторые
аспекты данных скрываются, чтобы высветить решающие стороны.
Но если модели, обычно используемые для снижения
размерности, логически несовместимы с исходными данными, то это
может скрыть наиболее интересные аспекты данных и привести
к ложному результату».
1 К сожалению, в отечественной социологической практике нередко
приходится наблюдать ситуации, когда методы поиска латентных переменных
используются механически, без тщательной отработки соответствующей модели. Это
касается не только МШ, но и, например, факторного анализа. В психологии, где
этот метод родился, его применение опирается на априорное обеспечение
высокой вероятности того, что наблюдаемые переменные, гипотетически
относящиеся к одному латентному фактору, связаны друг с другом. Социологи же зачастую
механически запускают программу факторного анализа, абсолютно не думая °
таких связях, а потом сетуют на метод, который якобы по своей сути дает трудно
интерпретируемые результаты. Ситуация примерно такая, когда мы ожидаем от
обезьяны, механически стучащей по клавиатуре пишущей машинки, что она
«настучит» «Войну и мир». А ведь и это имеет ненулевую вероятность.
СПИСОК ЛИТЕРАТУРЫ
Давыдов Ю. Н. Программа статистически-вероятностно
ориентированной науки об обществе // История теоретической
социологии. М.: Наука, 1995. С. 215-226.
Дэйвисон М. Многомерное шкалирование: методы наглядного
представления данных. М: Финансы и статистика, 1988.
Интерпретация и анализ данных в социологических
исследованиях. М: Наука, 1987 (гл. 7, автор главы — Сатаров Г. А.).
Каменский В. С. Методы и модели неметрического
многомерного шкалирования // Автоматика и телемеханика. 1977. № 3.
С. 118-156.
Каменский В. С, Петров В. М., Сатаров Г. А., Михеев А. В.
Применение неметрического многомерного шкалирования при
анализе восприятия художественных текстов // Материалы
V Всесоюзного симпозиума по психолингвистике и теории
коммуникации. М.: Ин-т языкознания АН СССР, 1975. С. 201.
Клигер С. А., Косолапое М. С, Толстова Ю. Н. Шкалирование при
сборе и анализе социологической информации. М.: Наука, 1978.
Краскал Дж. Взаимосвязь между многомерным шкалированием
и кластер-анализом // Классификация и кластер. М.: Мир, 1980.
С. 20-41.
Крылов В. Ю. Математическое моделирование субъективных
пространств. Автореф. дисс. на соискание уч. ст. докт. псих. наук.
М.: Институт психологии АН СССР, 1988.
Крылов В. Ю. Геометрическое представление данных в
психологических исследованиях. М.: Наука, 1989.
Малхотра Н. К. Маркетинговые исследования. Практическое
руководство. М.; СПб.; Киев: Вильяме, 2003. С. 775-814.
°сновы многомерного шкалирования
98
Список литературы
Михеев А. В., Каменский В. С, Петров В. М., Сатаров Г. А. Об
использовании неметрического многомерного шкалирования
при исследовании потребности в объектах культуры // Модели
и методы исследования социально-экономических процессов.
М.: ЦЭМИ АН СССР, 1975. С. 205-224.
Новиков Д. А. Статистические методы в педагогических
исследованиях (типовые случаи). М.: МЗ-Пресс, 2004.
Ноэль Э. Массовые опросы. Введение в методику демоскопии. М.:
Ава-Эстра, 1993.
Орлов А. И. Общий взгляд на статистику объектов нечисловой
природы // Анализ нечисловой информации в социологических
исследованиях. М.: Наука, 1985. С. 58-92.
Орлов А. И. Эконометрика. Учебник для вузов. Изд. 2-е,
исправленное и дополненное. М.: Экзамен, 2003.
Перекрест В. Т. Нелинейный типологический анализ социально-
экономической информации: Математические и
вычислительные методы. Л.: Наука, 1983.
Перекрест В. Т. Функциональный подход в метрическом
многомерном шкалировании // Анализ нечисловой информации в
социологических исследованиях. М.: Наука, 1985. С. 113-132.
Петров В. М. Опыт применения неметрического многомерного
шкалирования при изучении предпочтений молодежи в
области авторской песни // Социология: 4М. 1991. № 1. С. 99-114.
ПиндайкР., РубинфельдД. Микроэкономика. М.: Экономика, Дело,
1992.
Пфанцаглъ И. Теория измерений. М.: Мир, 1976.
Сатаров Г. А. Многомерное шкалирование: новые идеи и пути
использования // Статистические методы в общественных науках.
Сб. обзоров ИНИОН. М., 1982.
Сатаров Г. А. Многомерное шкалирование и другие методы при
комплексном анализе данных // Анализ нечисловой информации
в социологических исследованиях. М.: Наука, 1985. С. 132-140.
Сатаров Г. А. Анализ политической структуры законодательных
органов по результатам поименных голосований // Российский
монитор. 1992а. № 2. С. 57-81.
Список литературы
99
Сатаров Г. А. Структура политических диспозиций россиян: от
политики к экономике // Российский монитор. 19926. № 2.
С.135-148.
Сатаров Г. А., Каменский В. С. Общий подход к анализу
экспертных оценок методами неметрического многомерного
шкалирования // Статистические методы анализа экспертных оценок.
М.: Наука, 1977. С. 251-266.
Сатаров Г. А., Станкевич С. Б. Применение неметрического
многомерного шкалирования при изучении расстановки и
соотношения сил в конгрессе США // Анализ нечисловых данных в
системных исследованиях. Сб. тр., вып. 10. М.: ВНИИСИ. 1982.
С. 76-83.
Сатаров Г. А., Станкевич С. Б. Голосование в конгрессе США.
Опыт многомерного анализа // Социс. 1983. № 1. С. 156-166.
Сошникова Л. А., Тамашевич В. Н, Уебе Г., Шефер М.
Многомерный статистический анализ в экономике. М.: Юнити, 1999.
С. 401-467.
Суппес П., Зинес Дж. Основы теории измерений //
Психологические измерения. М.: Мир, 1967. С. 9-110.
Сыров Н. В. Многомерные параметрические модели
межличностной перцепции в малых группах (на примере группового
решения управленческих задач). Автореф. дисс. на соискание уч.
степ. канд. псих. наук. М., 2001.
Тарасов К. А. Дескриптивная модель восприятия политической
агрессии современным российским студенчеством. Автореф. дисс.
на соискание уч. степ. канд. псих. наук. М., 1997.
Терехина А. Ю. Методы многомерного шкалирования и
визуализации данных (обзор) // Автоматика и телемеханика. 1973. № 7.
Терехина А. Ю. Метрическое многомерное шкалирование. М., 1977.
Терехина А. Ю. Неметрическое многомерное шкалирование. М.,
1977.
Терехина А. Ю. Многомерный анализ субъективных данных о
сходствах или различиях. М., 1978.
1ерехинаА. Ю. Анализ данных методами многомерного
шкалирования. М.: Наука, 1986.
7»
100
Список литературы
Типология и классификация в социологических исследованиях. М.:
Наука, 1982.
Толстова Ю. Н. Использование коэффициента корреляции для
измерения степени близости между объектами в алгоритмах
автоматической классификации // Математические методы и
модели в социологии. М: ИСИ АН СССР, 1977. С. 23-41.
Толстова Ю. Н. Об одном подходе к ослаблению соотношения
треугольника для функции расстояния // Типология и
классификация в социологических исследованиях. М: Наука, 1982.
С. 290-291.
Толстова Ю. Н. Логика математического анализа социологических
данных. М.: Наука, 1991.
Толстова Ю. Н. Измерение в социологии. М.: Инфра-М, 1998.
Толстова Ю. Н Анализ социологических данных: методология,
дескриптивная статистика, изучение связей между
номинальными признаками. М.: Научный мир, 2000.
Толстова Ю. Н. Социологическое измерение в управлении
организацией // История управленческой мысли и бизнеса. 5-я меж-
дунар. конф. М.: Теис, 2002. С. 266-274.
Торгерсон У. С. Многомерное шкалирование. Теория и метод //
Статистическое измерение качественных характеристик. М.:
Статистика, 1972.
Тюрин Ю. Н., Литвак Б. Г., Орлов А. И., Сатаров Г. А., Шмер-
лингД. С. Анализ нечисловой информации. М.: Научный
Совет АН СССР по комплексной проблеме «Кибернетика», 1981.
Харман Г. Современный факторный анализ. М.: Статистика, 1972.
Шрайбер Е. Л. Анализ различия экспертных оценок методом
многомерного шкалирования в социологическом исследовании.
Автореф. дисс. на соискание ст. канд. филос. наук. М., 1984.
Шрайбер Е. Л. Примеры сбора данных и интерпретации числовых
результатов в процедурах многомерного шкалирования //
Статистические методы в общественных науках. Сб. обзоров
ИНИОН. М., 1982.
Ядов В. А. Стратегия и методы качественного анализа данных //
Социология: 4М. 1991. № 1. С. 14-31.
Список литературы
101
Beals Я, Krantz D. Н, Tversky A. Foundations of multidimensional
scaling // Psychol. Rev. 1968. Vol. 75, #2. P. 127-142.
Borg I., Groenen P. Modern multidimensional scaling: theory and
applications. N.-Y.: Springer, 1997.
Сох Т. Е, CoxM. A. A. Multidimensional scaling. Boca Raton: Chapman
& Hall/CRC, 2001.
Kruskal J. В., Wish M. Multidimensional scaling // Sage University
paper series: Qualitative applications in the social sciences. 1978.
№11.
Young E W. Multidimensional scaling: history, theory, and applications/
Edited by R. M. Hamer. Hillsdale, N. J.: L. Erlbaum Associates,
1987.
Young F. W., Householder A. S. Discussion of a set of points in terms of
their mutual distances // Psychometrika. 1938. Vol. 3. P. 19-22.
КОНТРОЛЬНЫЕ ВОПРОСЫ
1. Понятие пространства восприятия, проблемы его выявления
в социологии.
2. Круг задач, решаемых с помощью МШ.
3. Краткая характеристика основных элементов формализма
(близости, расстояния, функция стресса). Их соотнесение
друг с другом в процессе шкалирования.
4. Близости: аксиоматика, роль в МШ.
5. Функции расстояния: аксиоматика, евклидово расстояние,
взвешенное евклидово расстояние, расстояние Хэмминга.
6. Сходство и различие понятий «близость» и «расстояние».
7. Основные принципы интерпретации результатов МШ.
8. Неоднозначность решения в МШ: выбор размерности
получающегося пространства (суть вопроса и причины его
возникновения, принципы выбора размерности, связанные
с этим проблемы интерпретации результатов МШ).
9. Неоднозначность решения в МШ: выбор угла поворота осей
(роль вопроса и причины его возникновения, принципы
выбора угла поворота, связанные с этим проблемы
интерпретации результатов МШ).
10. Метрическое и неметрическое МШ: определение,
соотнесение друг с другом, сравнение их значимости для
социологии.
11. Функции стресса в метрическом и неметрическом МШ.
12. Основные принципы монотонной регрессии. Ее
использование при построении функции стресса в МШ.
13. Индивидуальное МШ: основные идеи, цель использования
в социологии, функция стресса.
Контрольные вопросы
103
14. Многомерное развертывание: основные идеи, смысл
решаемых с его помощью социологических задач, исходные
данные, функция стресса.
15. Подходы к получению исходных данных для МШ.
16. Классификация методов получения исходных данных,
основанных на прямой оценке респондентами близостей объектов.
17. Примеры измерения близостей косвенным путем (без
прямого обращения к респонденту с просьбой оценить близости).
18. Матрицы условных вероятностей и переходов как матрицы
близостей для МШ.
19. Использование МШ для сокращения размерности
исходного признакового пространства (суть вопроса, его значимость
для социологии, примеры).
20. Использование МШ для визуализации данных (суть
вопроса, его значимость для социологии, примеры).
21. Примеры практического применения МШ в социологии
(с указанием по возможности используемых способов
вычисления близостей и подходов к интерпретации
результатов шкалирования).
ПРИЛОЖЕНИЕ 1
Принципы монотонной регрессии
Поясним на модельном примере, что такое монотонная
регрессия, выражающая зависимость cL от (L (см. с. 54), и какую роль
она играет в решении задачи МШ. Пусть имеется четыре объекта
и между ними заданы близости, упорядочение которых выглядит
следующим образом:
s13<s24<s23 <s12<
Пусть также для определенности эти близости равны
следующим величинам:
S13_ *> S24 _ ' S23~ "*> S12_ ^'
(Поскольку речь идет о неметрическом шкалировании, указанные
величины считаются полученными по порядковой шкале, и
поэтому определены с точностью до монотонно возрастающего
преобразования.)
В соответствии со сказанным выше, применяя методы НМШ,
следует так расположить объекты в некотором признаковом
пространстве, чтобы расстояния между ними были упорядочены
способом, обратным упорядочению величин s^:
^12<^3<^4<^3.
(Так, объекты 1 и 3 были наименее близкими, и поэтому
расстояние между ними должно быть самым большим.) Как это сделать-
Казалось бы, ответ очевиден.
Ясно, что способов найти расстояния между объектами много-
Приложение 1
105
Самым простым представляется такой, при котором для
получения этих расстояний просто «переворачивается»
последовательность (1, 2, 3,4, ) значений близостей:
d12=l,d23 = 2,d24=3,d13=4.
Однако решение рассматриваемой задачи отнюдь не столь
простое, как может показаться на первый взгляд.
Для иллюстрации этого положения будем обдумывать ее
решение, рассматривая пары объектов как точки в двумерном
пространстве, на одной оси которого откладывается расстояние
между объектами пары, а на другой — близости между теми же
объектами. Данной ситуации будет отвечать рис. П1.1.
2
а.
со
с
s
S
Е
0)
•а
«о
о
!
S
д
н
о
о
п
s
4
3--
2
(1.2)
(2,3)
(2.4)
(1.3)
1
2 3 4 аЧ
Расстояние между объектами пары
Рис. П1.1. Гипотетическая идеальная монотонная связь между
близостями и расстояниями (точкам отвечают пары
рассматриваемых объектов; номера объектов, формирующих пару,
указаны в скобках)
Около каждой точки указаны номера объектов, отвечающей ей
Пары. Так, точке с координатами 2 по оси расстояний и 3 — по оси
близостей отвечает пара объектов (2, 3).
При этом рассматриваемые точки отвечают убывающей
функции —принадлежат прямой линии, обладающей тем свойством, что
большему значению координаты по горизонтальной оси отвечают
106
Приложение 1
меньшие значения координаты по вертикальной оси. Это,
собственно говоря, и означает, что для представленных пар объектов
большим расстояниям отвечают меньшие близости, и наоборот.
Создается впечатление, что расстояния подобраны правильно. И никакая
функция стресса нам не нужна. Но это не так.
Дело в том, что координаты точек по горизонтальной оси в
принципе не могут быть расстояниями. Они не удовлетворяют правилу
треугольника:
d12+d23=l+2 = 3<4 = d13.
Значит, подобрать расстояния, порядок которых был бы обра-
тен порядку близостей, не так-то просто. И без «хитрой» функции
стресса здесь не обойтись.
В известных алгоритмах НМШ процедура организуется
следующим образом. Рассмотрим те же значения близостей, о которых
шла речь выше. «Переберем» все возможные расположения точек
в пространстве рассматриваемой размерности (у нас — двумерное
пространство). Рассмотрим, например, такое расположение, при
котором расстояния таковы, что наш график имеет вид,
изображенный на рис. П1.2 (обозначения те же, рассматриваемым парам
объектов отвечают черные точки). Ясно, что соответствующие
расстояния нас не устраивают: объекты 2 и 4 менее близки, чем
объекты 2 и 3, и расстояние между объектами первой пары
меньше, чем расстояние между объектами второй. То же можно
сказать и о парах (1, 3) и (2, 4), парах (1, 3) и (2, 3).
В этом случае возникает желание передвинуть пары (2,4) и (1,3)
направо, чтобы исправить положение. Это можно сделать, например,
так, как на рис. Ш .2 показано стрелочками, в соответствии с
которыми черные точки «превращаются» в незакрашенные кружки.
Очевидно, это «превращение» делает ситуацию приемлемой: меньшим
близостям начинают отвечать или большие, или равные расстояния.
Нетрудно видеть, что исходный набор точек при этом
превратился в другой набор, отвечающий некоторой монотонно
убывающей дискретной (принимающей конечное число значений) фун*
кции в нашем двумерном пространстве.
Приложение 1
107
4
(1,2)
(2, 3)
(2, 4) . ► о
(1.3)
->о
12 3 4 d<
Рис. П1.2. Иллюстрация процесса поиска монотонной регрессии.
(Худший из двух рассматриваемых вариантов.)
Однако сделать требующиеся сдвиги можно по-разному: не
только так, как это было сделано на рис. П1.2, но и так, как это
показано на рис. Ш.З.
s.
4
3-
1 -
(1,2)
О -4 • (2, 3)
• (2. 4)
(1, 3) . ► о
12 3 4 d«
Рис. П1.3. Иллюстрация процесса поиска монотонной регрессии.
(Лучший из двух рассматриваемых вариантов.)
108
Приложение 1
При сравнении ситуаций, изображенных на рисунках П.1.2
и П. 1.3, возникает вопрос: в каком случае (при какой передвижке
кружочков) сильнее искажаются исходные данные? Степень
искажения можно измерить так, как это принято в статистических
исследованиях, — с помощью метода наименьших квадратов.
На рис. П.1.2 пара объектов (2, 4) была передвинута на одну
единицу вправо, пара (1,3) — на две единицы. Суммарное
искажение можно оценить величиной 12+ 22= 5.
Проделаем то же для ситуации, отраженной на рис. П. 1.3, оценка
получится I2 + 12= 2.
Второй случай лучше.
Если удастся показать, что лучше, чем это отражено на рис. П. 1.3,
перестроить точки рассматриваемым образом не удастся, то
последовательность чисел
Л Л Л Л
d12 = 1» d23 = ■*' ^24= 3' d13= 3
будет называться монотонной регрессией последовательности
d12=1>d23 = 4'd24=3>d13=2-
Чтобы лучше понять процесс построения монотонной
регрессии (а заодно и то, почему здесь вдруг появляется слово
«регрессия»), проведем аналогию между приведенными выше
рассуждениями и логикой процедуры регрессионного анализа. Напомним,
в чем последняя состоит. Наша основная цель — найти, каким
образом некая переменная Y «в среднем» (то есть статистически)
зависит от какой-то переменной X (для простоты будем считать, что
переменная X — одна; обычно X называют независимой
переменной, a Y — зависимой). Изучаемые объекты представляются как
точки соответствующего двумерного пространства.
Рассмотрим технику так называемого линейного
регрессионного анализа, то есть такого, который ищет зависимость,
изображаемую в признаковом пространстве с помощью прямой линии.
Среди всех прямых линий, проходящих через получившееся
облако точек, следует искать наилучшую в смысле критерия,
определяемого методом наименьших квадратов.
Приложение 1
109
Этот критерий строится так: перебираются все встречающиеся
у объектов значения X; для каждого из них определяется
соответствующее значение Y, лежащее на «проверяемой» прямой линии,
и рассчитывается сумма квадратов разностей между этими Y-ками
и Y-ковыми координатами всех реальных объектов, обладающих
рассматриваемым значением X.
И так следует поступать для всех встречающихся в наших
данных значениях переменной X. Суммируются все полученные для
отдельных значений X суммы квадратов.
Стремимся к тому, чтобы результирующая сумма была
минимальной.
Для иллюстрации изложенного выше целесообразно
рассмотреть рис. П. 1.4 — точки отвечают рассматриваемым объектам.
Рис. П. 1.4. Иллюстрация идеи построения прямой, выражающей
регрессионную зависимость Y от X. Расположение точек отвечает
лучшему из двух рассматриваемых вариантов
Все сказанное можно сформулировать более кратко: метод
наименьших квадратов обеспечивает то, чтобы сумма квадратов
изображенных на рис. П. 1.4 вертикальных отрезков была
минимальной. Прямая линия, отвечающая этой минимальной сумме, и есть
линия регрессии. Она выражает линейную статистическую
зависимость средних значений Y от X.
110
Приложение 1
Аналогичная ситуация изображена на рис. П. 1.5. Нетрудно
видеть, что здесь качество найденной регрессионной зависимости
хуже, поскольку координаты объектов в большей степени
разбросаны по оси Y. Идеальной линия регрессии будет только тогда,
когда все точки лежат на одной прямой.
*х
Рис. П1.5. Иллюстрация идеи построения прямой, выражающей
регрессионную зависимость Y от X. Расположение точек отвечает
худшему из двух рассматриваемых вариантов
Примерно такая же ситуация отражена на рис. Ш.6. Прямая,
проходящая через рассматриваемые точки, и есть линия регрессии.
Метод наименьших квадратов обеспечит прекрасное качество последней:
соответствующая сумма квадратов отклонений будет равна нулю (на
рис. П. 1.6 — близка к нулю, точки не совсем точно лежат на прямой).
В регрессионном анализе не встает задача подбора координат
объектов в нашем двумерном пространстве. Расположение точек
задано — это эмпирические данные. Рассматривая данное
расположение, мы как бы «перебираем» все прямые линии,
проходящие через наше облако точек, и выбираем среди них наилучшую
в смысле метода наименьших квадратов.
В случае монотонной регрессии мы как бы осуществляем
«двойной перебор». Сначала берется произвольное расположение точек,
отвечающих шкалируемым объектам, в некотором евклидовом
пространстве.
Приложение 1
111
Рис. П.1.6. Практически идеальная регрессионная зависимость Y от X
Дальнейшая логика похожа на логику регрессионного анализа.
Однако реализуется эта логика не в упомянутом евклидовом
пространстве, а в двумерном пространстве, отраженном на рис. П1.2
иШ.З: точки пространства отвечают парам объектов, по
горизонтальной координатной оси откладываются расстояния между
объектами каждой пары (те, которые фактически имеют место при
выбранном расположении объектов), по вертикальной —
близости между теми же объектами (исходные данные).
Вместо прямой линии ведется поиск набора таких точек в
указанном двумерном пространстве, которые удовлетворяли бы трем
условиям:
• эти точки отвечали бы монотонно убывающей дискретной
функции (с ростом горизонтальной координаты
вертикальная не может возрастать — остается той же или убывает);
• координаты точек по вертикальной оси были бы теми же,
что и у точек исходной совокупности;
• координаты точек по горизонтальной оси были бы как
можно ближе к аналогичным координатам исходных точек в
смысле метода наименьших квадратов; соответствующую
величину суммы квадратов обозначим через А.
Другими словами, реализуется процесс, описанный выше
и отраженный на рис. П1.2 и П1.3. Совокупность отвечающих
112
Приложение 1
горизонтальной оси (оси расстояний) координат найденных точек
(d12, d23, d24, d13, ...) образует монотонную регрессию множества
первоначальных расстояний (d12, d23, d24 d13,...).
Затем берется другое расположение точек, отвечающих
шкалируемым объектам, в еклидовом (вообще говоря, многомерном)
пространстве. Над ним производятся операции, описанные выше.
Таким образом как бы перебираем все возможные
расположения и выбираем то, которому отвечает минимальное значение всех
рассматриваемых критериев А.
В процессе практической реализации алгоритма описанный
процесс сводится к минимизации функционала (6) из основного
текста (см. с. 54).
Напомним, что он имеет вид:
I I (d.-d,)2
q _ I lSKJ^n
1 Kd.-d)2"
В числителе этого функционала стоит сумма квадратов
отклонений значений монотонной регрессии, то есть, по существу, то,
что надо минимизировать. Знаменатель добавлен для
нормировки, то есть для того, чтобы функционал не «выбивался» за
пределы отрезка [О,!]1.
1 Конечно, этот процесс описан весьма приблизительно.
В действительности как уже было упомянуто выше (см. сноски на с. 53 и 83),
никакого перебора всевозможных вариантов сдвигов исходных точек, отвечающих
парам объектов в двумерном пространстве, не происходит. Не осуществляется и
перебор всех возможных вариантов расположения точек, отвечающих объектам,
в многомерном евклидовом пространстве. Снова используются сложные методы
поиска экстремума указанного выше функционала (и, конечно, при этом активно
рассчитываются производные).
ПРИЛОЖЕНИЕ 2
А. И. Орлов
Методы снижения размерности
В многомерном статистическом анализе каждый объект
описывается вектором, размерность которого произвольна (но одна
и та же для всех объектов). Однако человек может
непосредственно воспринимать лишь числовые данные или точки на
плоскости. Анализировать скопления точек в трехмерном
пространстве уже гораздо труднее. Непосредственное восприятие данных
более высокой размерности невозможно. Поэтому вполне
естественным является желание перейти от многомерной выборки к
данным небольшой размерности, чтобы «на них можно было
посмотреть».
Кроме стремления к наглядности, есть и другие мотивы для
снижения размерности. Те факторы, от которых интересующая
исследователя переменная не зависит, лишь мешают
статистическому анализу.
Во-первых, на сбор информации о них расходуются ресурсы.
Во-вторых, невозможно доказать, что их включение в анализ
Ухудшает свойства статистических процедур (в частности,
увеличивает дисперсию оценок параметров и характеристик
распределений). Поэтому желательно избавиться от таких факторов.
При анализе многомерных данных обычно рассматривают не
°Дну, а множество задач, в частности, по-разному выбирая
независимые и зависимые переменные.
Ниже рассматривается задача, целью которой является
снижение размерности в следующей формулировке.
Основы многомерного шкалирования
114
Приложение 2
Дана многомерная выборка. Требуется перейти от нее к
совокупности векторов меньшей размерности, максимально сохранив
структуру исходных данных, по возможности не теряя
информации, содержащейся в данных.
Задача конкретизируется в рамках каждого конкретного
метода снижения размерности.
Метод главных компонент является одним из наиболее
часто используемых методов снижения размерности. Основная его
идея состоит в последовательном выявлении направлений, в
которых данные имеют наибольший разброс. Пусть выборка
состоит из векторов, одинаково распределенных с вектором
Х = (х(1),х(2),...,х(п)).
Рассмотрим линейные комбинации вида:
У(Х(\), Х(2),..., Х(п)) = Ц1)х(1) + Ц2)х(2) + ... + Х(п)х(п),
где
Х\1) + Х\2) + ...+Х2(п)=1.
Здесь вектор X = (Х(1), Х(2),..., Х(п)) лежит на единичной сфере
в n-мерном пространстве.
В методе главных компонент прежде всего находят направление
максимального разброса, то есть такое X, при котором достигает
максимума дисперсия случайной величины У(Х)=У(Х( 1), Х(2),..., Х(п)).
Тогда вектор X задает первую главную компоненту, а величина У(Х)
является проекцией случайного вектора X на ось первой главной
компоненты.
Затем, выражаясь терминами линейной алгебры,
рассматривают гиперплоскость в n-мерном пространстве,
перпендикулярную первой главной компоненте, и на эту гиперплоскость
проецируются все элементы выборки. Размерность гиперплоскости
на 1 меньше, чем размерность исходного пространства.
В рассматриваемой гиперплоскости процедура повторяется.
В ней находят направление наибольшего разброса, то есть
вторую главную компоненту. Затем выделяется гиперплоскость,
перпендикулярная первым двум главным компонентам. Ее размер-
Приложение^
115
ность на 2 меньше, чем размерность исходного пространства.
Далее — следующая итерация.
С точки зрения линейной алгебры, речь идет о построении
нового базиса в n-мерном пространстве, ортами которого служат
главные компоненты.
Дисперсия, соответствующая каждой новой главной
компоненте, меньше, чем для предыдущей. Обычно останавливаются,
когда она меньше заданного порога. Если отобрано к главных
компонент, то это означает, что от n-мерного пространства удалось
перейти к k-мерному, то есть сократить размерность с п до к,
практически не исказив структуру исходных данных.
Для визуального анализа данных часто используют
проекции исходных векторов на плоскость первых двух главных
компонент. Обычно хорошо видна структура данных, выделяются
компактные кластеры объектов и отдельно выделяющиеся
вектора.
Метод главных компонент является одним из методов
факторного анализа [Харман, 1972]. Различные алгоритмы факторного
анализа объединены тем, что во всех них происходит переход к
новому базису в исходном n-мерном пространстве. Важным
является понятие «нагрузка фактора», применяемое для описания роли
исходного фактора (переменной) в формировании определенного
вектора из нового базиса.
Новая идея по сравнению с методом главных компонент
состоит в том, что на основе нагрузок происходит разбиение факторов
на группы. В одну группу объединяются факторы, имеющие
сходное влияние на элементы нового базиса. Затем из каждой группы
Рекомендуется оставить одного представителя. Иногда вместо
выбора представителя расчетным путем формируется новый
фактор, являющийся центральным для рассматриваемой группы.
Снижение размерности происходит при переходе к системе факторов,
являющихся представителями групп. Остальные факторы
отбрасываются.
Описанная процедура может быть осуществлена не только
с помощью факторного анализа. Речь идет о кластер-анализе
8*
116
Приложение 2
признаков (факторов, переменных). Для разбиения признаков на
группы можно применять различные алгоритмы кластер-анализа.
Достаточно ввести расстояние (меру близости, показатель
различия) между признаками. Пусть X и Y — два признака. Различие
d(X,Y) между ними можно измерять с помощью выборочных
коэффициентов корреляции:
d,(X,Y) = 1 - |r,(X,Y)|, d2(X,Y) = 1 - |pn(X,Y)|,
где rn(X,Y) — выборочный линейный коэффициент корреляции
Пирсона, pn(X, Y) — выборочный коэффициент ранговой
корреляции Спирмена.
Многомерное шкалирование. На использовании
расстояний (мер близости, показателей различия) d(X,Y) между
признаками X и Y основан обширный класс методов многомерного
шкалирования [Терехина, 1986; Перекрест, 1983]. Основная идея
этого класса методов состоит в представлении каждого объекта
точкой геометрического пространства (обычно размерности 1, 2
или 3), координатами которой служат значения скрытых
(латентных) факторов, в совокупности достаточно адекватно
описывающих объект. При этом отношения между объектами
заменяются отношениями между точками — их представителями. Так,
данные о сходстве объектов — расстояниями между точками,
данные о превосходстве — взаимным расположением точек [Тюрин,
Литвак, Орлов, Сатаров, Шмерлинг, 1981].
На практике используется ряд различных моделей
многомерного шкалирования.
Однако при их использовании возникает проблема оценки
истинной размерности факторного пространства. Рассмотрим эту
проблему на примере обработки данных о сходстве объектов с
помощью метрического шкалирования.
Пусть имеется п объектов 0(1), 0(2),..., 0(п), для каждой пары
объектов 0(i), 0(j) задана мера их сходства s(i,j). Считаем, что
всегда s(i,j) = s(j,i). Происхождение чисел s(i,j) не имеет значения для
описания работы алгоритма. Они могли быть получены либо
непосредственным измерением, либо с использованием экспертов,
Приложение 2
117
либо путем вычисления по совокупности описательных
характеристик, либо как-то иначе.
В евклидовом пространстве рассматриваемые п объектов
должны быть представлены конфигурацией п точек, причем в
качестве меры близости точек-представителей выступает евклидово
расстояние d(i,j) между соответствующими точками. Степень
соответствия между совокупностью объектов и совокупностью
представляющих их точек определяется путем сопоставления матриц
сходства ||s(i,j)|| и расстояний ||d(ij)||. Метрический функционал
сходства имеет вид:
S = S|s(i,j)-d(i,j)f.
Геометрическую конфигурацию надо выбирать так, чтобы
функционал S достигал своего наименьшего значения [Тюрин, Литвак,
Орлов, Сатаров, Шмерлинг, 1981].
Следует заметить, что в неметрическом шкалировании вместо
близости самих мер близости и расстояний рассматривается
близость упорядочений на множестве мер близости и множестве
соответствующих расстояний. Вместо функционала S используются
аналоги ранговых коэффициентов корреляции Спирмена и Кен-
Далла. Другими словами, неметрическое шкалирование исходит
из предположения, что меры близости измерены в порядковой
шкале.
Пусть евклидово пространство имеет размерность т.
Рассмотрим минимум среднего квадрата ошибки:
2
ос = mm S,
n(n-l)
где минимум берется по всем возможным конфигурациям п точек
в m-мерном евклидовом пространстве. Можно показать, что
рассматриваемый минимум достигается на некоторой конфигурации.
Ясно, что при росте m величина сст монотонно убывает (точнее, не
118
Приложение 2
возрастает). Можно показать, что при m > n - 1 она равна 0 (если
s(i j) — метрика). Для увеличения возможностей содержательной
интерпретации желательно действовать в пространстве возможно
меньшей размерности. При этом, однако, размерность
необходимо выбрать так, чтобы точки представляли объекты без больших
искажений. Возникает вопрос: как рационально выбирать
размерность, то есть натуральное число т?
В рамках детерминированного анализа данных обоснованного
ответа на этот вопрос, видимо, нет. Следовательно, необходимо
изучить поведение сст в тех или иных вероятностных моделях. Если
меры близости s(i,j) являются случайными величинами,
распределение которых зависит от «истинной размерности» п^ (и,
возможно, от каких-либо еще параметров), то можно в классическом ма-
тематико-статистическом стиле ставить задачу оценки т0, искать
состоятельные оценки и т. д.
Начнем строить вероятностные модели. Примем, что объекты
представляют собой точки в евклидовом пространстве
размерности к, где к достаточно велико. То, что «истинная размерность»
равна т0, означает, что все эти точки лежат на гиперплоскости
размерности т0.
Примем для определенности, что совокупность рассматриваемых
точек представляет собой выборку из кругового нормального
распределения с дисперсией а^. Это означает, что объекты 0(1), 0(2),...,
0(п) являются независимыми в совокупности случайными
векторами, каждый из которых строится как £(1)е(1) + £(2)е(2) + ... +
+ СХт^еОПд), где е(1), е(2), ... , е(т0) — ортонормальный базис в
подпространстве размерности п^, в котором лежат
рассматриваемые точки, а £(1), Ср.), ..., С(т0) — независимые в совокупности
одномерные нормальные случайные величины с нулевым
математическим ожиданием и дисперсией с^.
Рассмотрим две модели получения мер близости s(i,j). В первой
из них s(i,j) отличаются от евклидова расстояния между
соответствующими точками из-за того, что точки известны с искажениями.
Пусть с(1), с(2), ..., с(п) — рассматриваемые точки. Тогда
s(ij) = d(c(i) + e(i), cG) + eO), ij = 1,2,..., n,
Приложение 2
119
где d — евклидово расстояние между точками в k-мерном
пространстве, вектора е(1), б(2), ..., б(п) представляют собой
выборку из кругового нормального распределения в к-мерном
пространстве с нулевым математическим ожиданием и
ковариационной матрицей ajl, где I — единичная матрица. Другими
словами, e(i) = r|(i, l)e(l) + r|(i,2)e(2) + ... +г|(1,к)е(к),где.е(1),е(2),...,
e(k) — ортонормальный базис в k-мерном пространстве, a {t](i, t),
i = 1,2, ..., n, t = 1,2, ..., k} — совокупность независимых в
совокупности одномерных случайных величин с нулевым
математическим ожиданием и дисперсией а\.
Во второй модели искажения наложены непосредственно на
сами расстояния:
s(i,j) = d(c(i), c(j)) + £(i,j), i,j = 1,2,..., n, i Ф j,
где {e(ij), i,j = 1, 2, ..., n} — независимые в совокупности
нормальные случайные величины с математическим ожиданием О
и дисперсией а2(1).
В работе [Орлов, 1985] показано, что для обеих
сформулированных моделей минимум среднего квадрата ошибки сст при
п -> оо сходится по вероятности к
f(m) = f,(m) + s2(l)(k - m), m = 1, 2, ..., k,
f/-™-v_Jao(mo-m)' m<mo>
Таким образом, функция f(m) линейна на интервалах [1, m0]
и [m0, k], причем на первом интервале она убывает быстрее, чем
на втором. Отсюда следует, что статистика
m* = Arg min{ccm+1 - 2сст + сстЧ )
т
является состоятельной оценкой истинной размерности ш0.
Итак, из вероятностной теории вытекает рекомендация — в
качестве оценки размерности факторного пространства использовать т*.
120
Приложение 2
Следует отметить, что подобная рекомендация была
сформулирована как эвристическая одним из основателей многомерного
шкалирования Дж. Краскалом [Краскал, 1980; Kruskal J. В., Wish,
1978; Терехина, 1986]. Он исходил из опыта практического
использования многомерного шкалирования и вычислительных
экспериментов. Вероятностная теория позволила обосновать эту
эвристическую рекомендацию.
ПРИЛОЖЕНИЕ 3
А. В. Ермолаев
Краткий обзор современного состояния
разработки методов многомерного
шкалирования
Введение
Многомерное шкалирование (МШ) — мощное и динамично
развивающееся направление в области анализа данных, которое
включает в себя множество различных моделей. Все эти модели
объединяет одна общая идея, сформулированная К. Кумбсом:
«Данные можно рассматривать как отношения между точками
в пространстве»1.
В качестве исходных данных в МШ используются матрицы
сходства или близости. Строки и столбцы матрицы близости
соответствуют объектам, а ее элементами служат оценки сходства
между ними. В качестве таких оценок могут использоваться
различные показатели. Это могут быть прямые оценки сходства или
различия, основанные на восприятии объектов респондентами,
отношения предпочтения, а также меры близости, рассчитанные
на основе характеристик объектов. Методы МШ позволяют
представить эти объекты как точки некоторого пространства
небольшой размерности, причем расстояния между упомянутыми
точками отражают отношения сходства между соответствующими
объектами. Чем более схожи два объекта, тем ближе
располагаются соответствующие точки в полученном пространстве.
1 Coombs С. Я. A theory of data. New-York: Wiley, 1964.
122
Приложение 3
Методы МШ используются для решения следующих задач.
1. Шкалирование, то есть поиск и измерение неких
характеристик объектов.
2. Построение моделей восприятия.
3. Разведывательный анализ, позволяющий выявить
структуру исходных данных.
4. Проверка структурных гипотез.
Методы МШ берут свое начало в области психометрики как
методы шкалирования. В рамках психометрической традиции
предполагается, что существуют некоторые континуальные латентные
характеристики, определяющие восприятие респондентами объектов.
Можно предположить, что объекты располагаются в
некотором пространстве латентных характеристик, а оценки сходства
являются прямыми оценками респондентами расстояний между
объектами в этом пространстве. Зная эти оценки, можно найти
количество характеристик-осей пространства и их значения для
каждого объекта.
Наиболее интенсивно МШ развивалось в 70-80-е годы XX века.
В этот период вышло, в частности, значительное количество работ
отечественных исследователей1. Это были преимущественно об-
1 Каменский В. С. Методы и модели неметрического многомерного
шкалирования (обзор) // Автоматика и телемеханика. 1977. № 8; Клигер С. А.,
Косолапое М. С, Толстова Ю. Н. Шкалирование при сборе и анализе социологической
информации. М.: Наука, 1978; Косолапое М. С. Классификация методов
пространственного представления структуры исходных данных // СОЦИС. 1976. № 2;
Сатаров Г. А. Многомерное шкалирование и другие методы при комплексном
анализе данных // Анализ нечисловой информации в социологических
исследованиях. М.: Наука, 1985; Сатаров Г. А. Многомерное шкалирование: новые идеи
и пути использования // Статистические методы в общественных науках. М.:
ИНИОН, 1982; Терехшш А. Ю. Методы многомерного шкалирования и
визуализации данных (обзор) // Автоматика и телемеханика. 1973. № 7; Терехина А. Ю-
Анализ данных методами многомерного шкалирования. М.: Наука, 1986; Шрай-
бер Е. Л. Примеры сбора данных и интерпретации результатов в процедурах
многомерного шкалирования // Статистические методы в общественных науках. М-,
1982; Сатаров Г. А., Каменский Б. С. Общий подход к анализу экспертных
оценок методами неметрического многомерного шкалирования // Статистические
методы анализа экспертных оценок. М.: Наука, 1977.
Приложение 3
123
зорные работы, однако значительная их часть была посвящена
проблемам применения метода, высказывались и некоторые другие
интересные идеи.
В последние годы интерес к МШ несколько снизился,
однако данное направление продолжает оставаться актуальным, о чем
свидетельствуют новые публикации и книги, посвяшенные
методу.
Появление в западной литературе в 80-90 годы обзоров1,
монографий и учебников по многомерному шкалированию2 говорит
о том, что в зарубежной науке данное направление прочно вошло
в научное обращение и занимает соответствующее место среди
других методов анализа данных.
Модели многомерного шкалирования
В этом разделе будут коротко рассмотрены основные модели
многомерного шкалирования.
Пусть задана матрица различий А размером 1x1, где элемент
матрицы 5Г соответствует оценке различия между объектами i и j.
Тогда задачу метода МШ можно формально сформулировать
следующим образом: необходимо найти такую матрицу X точек,
1 Carroll J. D., Arabie P. Multidimensional scaling // Annual review of psychology.
Vol. 31. 1980; Mead A. Review of the development of multidimensional methods //
Statistician. Vol. 41, № 1, 1992.
2 KruskalJ. В., Wish M. Multidimensional scaling // Sage University paper series:
Qualitative applications in the social sciences. 1978. № 11; Сох Т. F. CoxM. A. A.
Multidimensional scaling. Boca Raton: Chapman & Hall /CRC, 2001; BorgL,
Croenen P. Modern multidimensional scaling: theory and applications. New-York:
Springer, 1997; BorgL, Lingoes J. Multidimensional similarity structure analysis.
New-York: Springer-Verlag, 1987; Young F. W. Multidimensional scaling: history, theory
and applications / R M. Hamer, ed. Hillsdale, N. J.: L. Erlbaum Associates, 1987;
Coxon A. P. M. The user's guide to multidimensional scaling. L.: Heinemann Educational
Books Ltd., 1982; Key texts in multidimensional scaling / P. M. Davies, A. P. M. Coxon
eds. L.: Heinemann Educational Books Ltd., 1982; ДэйвисонМ. Многомерное
шкалирование. Методы наглядного представления данных. М.: Финансы и
статистика, 1982.
124
Приложение 3
соответствующих объектам, в некотором пространстве
размерности R, а также такую функцию f, чтобы матрица расстояния
между точками D наилучшим образом соответствовали f (Л) по
некоторому критерию.
Метрическое многомерное шкалирование
Основателем современного направления методов МШ
считается Торгерсон1, который четко сформулировал проблему и
предложил алгоритм МШ на основе работы Юнга и Хаусхолдера2.
Торгерсон предположил, что оценки различий равны расстояниям
в евклидовом пространстве небольшой размерности R:
5u=dii'
R
rfledfj=^(xir-xjr)2.
r=l
Далее на основе исходной матрицы близостей Л
рассчитывается матрица с двойным центрированием Л*, каждый элемент
которой равен
L l i=l l j=l I i=l j=l
Торгерсон доказал, что матрица Л* является матрицей
скалярных произведений
Д* = ХХГ.
Вследствие этого X можно найти с помощью сингулярного
разложения матрицы Л*.
Предположение о том, что оценки различия равны
расстояниям, является очень жестким. Менее жесткой является следующая
1 Torgerson W.S. Multidimensional scaling: l. Theory and method//Psychometrika.
1952. Vol. 17.
2 Young F. W., Householder A. S. Discussion of a set of points in terms of their
mutual distances // Psychometrika. 1938. Vol. 3. P. 19-22.
Приложение 3
125
модель, в которой различия соответствуют расстояниям с
точности до некоторой аддитивной константы:
8^ + с.
Одними из первых эту проблему осветили Мессик и Абельсон1.
Аналитическое решение проблемы нахождения аддитивной
константы было предложено Лингосом2, а также Каиллиезом3.
Метрический алгоритм Торгерсона сейчас используется в
неметрических алгоритмах многомерного шкалирования,
основанных на итеративных процедурах, для оценки стартовых значений
параметров модели.
Неметрическое многомерное шкалирование
Настоящим прорывом в области методов шкалирования стало
появление модели неметрического многомерного шкалирования.
Первое решение этой проблемы была дано Р. Шепардом4. Его
алгоритм был основан на предположении, что меры различия
являются монотонной функцией от расстояний в евклидовом
пространстве небольшой размерности:
dii=f(8ij) + eij,
где f— монотонная функция, такая, что
du = f(5ij) + sij>Для всех i, j, k, 1.
1 MessickS. M., Abelsom R. P. The additive constant problem in multidimensional
scaling//Psychometrika. 1956. 21. P. 1-15.
2 Lingoes J. С Some boundary conditions for monotone analysis of symmetric
matrices//Psychometrika. 1971. 36. P. 195-203.
3 Cailliez F The analytical solution of additive constant problem // Psychometrika.
1983. 48. P. 132, 134, 137, 138, 139, 305-308.
4 ShepardR. N. The analysis of proximity data with unknown distance function, I //
Psychometrika. 1962. № 27; Shepard R. N. The analysis of proximity data with unknown
distance function, II // Psychometrika. 1962. № 27.
126
Приложение 3
Вскоре Дж. Краскал1 предложил более общий алгоритм НМЩ,
где
du =
( R
I
Vr=l
VI I1
i
"\7
Из мер различия такого вида наиболее часто в литературе
упоминаются евклидова метрика, метрика доминирования и метрика
города. Евклидова метрика используется наиболее широко,
поскольку интуитивно она более понятна и обладает простыми
математическими свойствами.
Таблица 1
Наиболее часто используемые метрики
Метрика
Евклидова метрика
Метрика доминирования
(swp-метрика)
Метрика города (block city)
Значение/?
2
00
1
Формула
dU =
1
Z(xtk-xjk)
^ k )
dij=™fx|xik_xik|
djj =2j|Xik _Xjk|
k
В алгоритме Краскала решается задача минимизации функции
соответствия модели исходным данным STRESS 1 (STandardize
REsidual Sum of Squares)
Sl =
i.j
ТА
in
1 Kruskal J. B. Multidimensional scaling by optimizing goodness of fit to a
non-metric hypothesis // Psychometrika. 1964. № 29; Kruskal J. B. Non-metric
multidimensional scaling: a numerical method // Psychometrika. 1964. № 29.
Приложение 3
127
где dfj — отклонения, которые являются оптимально
шкалированными близостями, то есть числа, максимально соответствующие
расстояниям в смысле минимума суммы квадратов отклонений,
при условии монотонности
dy: Z(du -dij)2 -> min> 5ij <5k. => dy <du Vi,j, k, 1
•J
для всех i,j, k, 1.
Для нахождения конфигурации, минимизирующей функцию
соответствия, Краскал предложил использовать метод
наискорейшего спуска.
Кроме формулы STRESS 1, Краскал предложил функцию
STRESS2, которая отличается от первой только числителем,
S2 =
Х^уЧ)2
-il/2
'.J
X(dij-d.)2
где d. =—Vdij.
JJ - J
'.j
Функция STRESS2 более устойчива к появлению так
называемых вырожденных решений. Особенно ее рекомендуется
использовать в задачах многомерного развертывания, о которых речь
пойдет ниже.
НМШ Краскала позволило в качестве исходных данных
использовать ранговые данные, поэтому данный метод стал популярен в
социальных науках, в которых большая часть данных измерена на
Уровне порядка. Именно с появления алгоритма Краскала
началось активное использование метода МШ в исследовательской
практике1.
1К сожалению, в ряде случаях использование метода МШ было необдуманным
и не отвечало задачам исследования, что приводило к сомнительным результатам.
128
Приложение 3
Существует также ряд моделей НМШ, в которых
оптимизируется функция соответствия другого вида. Такане и др.1
предложили функцию, названную SSTRESS (Squared STRESS),
отличающуюся от функции STRESS Краскала тем, что она основана на
квадратах расстояний и оптимально шкалированных близостях:
-il/2
SS1 =
SS2 =
где
d =114
Использование квадратов расстояния в функции SSTRESS
позволило значительно повысить эффективность процедур поиска
решений. Однако использование этого подхода приводит к
искажению оценок близостей, поскольку большие расстояния
приобретают больший вес.
Практически одновременно с работами Шепарда и Краскала
свой вариант решения задачи НМШ предложил Гуттман2, назвав
его анализом пространств наименьшей размерности (Smallest Space
Analysis). В качестве функции соответствия Гуттман использовал
коэффициент отчуждения:
1 Такапе Y., Young F. W., DeLeeuw J. Non-metric individual difference
multidimensional scaling: an alternating least squares method with optimal scaling
features. Psychometrika. 1977. Vol. 42. P. 7-67.
2 Guttman L. A general nonmetric technique for finding the smallest coordinate
space for a configuration of points // Psychometrika. 1968. Vol. 33. P. 469-504.
Приложение 3
129
к = (1-ц2),/2, где
У d-d*
L Ту
n= •
( V/2
MM)2
V. >J iJ )
Величину dy Гуттман назвал ранговыми образами данных.
Она аналогична отклонениям dr, используемым в алгоритме
Краскала.
Алгоритм поиска решения, предложенный Гуттманом, в целом
похож на алгоритм Краскала, за исключением ряда технических
деталей. Теоретическое и эмпирическое сравнение этих
алгоритмов было проведено Лингосом и Роскамом1. Алгоритм Гуттмана
работает быстрее, чем алгоритм Краскала, но является более
грубым. С другой стороны, алгоритм Красала позволяет получить
более точные оценки координат, но при этом работает медленнее
и в большей степени подвержен одному из основных недостатков
всех алгоритмов — «попаданию» в локальный минимум (имеется
в виду ситуация, когда при поиске минимума функции
соответствия алгоритм находит лишь локальный минимум, принимая его
за глобальный). Более эффективным является комбинированный
подход, использующий на начальном этапе быстрый алгоритм
Гуттмана с последующей его доводкой с помощью алгоритма
Краскала.
Интересное решение проблемы предложил Джонсон2. В его
подходе используется функция соответствия, которая не требует
вычисления отклонений или ранговых образов данных:
1 Lingoes J. С, Roskam E. E. A mathematical and empirical analysis of two
multidimensional scaling algorithms // Psychometrika. 1973. Vol. 38.
2 Johnson R. M. Pairwise nonmetric multidimensional scaling // Psychometrika.
1973. Vol. 38. P. 11-18.
9 Основы многомерного шкалирования
130
Приложение 3
X eij,ki(dij-dkl)2
i<j,k<l
q2 _ (iJMk.l)
*-i ~2 ~2 , '
I (dy-d,,)2
i<j,k<l
(iJMk.1)
Взвешенные модели многомерного шкалирования
Рассмотренные классические методы МШ предполагают
наличие одной матрицы сходства/различия.
В случае если оценка сходства/различия дает несколько
субъектов, полученные матрицы могут быть агрегированы в одну общую.
Однако при этом теряется значительная часть информации об
индивидуальных особенностях восприятия.
Спустя некоторое время после появления метода МШ
последовали попытки разработать модель МШ, которая позволяла бы
наряду с общей картиной получать оценки индивидуальных
особенностей, отвечающих каждой из нескольких рассматриваемых
матриц сходства/различия. Соответствующий подход был назван
индивидуальным МШ (ИМШ).
Революционная модель ИМШ была предложена Блоксомом1,
а также Кэрроллом и Чангом2. В рамках модели предполагается,
что характеристики объектов, по которой идет оценивание, имеют
неодинаковую значимость для респондентов:
R
dUk=XWkr(Xir-Xjr)2.
г=|
или в матричной форме:
4=(xi-xj)wk(xi-*j)T>
где Wt— диагональная матрица весов.
1 Bloxom В. An alternative method of fitting a model of individual differences in
multidimensional scaling // Psychometrika. 1974. Vol. 39. P. 365-367.
2 Carroll J. D., Chang J. J. Analysis of individual differences in multidimensional
scaling via N-way generalization of «Eckart-Young» decomposition // Psychometrika.
1970. Vol. 35. P. 283-319.
Приложение 3
131
Метод ИМШ позволяет получить общее пространство стимулов,
а также пространство индивидуальных весов. Общее пространство
позволяет рассмотреть структуру данных в целом.
Индивидуальные веса показывают, на сколько различаются индивидуальные
данные, и позволяют реконструировать индивидуальные
пространства из общего.
В ИМШ пространство весов обычно анализируется отдельно.
При этом веса следует рассматривать не как точки, а как
направленные отрезки1. Направление отрезка показывает значимость
каждого фактора для респондента, а его длина может
рассматриваться как качество подгонки модели для данного респондента.
Используя веса, можно построить индивидуальные
пространства для каждого субъекта (точнее, для каждой матрицы сходства/
различия). Для этого необходимо умножить координаты точек по
каждой оси на корень их значения, соответствующего этой оси
веса. Поясним это на примере.
Предположим, в результате анализа трех матриц близости была
получена общая конфигурация и индивидуальные веса. Первый
респондент придает большую важность второй оси, поскольку
соответствующее значение весового коэффициента больше
w\z>w\ г Для второго респондента более значимым является
первая ось, поскольку w22 < w2), а для третьего важность осей
одинакова.
Тогда индивидуальное пространство для первого респондента
будет сжато по первой оси и растянуто по второй.
Индивидуальное пространство второго респондента, наоборот,
будет отличаться от общего тем, что совокупность точек будет
растянута по первой оси и сжата по второй.
Следует отметить, что полученную конфигурацию нельзя
вращать в отличие от моделей классического МШ. Это существенно
облегчает интерпретацию конфигурации, особенно в том случае,
если размерность полученного пространства превышает 2.
1 Это верно только в том случае, если данные рассматривались как
сопоставимые по матрице, то есть данные, полученные от разных респондентов, не могут
сравниваться между собой.
9*
132
Приложение 3
Дальнейшим обобщением модели ИМШ стала модель, которая
предполагала, что каждый индивид обладает собственными
характеристиками восприятия. Эта модель была предложена Такером1
и Кэрроллом и Чангом2.
«4=(»,-ж^ьть(»1-^)т.
где Wk— диагональная матрица весов, Тк — матрицы
ортогонального поворота осей пространства.
В этом случае веса определяют не только значимость осей для
каждого субъекта, но и их направление. В отличие от
индивидуального многомерного шкалирования в этой модели веса
целесообразно изображать, как векторы в общем пространстве.
Анализ предпочтений
Пространственные модели предпочтений также основаны на
предположении, что существует некоторое пространство
латентных факторов, которые определяют восприятия объектов. При этом
предполагается, что это пространство и расположение в нем
объектов одинаковы для всех респондентов. Чем объяснить различия
в предпочтениях?
Кумбс3 предложил следующую модель. Действительно,
респонденты одинаково воспринимают объекты, однако при оценке
предпочтений каждый из респондентов сравнивает объекты с
некоторым идеалом. Для каждого респондента существует свой
идеал, чем и объясняется различие предпочтений одних и тех же
объектов.
Существуют различные пространственные модели
предпочтений. Эти модели различаются по двум основаниям: модель иде-
1 Tucker L. R. Relation between multidimensional scaling and three-mode factor
analysis//Psychometrika. 1972. Vol. 37. P. 3-27.
2 Carroll J. D. Individual differences and multidimensional scaling //
Multidimensional scaling: theory and applications in the behavioral sciences / Edited
by R. N. Shepard, A. K. Romney, S. B. Nerlove. N.-Y.: Seminar Press, 1972.
3 Coombs С. Н. Theory of data. Wiley, 1964.
Приложение 3
133
ального объекта (или множества объектов) и механизмами
соотнесения объектов и идеала1.
Наиболее распространены векторная модель предпочтения и
модель «идеальной точки».
Векторная модель предпочтений была предложена Такером2.
Эта модель является самой простой моделью предпочтений.
Геометрически индивид представляется вектором, помещенным в
пространство объектов так, чтобы проекции всех точек на этот вектор
наилучшим образом соответствовали данным о предпочтениях &■■
(соответствующие критерии могут быть линейными или
монотонными).
u-f^),
R
г=1
С содержательной точки зрения, в векторной модели индивид
характеризуется набором коэффициентов, которые отражают
важность каждой из характеристик объектов. При этом реализуется
принцип «чем больше, тем лучше».
Многомерное развертывание основано на одномерной модели
«идеальной точки», предложенной Кумбсом для изучения
предпочтений3. Его модель была обобщена для многомерного случая Бен-
неттом и Хейсом4. Согласно этой модели, предпочтения субъекта i
1 Сатаров Г. А., Каменский В. С. Общий подход к анализу экспертных оценок
методами неметрического многомерного шкалирования // Статистические
методы анализа экспертных оценок. М.: Наука, 1977.
2 Tucker L. R. lntra-individual and inter-individual multidimensionality //
Psychological scaling: theory and applications / Edited by H. Gulliksen, S. Messick.
N.-Y: Wiley, 1960.
3 Coombs С Н. Psychological scaling without a unit of measurement // Psychological
review. 1950. Vol. 57. P. 148-158.
4 Bennett J. E, Hays W. I. Multidimensional scaling: determining the dimensionality
of ranked preference data // Psychometrika. 1960. Vol. 25. P. 27-43.
134
Приложение 3
относительно объекта j можно представить как расстояние в
некотором R-мерном пространстве до некоторого объекта, который
субъект считает идеальным. Фактически идеальный объект
представляет собой наилучшее, с точки зрения индивида, сочетание
характеристик. В модели развертывания величина предпочтения
определяется, как
R
гдео^Х^г-У*)2-
г=1
Кумбс показал, что векторную модель можно рассматривать как
частный случай модели развертывания, где идеальный объект
бесконечно удален и находится на векторе, соответствующем индивиду1.
Модель индивидуального многомерного развертывания
аналогична модели индивидуального многомерного шкалирования,
рассмотренного выше. В этой модели предполагается, что все
индивиды рассматривают объекты в рамках одних и тех же
характеристик, однако респонденты придают им разный вес:
R
dU=SVir(Xjr-yir)2.
г=1
или в матричной записи:
Обобщенная модель многомерного развертывания сходна с
моделью обобщенного индивидуального многомерного
шкалирования. В этой модели каждый индивид рассматривает объекты в
рамках уникальных характеристик.
1 Coombs С. Н. A note on the relation between the vector model and the unfolding
model for preferences//Psychometrika. 1975. Vol. 40. P. 115-116.
Приложение 3
135
а;=(хг*)у№-*>т-
Кэрролл1 выделил два типа анализа предпочтений:
«внутренний» анализ предпочтений и «внешний» анализ Предпочтений. При
«внутреннем» анализе предпочтений заданы Только отношения
предпочтения. Задача заключается в том, чтобы только на
основании данных о предпочтениях получить и пространство
восприятия объектов, и характеристики идеалов. При «внешнем» анализе,
кроме данных о предпочтениях, задано также и само
пространство восприятия (характеристики и их значения для объектов
могут быть заданы исследователем или получены с помощью МШ).
Задача заключается в поиске только характеристик идеалов при
заданном пространстве восприятия и предпочтениях.
Новые направления развития метода МШ
В настоящее время методы МШ продолжают активно
развиваться. Можно выделить несколько основных Направлений
развития метода, которые относительно слабо представлены в
отечественной литературе:
• модели МШ с внешними ограничениями;
• вероятностные модели МШ;
• комбинация методов МШ и латентно-струКТурНОГО анализа
(ЛСА);
• модели МШ для несимметричных матриц близости.
Наиболее полный обзор современного состояния методов МШ
можно найти в работах Борга и Гроенена2, а также Кокса и Кокса3.
1 Carroll J. D. Individual differences and multidimensional scaling //
Multidimensional scaling: theory and applications in the behavioral sciences / Edited by
R. N. Shepard, A. K. Romney, S. B. Nerlove. N.-Y.: Seminar preSs, 1972.
2 Borg I.. Groenen P. Modern multidimensional scaling: theory and applications.
N.-Y.: Springer, 1997.
3 Cox T. E, Cox M. A. A. Multidimensional scaling. Boca Raton: Chapman & Hall /
CRC.2001.
136
Приложение 3
Модели МШ с внешними ограничениями
Нередко при изучении данных о близости с помощью методов МЩ
исследователь собирает дополнительную информацию об объектах
исследования и формулирует гипотезы о виде полученной
конфигурации. В данном случае интерес представляет привлечение этой
дополнительной информации в процессе анализа, чтобы она также
влияла на результаты наряду с данными о близости. Эти данные могут
быть включены в виде дополнительных ограничений на параметры
модели: координаты точек или расстояния между ними.
Включение дополнительной информации в анализ позволяет
повысить устойчивость получаемого решения, поскольку при
использовании только данных о близости возможны ситуации,
когда для одних и тех же исходных данных существует несколько
различных решений, одинаково хорошо описывающих данные с
точки зрения значения функции соответствия. В этом случае
привлечение дополнительной информации позволяет снизить риск
получения содержательно необоснованной конфигурации.
С другой стороны, дополнительная информация помогает
интерпретировать конфигурацию. Появляется возможность
«проверить»1 выдвинутые гипотезы о структуре данных. Очевидно, что
при увеличении числа ограничений, накладываемых на итоговую
конфигурацию, качество модели с ограничениями будет всегда
ниже, чем качество модели без ограничений. Тогда если снижение
качества модели после введения дополнительных ограничений
снизилось незначительно, то можно считать, что выдвинутые
гипотезы «подтвердились».
В работах многих авторов были предложены различные
варианты ограничений на оцениваемые параметры модели. Обзор
этих моделей можно найти в работе Делевуа и Хейзера2, а так-
1 Слово «проверить» взято в кавычки, чтобы подчеркнуть, что данный метод
не означает статистическую проверку гипотезы.
2 De Leeuw J., Heiser W. Multidimensional scaling with restrictions on the
configuration // Multivariate Analysis, V/ P.R. Krishnaiah, ed., Amsterdam: North
Holland, 1980.
Приложение 3
137
же Хейзера и Меулмана1. Наиболее часто в качестве
дополнительной информации выступают оценки объектов по ряду
дополнительных или «внешних» шкал, характеристик объектов.
Накладываемые на получаемую конфигурацию ограничения
заключаются в том, что координаты являются линейными
комбинациями этих характеристик. Подобные ограничения
рассматриваются в работах Бентлера и Уикса2, Блоксома3, а также Делевуа
и Хейзера4.
Пусть задана матрица близости для N объектов, а также
имеются оценки объектов по М «внешним» шкалам, которые можно
записать в виде матрицы V размером N х М. Тогда ограничение на
координаты объектов в R-мерном пространстве можно записать
следующим образом
X = VBT,
где В — матрица коэффициентов размером М х R.
Геометрически это означает, что наряду с точками в
пространстве латентных факторов располагаются векторы,
соответствующие «внешним» шкалам. Координаты объектов ищутся таким
образом, чтобы проекции точек на векторы соответствовали
значениям шкал, при этом расстояния между точками наилучшим
образом соответствовали данным о близости, то есть функция
соответствия минимизируется при заданных ограничениях.
Данный вид ограничений предполагает, что уровень измерения
значений характеристик шкалируемых объектов не ниже интер-
1 Heiser W. J., Meulman J. Constrained multidimensional scaling, including
confirmation // Applied Psychological Measurement. № 7. P. 381-404.
2 Bentler P. M, Weeks D. G. Restricted multidimensional scaling models // Journal
of Mathematical Psychology. 1978. Vol. 17. P. 138-151.
3 Bloxom B. Constrained multidimensional scaling in N spaces // Psychometrika.
1978. Vol. 43. P. 283-319.
4 De Leeuw J., Heiser W. Multidimensional scaling with restrictions on the
configuration // Multivariate Analysis, V/ P.R. Krishnaiah, ed., Amsterdam: North
Holland, 1980.
138
Приложение 3
вального. Ограничения данного вида можно обобщить для
различных типов шкал, по которым измерены характеристики V:
X = f(V)BT,
где f (V)— оптимально шкалированные значения «внешней»
переменной V по каждому из столбцов для соответствующего
уровня измерения1. В качестве «внешних» шкал наряду с
интервальными можно использовать ранговые и номинальные шкалы.
Десарбо и Рао2 предложили модель многомерного
развертывания, аналогичным образом внешние ограничения могут
накладываться как на координаты объектов, так и на координаты
«идеальных точек».
Борг и Лингос3 предложили модель, которая позволяет
накладывать ограничения на структуру расстояний получаемой
конфигурации. Пусть задана матрица близости Д и матрица R
ограничений на расстояния. Предложенный им метод CMDA, основанных
на минимизации функции вида
L = (l-a)LA+aLR,
где Ьд — функция STRESS для исходной матрицы данных Л,
LR — «штрафная» функция STRESS для матрицы с
ограничениями R, причем lima' = 1, где а' — значение а на итерации t.
качестве стартовых значении X предлагается использовать
результаты анализа исходной матрицы Л близости без
ограничений. На каждой следующей итерации по мере увеличения
значения параметра а матрица внешних ограничений R приобретает все
больший вес. Модель позволяет использовать метрическое и не-
1 Heiser W. J., Meulman J. Constrained multidimensional scaling, including
confirmation//Applied Psychological Measurement. Vol. 7. P. 381-404.
2 DeSarbo W. S., Rao V. R. GENFOLD2: A set of models and algorithms for the
GENeral UnFOLDing analysis of preference/dominance data// Journal of Classification.
1984. Vol. l.P. 147-186.
3 Borgl., Lingoes J. C. A model and algorithm for multidimensional scaling with
external constraints on the distances // Psychometrika. 1980. Vol. 45. P. 25-38.
Приложение 3
139
метрическое МШ, накладывая различные ограничения на
структуру расстояний путем задания матрицы R. Важно отметить, что в
модели Борга и Лигоса внешние ограничения не являются
жесткими, а также могут нарушаться в зависимости от значения
параметра а.
Вероятностные модели МШ
МШ принадлежит к классу так называемых разведывательных
методов анализа данных.
Отсутствие вероятностных моделей не позволяет использовать
методы статистического оценивания и проверки статистических
гипотез.
В ряде работ были предприняты попытки использовать
вероятностно-статистические модели в МШ. В отечественной
литературе это направление представлено работами В. Перекреста1.
Рамсей2 предложил следующую модель. Пусть задана матрица
различий между объектами Д. Предположим, что исходным
данным соответствует конфигурация X в евклидовом пространстве.
Обозначим расстояния между точками D, где
d?j=(xi-xjXxi-xj)T-
Рамсей предположил, что наблюдаемые различия д.. являются
независимыми случайными величинами с нормальным
Sij-NCd^Cd^a)2),
или логнормальным законом распределения:
1 Перекрест В. Т. Функциональный подход в метрическом многомерном
шкалировании // Анализ нечисловой информации в социологических исследованиях.
М.: Наука, 1985.
2 Ramsay J. О. Some statistical approaches to multidimensional scaling data (with
discussion) // Journal of Royal Statistical Society, Ser. A. 1982. Vol. 145. P. 285-312.
140
Приложение 3
Используя метод максимального правдоподобия, можно
получить параметры модели оценки координат объектов X и с2.
Во многих случаях исходные данные не являются собственно
оценками расстояний и требуется их преобразование. Рамсей
предложил несколько вариантов преобразования исходных данных
в степенную функцию
и монотонную сплайн-функцию
1(5у) = у8(5у).
Использование метода максимального правдоподобия также
позволяет вычислить доверительные области для точек1 и
использовать статистический критерий, основанный на Хи-квадрат
распределении, для выбора размерности пространства.
Рамсей также разработал компьютерную программу MULTI-
SCALE2, в которой реализована его вероятностная модель МШ.
Зиннес и Маккей3 предложили иной подход к построению
вероятностной модели МШ, основанный на работе Хефнера, в
которой модель Терстоуна обобщается на многомерный случай.
В их модели в отличие от модели Рамсея предполагается, что
не оценки близости, а координаты объектов X являются
нормально распределенными случайными величинами
xir~N0iir,a2).
1 Ramsay J. О. Confidence regions for multidimensional scaling analysis //
Psychometrika. 1978. Vol. 43. P. 145-160.
2 Программу и руководство пользователя можно скачать на
Интернет-странице Дж. Рамсея. См.: www.psych.mcgill.ca/faculty/ramsay/ramsay.html.
3 Zinnes J. L. MacKay D. В. A probabilistic multidimensional scaling approach:
properties and procedures // Multidimensional scaling of perception and cognision /
F.G. Ashby, ed. Hillsdale, N. J.: Lawrence Erlbaum Associates, Publishers, 1992.
Приложение 3
141
Тогда наблюдаемая оценка различия
5u=(xi-xjXxi-xj)T
также является случайной величиной. Соответственно, «истинное»
расстояния между точками равно
djj^CMi-MjftMj-Mj).
Зиннес и Маккей нашли аппроксимацию функции плотности
распределения вероятностей для 8;., что позволило им
использовать метод максимального правдоподобия для оценки параметров
модели \i и а2г.
В модели Зиннеса и Маккея наблюдаемые различия 8;. и
расстояния d. связаны следующим соотношением:
f(dti) = a + bd<;.
Модель Зиннеса и Маккея реализована в разработанной ими
программе PROSCAL1.
Описанные выше вероятностные модели МШ являются
метрическими, то есть предполагают, что уровень измерения исходных данных
не ниже метрического2. Такане3 предложил вероятностную модель
неметрического МШ для случая, когда исходные оценки различия
получены путем упорядочивания пар объектов по степени различия.
Аналогично с моделью Рамсея предположим, что наблюдаемая
оценка различия равна
^j=dij+eij,rflesij~N(0,afj).
1 Демонстрационную версию программы и документацию можно найти в
Интернете. См. www.proscal.com.
2 Допускается также использование ранговых шкал с большим количеством
градаций.
3 Takane Y. A maximum likelihood method for nonmetric multidimensional
scaling: 1. The case in which all empirical pairwise orderings are independent —
theory // Japanease Psychological Research. 1978. Vol. 20. P. 7-17.
142
Приложение 3
Тогда если А,^>А,к], то 8^>8к,. Определим Yijkl так, что
v _М>вч
т [0,5,<5к1-
Тогда вероятность того, что 5у > 8к1, есть
Pr(Yeu=l) = Pr(A.y-A.u;>0) = pijkl,
а соответствующая функция правдоподобия равна
L=npfe,(1-Pijk.)Y№'-
•J,k.l
Используя метод максимального правдоподобия, можно найти
координаты объектов X. В работе Такане1 приводятся результаты
исследования этой модели методом Монте-Карло.
Такане и Кэрролл2 адаптировали эту модель для анализа данных,
полученных методом «чередующегося стандарта» и методом триад.
В методе «чередующегося стандарта» каждый из объектов
последовательно выбирается в качестве стандарта, а остальные объекты
упорядочиваются по степени близости к нему. Метод триад более сложен.
Респонденту предъявляется тройка объектов. Задание
заключается в выборе пары наиболее похожих и наиболее различных
объектов. В результате для каждой тройки получают
упорядочивание пар стимулов по степени сходства.
Описанные выше методы получения ранговых оценок
близости позволяют выявить интересные аспекты восприятия, но сами
процедуры достаточно сложны. Наиболее часто для получения
оценок близости используют более простой метод категориаль-
1 Такапе Y. A maximum likelihood method for nonmetric multidimensional
scaling: II. The case in which all empirical pairwise orderings are independent —
evaluation // Japanease Psychological Research. 1978. Vol. 20. P. 105-114.
2 Takane Y, Carroll J. D. Nonmetric maximum likelihood multidimensional scaling
from directional rankings of similarities // Psychometrika. 1981. Vol. 46. P. 389-406.
Приложение 3
143
ной оценки. В этом методе сходство каждой пары объектов
оценивается по шкале с небольшим количество категорий.
Такане1 обобщил свою модель для случая, когда 8..
оценивается по шкале с небольшим количеством категорий. Эта модель была
названа шкалированием последовательных интервалов (successive
categories scaling)2.
Пусть задана матрица различий Л, где элементы этой матрицы
8у могут принимать небольшое количество значений 1, 2, ..., М.
Такане предположил, что категории заданы набором
упорядоченных интервалов. Так, для М категорий получаем следующие
интервалы:
b0<b,...<b1_1<b,<...<bM_1<bM,
где интервал (bM,b|J соответствует категории 1.
Тогда если %~ лежит в интервале (b,_,,b|], то 8Г принадлежит
категории 1. Определим у;., так, что
= |1Дие(Ь,_1,Ь|]
У* }0Д^(Ьы,Ь,]-
Вероятность попадания 8; в интервал 1 равна
Pr(Yyi=l) = Pr(?Lije(b1.I,b1]) = pijl,
а соответствующая функция правдоподобия
i,j,i
1 Такапе Y. Multidimensional successive categories scaling: a maximum likelihood
method // Psychometrika. 1981. Vol. 46. P. 9-28.
2 Детерминистская модель шкалирования последовательных интервалов была
предложена Шрайбером: Шрайбер Е. А. Латентные параметры вербальных
моделей социального поведения // Математическое моделирование и применение
вычислительной техники в социологических исследованиях. М.: ИСИАН СССР, 1980.
144
Приложение 3
Используя метод максимального правдоподобия, можно
получить оценки границ интервалов Ь,, координаты X и о2.
По сравнению с детерминистскими моделями вероятностные
модели МШ обладают рядом существенных преимуществ.
Одним из главных преимуществ является возможность проверки
статистических гипотез относительно координат стимулов,
размерности и т. п. Если в детерминистских моделях МШ
исследователь вынужден руководствоваться здравым смыслом или
эмпирическими правилами для выбора параметров модели, то
вероятностные модели предлагают строгие статистические
критерии.
Другим преимуществом является учет в модели случайной
составляющей. В детерминистских моделях случайная вариация
включается в оценку расстояний между стимулами. В результате
этого ошибки измерения могут существенно повлиять на
полученное решение, в особенности если величина ошибки сопоставима
с оценкой расстояния1.
И, наконец, вероятностные модели позволяют учитывать
информацию, которую несет в себе вариация оценки
сходства/различия или предпочтения. Например, вариация оценок может
являться показателем степени уверенности или осведомленности
респондента об изучаемых объектах или явлениях.
С другой стороны, возможность использования этих моделей в
значительной степени ограничена достаточно жесткими
модельными предпосылками: модель восприятия, вид распределения
ошибок, независимость наблюдений. Кроме того, возникает
проблема с оценками параметров модели и их асимптотическими
свойствами, что, вообще говоря, ставит под сомнение возможность
применения статистических критериев для проверки гипотез.
Вероятно, жесткие предпосылки и сложность моделей стали
причиной достаточно слабого практического использования
вероятностных моделей МШ.
1 Такапе Y. Multidimensional successive categories scaling: a maximum likelihood
method // Psychometrika. 1981. Vol. 46. P. 9-28.
Приложение 3
145
Однако исследования этих моделей с помощью метода Монте-
Карло дают обнадеживающие результаты. Так, Стормс1 показал,
что MULTISCALE робастно к виду распределения ошибок и
показывает достаточно хорошие результаты. Зиннес и Маккей также
продемонстрировали впечатляющие результаты работы PROSCAL
на искусственно зашумленных данных по сравнению с KYST
иМГК.
Комбинация МШ и патентно-структурного анализа (ПСА)
Методы МШ позволяют выявлять и исследовать
индивидуальные различия. Но исследователя интересуют не отдельные
респонденты, а группы со сходными механизмами восприятия,
сходными предпочтениями. Поэтому результаты анализа, полученного с
помощью МШ, зачастую дополнительно анализируются
методами классификации.
Одним из интересных направлений развития методов МШ
является объединение моделей МШ и латентно-структурного
анализа ЛСА. В этих моделях одновременно происходит
классификация объектов на гомогенные кластеры или латентные классы и
поиск оценок параметров для этих классов. В последние годы был
предложен целый ряд моделей, объединяющий идеи МШ и ЛСА.
Обзор методов МШ с латентно структурным анализом
приводится в работе Десарбо и др.2
В работе Винсберг и Десоет3 описывается модель
индивидуального МШ, в которой предполагается, что все респонденты
принадлежат к небольшому числу латентных классов L, которую
авторы назвали CLASCAL. Индивидуальные веса W оцениваются
1 Storms G. On robustness of maximum-likelihood scaling for violation of the error
model // Psychometrika. 1995. Vol. 60. P. 247-258.
2 De Sarbo W. S., Manrai A. K., Manrai L. A. Latent class multidimensional scaling:
a review of recent developments in the marketing and psychometric literature //Advanced
Methods of Marketing Research / R. Bagozzi, ed. Oxford: Blackwell, 1994. P. 190-222.
3 Winsberg W.S.,De Soete G. A latent class approach to fitting the weighted Euclidian
model, CLASCAL//Psychometrika. 1993. Vol. 58. P. 315-330.
146
Приложение 3
не для каждого индивида, как в обычной модели ИМШ, а для класса
в целом. Тогда модель CLASCAL можно записать так
du.=
I>ir(Xir-Xjr)2
r=l
Рассмотрев вектор 6k, содержащий оценки различия между
объектами i и j для субъекта к,
Дк = (Д21к'Дз1к> ■■■ 'Дук> — >Дц1-1)к/'
Винсберг и Десоете предположили, что для субъекта к,
принадлежащего к классу 1, бк является многомерной нормально
распределенной случайной величиной со средними d, и дисперсией Е
fl,~N(d„E),
где d, =(d211,d311,...,dijl,...d,(I_1)1), для всех] <i.
Пусть вероятность любого индивида принадлежать классу 1
равна \, причем
Тогда функцию плотности распределения 6к можно записать
следующим образом:
g(6k | X,W,A,Z) = 5>,f(8k I X,wk,S),
1=1
где f(6k|X,wk,E) — функция плотности распределения для
субъекта к при условии его принадлежности к классу 1. При
условии независимости наблюдений соответствующая функция
правдоподобия будет иметь вид:
L = ng(SJX,W,A,I).
k=l
С помощью метода максимального правдоподобия можно
найти оценки параметров модели X и W.
Приложение 3
147
Каждая итерация алгоритма поиска оценок параметров
включает в себя два этапа. На первом этапе при заданных значениях X
и W ищутся апостериорные оценки вероятности попадания
индивида к в класс 1 в соответствии с теоремой Байеса:
_ A,f(5k|X,wk,S)
пи -Т •
2>,f(Sk|X,wk,I)
i=i
На втором шаге при заданных hkl логарифм функции
правдоподобия log L максимизируется относительно параметров X и W.
Процесс повторяется до тех пор, пока приращение функции на
следующей итерации не будет меньше некоторого заданного б.
Аналогичный подход использовался и в моделях предпочтений.
Десарбо и др.1 предложили векторную модель предпочтений,
включающую элементы ЛСА, и назвали ее MULTICLUS. Аналогичную
модель предложили Десоет и Винзберг2.
Пусть задана матрица предпочтений Д, элемент бг
соответствует степени предпочтения субъектом i объекта j. Тогда обычную
векторную модель предпочтений можно определить следующим
образом:
R
6ij=XyirXjr>
г=1
где yir—компонент г вектора предпочтений субъекта i, x. —
координата г объекта j, R — размерность пространства.
В упомянутой выше работе Десарбо и др. было предположено,
что все субъекты принадлежат к небольшому числу классов L,
однородных по структуре предпочтений. Каждому классу соответ-
lDeSarbo W. S.. Howard D. J., Jedidi К. MULTICLUS: An approach for
performing simultaneous multidimensional scaling and cluster analysis // Psychometrika.
1991. Vol. 56. P. 105-129.
2 De Soete C, Winsberg S. Latent class vector models for preference ratings // Journal
of Classification. 1993. Vol. 10. P. 195-218.
10*
148 Приложение 3
ствует один вектор предпочтений. Тогда модель можно
определить следующим образом:
R
5iji=Zyirxjr-
r=l
Если предположить, что предпочтения индивида i,
соответствующие строке б. матрицы А являются многомерной нормально
распределенной величиной, тогда для индивида i, принадлежащего
к классу 1,
6;~К(у,Хт,1),
а соответствующая функция плотности распределения
fCS.IypX.S).
Пусть вероятность любого индивида принадлежать к классу 1
равна Л;, причем
1=1
Тогда функция плотности распределения для б; равна
g(6i|Y,X,A,I) = 5>,f(6i|yl,X,I).
1=1
Соответствующая функция правдоподобия для независимых
наблюдений будет иметь вид
L = ng(8i|Y,X,A,S).
i=l
Параметры модели оцениваются с помощью метода
максимального правдоподобия.
Приложение 3
149
В работе Десоете и Хейзера1 данный подход используется для
модели развертывания или «идеальной точки». В модели
«идеальной точки» предполагается, что субъекты оценивают объекты в
соответствии с их близостью к некому идеалу. Таким образом,
каждому субъекту соответствует «идеальная точка». Чем она
ближе к объекту, тем он более предпочтителен для данного субъекта
Sif=oti-
I>jr-yir)2
г=1
Модель Десоете и Хейзера аналогична описанной выше
модели Десарбо и др. В ней также предполагается, что все индивидумы
принадлежат к небольшому количеству латентные классов.
Каждому из классов соответствует своя «идеальная точка».
Аналогично полагаем, что 6f является многомерной нормально
распределенной случайной величиной. Для субъекта i, принадлежащего
к классу 1,
6;~К(ц„1),
где Mij = ct, -
i
r=l
1(Ут-^г)2
У. Бокенхольт и И. Бокенхольт2, а также Десоете и Десарбо3
предложили аналогичные модели для анализа данных о выборе.
В этих моделях вероятность индивидом i выбрать объект j связана
с расстоянием некоторой функцией полезности U...
1 De Soete С, Heiser J. A latent class unfolding model for analysis single stimulus
preference ratings // Psychometrika. 1993. Vol. 58. P. 545-565.
2 Bockenholt U., Bockenholt I. Constrained latent class analysis: simultaneous
classification and scaling of discrete choice data // Psychometrika. 1991. Vol. 56.
P. 699-716.
3 De Soete G., DeSarbo W. S. A latent class probit model for analyzing pick any /
N data // Journal of Classification. 1991. Vol. 8. P. 45-63.
150
Приложение 3
Необходимо отметить, что описанные выше методы имеют ряд
преимуществ по сравнению с обычными методами МШ.
Во-первых, подобный подход позволяет значительно упростить
результаты анализа, сделать их более удобными для интерпретации.
Во-вторых, эти методы позволяют значительно сократить
набор оцениваемых параметров, что повышает устойчивость
результатов.
Модели МШ для анализа несимметричных матриц близости
До сих пор предполагалось, что матрица близости является
симметричной.
В действительности многие процедуры получения данных
о близости приводят к ситуациям, когда требование
симметричности не выполняется. При изучении восприятия различных
объектов несимметричность оценок близости неоднократно
фиксировалась и изучалась различными авторами (см., например, работы
Тверски1, Шепарда2). Несимметричность также свойственна
таблицам мобильности, данным о цитировании, социометрическим
данным и другой информации, которую можно рассматривать как
данные о близости и анализировать с помощью методов МШ.
В некоторых случаях можно считать, что нарушение
симметричности является следствием ошибок и несущественно. Однако
часто асимметричность несет в себе содержательную информацию
о характере отношений между объектами. Существует ряд
подходов в МШ, которые позволяют анализировать несимметричные
матрицы близости. Эти подходы отличаются предположениями о
природе асимметричности. Обзор различных подходов к анализу
несимметричных матриц близости можно найти в работе Зиелма-
на и Хейзера3.
1 TverskyA. Features of similarity //Psychological Review. 1977. Vol. 84.
2 Shepard R. N. Stimulus and response generalization: A stochastic model relating
generalization to distance in psychological space // Psychometrika. 1957. Vol. 22.
3 Zielman В.. Heiser W. J. Models for asymmetric proximities // British Journal of
Mathematical and Statistical Psychology. 1996. Vol. 49.
Приложение 3
151
Один из подходов основан на предположении, что в основе
формирования матрицы лежит несколько различных процессов.
Например, разные процессы могут формировать отдельные
строки матрицы близости. Примером могут служить социометрические
данные, где каждая строка матрицы состоит из оценок одного из
респондентов других членов группы. Другим примером такого рода
данных могут служить данные о близости, полученные с помощью
метода «чередующегося стандарта».
Одна из причин несимметричности для такого рода данных
может заключаться в том, что близости в каждой из строк
матрицы измерены в разных шкалах. В это случае модель можно
сформулировать следующим образом:
^=Г(бу).
Юнг1 предложил взвешенную модель, в которой каждому
объекту соответствуют веса для каждой из осей.
dij=((x,-xj)Vi(xi-xj)T)2,
где V. — диагональная матрица весов. Вес можно
интерпретировать как важность соответствующей оси пространства при оценке
различия между i и прочими объектами. В этой модели каждому
объекту соответствует свое пространство, которое получается за
счет расширения или сжатия общего пространства. Пояснить эту
модель можно на примере социометрических данных.
Можно предположить, что, давая оценки другим членам
группы, респонденты учитывают одни и те же личностные
характеристики, однако каждый из них придает им разную важность, что
соответствует различным весовым коэффициентам.
Юнг также предложил обобщение этой модели для нескольких
матриц близости:
1 Young F. W. Multidimensional scaling: history, theory, and applications /
R. M. Hamer, ed. Hillsdale, N. J.: L. Erlbaum Associates, 1987.
152
Приложение 3
dgk=((xi-xj)ViWk(xi-xj)T)2,
где Wk — диагональная матрица весов. Веса соответствуют
важности соответствующих осей при оценке сходства объектов в
ситуации к1.
Еще один широко распространенный подход к анализу
несимметричных матриц близости основан на моделях отклонения от
симметричности.
Он базируется на предположении о том, что в основе оценок
близости действительно лежат латентные факторы,
обусловливающие симметричные отношения близости между объектами,
однако существует некий фактор или факторы, которые вызывают
отклонение наблюдаемых оценок от симметричности. Холман2
предложил общую модель МШ, в которой несимметричность
моделируется за счет двух аддитивных компонентов.
Константин и Гоуер3 предложили разложение исходной матрицы
близости на сумму симметричной и асимметричной составляющих
Д = Дс„м+ДасИм>
где
Дсим=(Д + Дт)/2,
Дасим=(Д-Дт)/2.
Симметричная составляющая матрицы Дсим анализируется
обычными методами МШ, а асимметричную составляющую Дасим
предлагается представить следующим образом:
п/2
i=l
1 Nosovsky R. M. Similarity scaling and cognitive process models // Annual review
of Psychology. Vol. 43. 1992. P. 25-53.
2 Holman E. W. Monotonic models for asymmetric proximities // Journal of
Mathematical Psychology. 1979. Vol. 20.
3 Constantine A. C, Cower J. C. Graphical representation of asymmetric matrices//
Applied statistics. 1978. Vol. 27. Issue 3.
Приложение 3
153
Для аппроксимации используется только первая пара
собственных чисел, тогда объекты можно представить как точки в
двумерном пространстве с координатами (uu, vH). Асимметричная
составляющая равна удвоенной площади треугольника, образованного
началом координат и соответствующей парой точек. Направление
показывает знак асимметричного компонента.
Частным случаем является простая линейная модель, где
Aac„M^(wlT-lwT).
Вике и Бентлер1 предложили моделировать несимметричность
с помощью аддитивных констант по столбцу и по строке:
6ij=a + bdij+ci-cj+eij-
Их модель аналогична простой линейной модели
асимметричности, предложенной Константином и Гоуером, а также может
рассматриваться как частный случай общей модели Холмана.
Аналогичная модель была предложена Саито2. Окадо и Имаизуми
предложили неметрическую версию модели3, а также обобщили эту
модель для случая с несколькими матрицами близости4.
Зейлман и Хейзер5 предложили модель «вектора смещения»,
идея которой была высказана Краскалом. Сходную модель также
предложил Гоуер. В этой модели асимметричность связана с осями
получаемого пространства:
1 Weeks D. С, Bentler P. M. Restricted multidimensional scaling models for
asymmetric proximities // Psychometrika. 1982. Vol. 47. № 2.
2 Saito T. Analysis of asymmetric proximity matrix by a model of distance and
additive terms // Behaviormetrika. 1991. Vol. 29.
3 Okada A., Imaizumi T. Nonmetric multidimensional scaling of asymmetric
proximities // Behaviormetrika. 1987. Vol. 21.
4 Okada A., Imaizumi T. Asymmetric multidimensional scaling of two-mode three-
way proximities // Journal of Classification. 1997. Vol. 14.
s Zielman В., Heiser W. J. Analysis of asymmetry by a slide-vector// Psychometrika.
1993. Vol. 58. № 1.
154 . Приложение 3
diJ =
l
( R ^2
£(xir-xjr + zr)2
Модель Зейлмана и Хейзера является ограниченным
вариантом модели развертывания. Зейлман и Хейзер также предложили
обобщение модели для случая нескольких матриц близости.
Крумхансл1 предложила модель асимметрии, где
асимметричность связана с плотностью распределения объектов в
пространстве. Одной из возможных интерпретаций этой модели может быть
следующая: чем более дифференцирован объект, тем больше его
отличие от менее дифференцированных объектов, и наоборот.
Предполагается, что
dij=dij+a*li+brij,
V 1
где, например, цл = 2_,~-
j=i du
Десарбо и др.2 реализовали эту модель и продемонстрировали
ее возможности на реальных данных.
Заключение
В настоящем обзоре были представлены ключевые этапы
развития метода МШ, а также несколько наиболее заметных
направлении дальнейшего развития метода. Большое количество
новых разработок в этой области, часть из которых отражены
1 Krumhansl С. L. Concerning the applicability of geometric models to similarity
data: the interrelationship between similarity and spatial density // Psychological review.
1978. Vol. 85.
2 DeSarbo W. S., Manrai A. K. A new multidimensional scaling methodology for
the analysis of asymmetric proximity data in marketing research // Marketing Science.
1992. Vol. 11. № 1.
Приложение 3
155
в обзоре, косвенно говорит об актуальности этого направления
анализа данных.
Необходимо отметить следующие особенности развития
методов МШ.
В последние годы был предложен целый ряд новых моделей.
Это связано прежде всего с развитием численных методов
оптимизации и вычислительной техники. Однако этот поток новых идей
получает слабый отклик в области прикладных исследований.
Во многом это объясняется отсутствием доступного
программного обеспечения, в котором был бы реализован тот или иной метод.
Кроме того, предлагаемые в большом количестве новые
модели требуют тщательной проверки и сравнения. В этой области
также наблюдается существенный пробел.
Метод МШ может с успехом применяться в исследовательской
практике социологов.
Автор надеется, что данный обзор будет способствовать
развитию этого направления и его использованию в отечественной
науке.
предметный указатель
Аксиома 35-37, 39,89
Близости (между объектами) 23-29,
32, 35, 39,40,49-52, 57, 69, 72, 74,
85-87, 89, 93,104-106,116, 117, 121,
128,136,150
Визуализация данных 91, 93-95
Интерпретация результатов
многомерного шкалирования 33,
37,43, 68, 77, 78, 80, 81, 83-85, 88
Латентная (скрытая) переменная (ось,
фактор) 20,63,73,76,80,81,83,
89,92,93,96,122,137
Латентно-структурный анализ 135,
145
Математическая система 47-49
Матрица «объект-признак» 16,17,22
Метод главных компонент 87,114,
115
Метод триад Келли 90
Методы классификации (кластерный
анализ) 38,84,115,116,145
Метрика (признакового
пространства) 55,57, 126
Модели восприятия 18,26,63,76,77
векторная 26, 133
идеальной точки 26, 63, 65, 76,
133, 149
Оси (пространства восприятия) 13,
14, 19, 33,40, 42-44, 55, 57, 58, 68,
78, 80, 82, 122
Отношение порядка 21
Поворот (вращение) осей пространства
восприятия 40,42-46, 81,131
Понижение (снижение) размерности
признакового пространства 10,91,
93,95,96,113,114
Правило треугольника 35, 37-39,
106
Признаковое пространство 13,16,
18-20,25,26,44,65,76,104
Пространство восприятия 11-14,19,
24-26, 33, 65, 89-91
Процедуры опроса 71
Развертывание
одномерное 40, 62, 64, 66
многомерное 40, 127
неметрическое 62, 65, 66, 75-77,
79,80
Различия (между объектами) 23,25,
28,52,85,116,123-125,143
Размерность пространства
восприятия 14, 21, 30, 40-42, 46,
64,81
Ранжировка 26,62-67,75-77,79, 80
Расстояния (между объектами) 25,
27, 35, 40, 52, 85, 86, 89,104-106,
116, 124, 125, 128, 136, 140
евклидово (евклидова
метрика) 32, 92,126
взвешенное евклидово 61
Предметный указатель
157
Хэмминга 73
Регрессионный анализ (регрессионная
зависимость, регрессия) 87,108,
ПО, 111
Регрессия монотонная 54, 68, 104,
108,110,112
Семантический дифференциал
(семантическая дифференциальная
шкала) 92,93
Теория измерений 47
Факторный анализ 115
Формирование исходных данных
(сбор данных) 76, 92
«психологический» подход 69,
70,73
«непсихологический»
подход 70,72
Функция стресса (стресс, функция
соответствия) 28,30,35,51-53,61,
64, 67, 81, 106, 126-129
Шкала
интервальная 30, 33, 44, 45,
50-52, 62
одномерная 1,62
оценочная II, 17-19, 62, 63, 70
порядковая 50,51,62, 79,117
Шкалирование 31
одномерное 48,63
многомерное 6-10,19,23,25-28,
37,44,46,47,49-51,63,72,73,76,
78, 79, 88, 96,104,116,121,122,
127,130,144,150,154,155
индивидуальное 45, 55, 57,130,
131, 145, 146
метрическое 47, 51, 52, 85,121
неметрическое 30,41,51,53,69,
76,77,104,106,117,125,127
Шкальная оценка объекта 13
Шкалируемые объекты 31,49, 64
Эмпирическая система 47-50