Какие данные соответствуют номинальной шкале
Перейти к содержимому

Какие данные соответствуют номинальной шкале

  • автор:

Тема 3. Номинальная шкала: способы измерения и анализа

С помощью номинальной шкалы мы измеряем такие переменные, которые в принципе не могут количественно отличаться друг от друга, то есть, только упорядочиваем измеряемое свойство. Другое название этого уровня измерений — шкала наименований, что довольно точно отражает его сущность: каждое значение здесь представляет собою отдельную категорию, и значение является просто своего рода ярлыком или именем. Значения присваиваются переменной безотносительно к упорядочиванию или установлению какой-то дистанции между категориями — во многом в том же смысле, в каком люди носят свои имена. Их невозможно сравнивать между собою по принципу «больше — меньше», «выше — ниже» и т. п. Так, если бы мы захотели рассчитывать средние значения переменных, измеренных по номинальной шкале, то это было бы пустой тратой времени, поскольку полученные значения были бы лишены всякого смысла. В самом деле, можно ли рассчитать среднее значение пола или рода занятий? В измерениях номинального уровня отсутствуют те свойства, какими обладают реальные числа, а значит, такие переменные невозможно складывать, вычитать, умножать и делить . Поэтому данные, полученные по номинальной шкале, обычно резюмируются с помощью простого частотного распределения так, как это показано в табл. 3.2 и 3.3, где, в качестве примера представлены распределения респондентов по курсам обучения и

по роду их занятий на досуге.

Распределение опрошенных по курсам обучения

Мы видим, что в таблице, помимо указания частоты в абсолютных цифрах, приведены данные в процентах (что указывает на пропорцию, удельный вес каждого из значений определяемой переменной курса или вида досуга). Процентные доли в процессе анализа предпочтительнее распределений абсолютных цифр вследствие того, что они облегчают процесс сравнения двух популяций различных размеров.

Досуговые практики студентов

Предпочитаемые занятия в свободное время

Поэтому нередко, особенно в достаточно больших по размерам таблицах, в целях экономии места показывают только проценты. Частотные распределения в абсолютном выражении допускаются, однако при этом желательно приводить общее число наблюдений и тем самым давать возможность читателю в случае необходимости вычислить долю соответствующего частотного распределения. Пропорции и проценты сообщают нам информацию, которая оказывается более убедительной, значимой и легко запоминаемой, нежели частотное распределение в абсолютных значениях частот. Преимущество становится особенно бесспорным при необходимости последовательного сравнения достаточно длинных рядов распределений.

Для данных номинального уровня измерение центральной тенденции производится с помощью определения моды. Модой, или модальной категорией, называется то значение переменной, которое встречается среди данных наиболее часто, то есть характерно для наибольшего количества респондентов в исследуемой социальной группе. В распределении, представленном в таблице 3.1, модальную категорию представляют собою студенты 4 курса обучения; в таблице 3.2 — это увлечение в свободное время компьютером и, в частности, Интернетом, таких студентов оказалось большинство среди респондентов.

Частотное распределение раскрывает не только центральную тенденцию, но и дисперсию данных. Дисперсия характеризует разброс значений переменной. Для данных номинального уровня наибольший уровень дисперсии проявляется, когда наблюдения распределены поровну между категориями. Поэтому можно считать, что данные табл. 3.2 весьма дисперсны, поскольку имеется приблизительно одинаковое число студентов разных курсов обучения. Полное отсутствие дисперсии проявляется в тех случаях, когда все наблюдаемые значения переменной совершенно однородны, т. е. попадают в одну и ту же категорию.

При проведении одномерного анализа могут обнаружиться такие характеристики данных, которые представляют собой существенные препятствия для дальнейшего анализа данных. Представьте, например, что вы намереваетесь изучить взаимосвязь между полом и родом занятий, и обнаружили, что в выборке опроса оказались одни лишь мужчины. Поскольку налицо отсутствие дисперсии (т. е. нет вариаций по одной из ключевых переменных—полу), каких-либо сравнений провести нельзя. Урок, который необходимо из этого усвоить, состоит в следующем: нет изменения нет сравнения. А процедура сравнения являет собою, по своей сути, ядро анализа. При отсутствии изменений вы можете обнаружить какое-то интересное единообразие, но не сможете изучить связей между переменными, то есть выявить, что же происходит с одной из них, когда другая варьирует (изменяется). Самый простой одномерный анализ уже в ходе сбора данных (хотя бы беглый взгляд на частотное распределение) мог бы предостеречь вас от такой опасности.

При анализе рядов распределений, когда мы выявляем центральную тенденцию, следует сразу обращать внимание на максимальные и минимальные значения изучаемой переменной. Другими словами, когда вы имеете дело с переменной, принимающей целый ряд значений, анализ следует начинать с акцента на самом большом и самом маленьком значении — это сразу дает вам представление о масштабах изменения рассматриваемой переменной и о дисперсии.

Уровни измерения и их точность

Дмитрий ПереводIT

Измерение — это процесс присвоения чисел количествам (переменным). Этот процесс настолько знаком, что мы, наверняка, часто упускаем из виду его фундаментальные характеристики. Единая мера некоего атрибута (к примеру, веса) взятого образца называется статистикой. Эти атрибуты также имеют наследуемые свойства, схожие с числами, которые мы им присваиваем в процессе измерения. Присваивая числа атрибутам, мы можем допускать неточности, тогда свойства чисел не будут соответствовать свойствам атрибутов. В такой ситуации мы получаем “низкий уровень измерения” (другими словами, низкую точность). Точность же относится к абсолютной разнице между измеренным и реальным значениями. И наоборот, если свойства присвоенных чисел должным образом соответствуют свойствам присвоенных атрибутов, то мы получаем высокий уровень измерения (т.е. высокую точность).

Введение различных уровней измерения приписывают американскому статистику Стенли Смиту Стивенсу. В 1946 году он сказал: “Все измерения в науке проводятся при помощи четырёх разных типов шкал: номинальной, порядковой, интервальной и коэффициента.” Эти уровни расположены в порядке возрастания согласно повышению точности. Это значит, что номинальный уровень имеет самый низкий уровень точности, а коэффициент высочайший. Для дальнейшего рассуждения будет использован пример, в котором шесть спортсменов проходят отбор на позицию спринтера в гонке. Все они бегут 100-метровый отрезок, а результат измеряется несколькими тренерами, использующими разные секундомеры (от U до Z). Истинное время измеряет только секундомер U, остальные же (от V до Z) показывают ошибочный результат, но на других уровнях измерения. Результаты, полученные после стометровки, приведены в таблице ниже.

Номинальный уровень

Номинальная шкала отражает только эквивалентность (одинаковый показатель или другой) и принадлежность множеству. Эти множества принято называть категориями или метками. Перейдём к рассмотрению результатов забега, приведённых в таблице. Секундомер V практически бесполезен, но он отразил базовое свойство показателей времени забега. А именно то, что два отражённых секундомерами значения будут одинаковыми только, если два фактических времени совпадут. Например, участники Shatakshi и Tejaswini пробежали забег за одно время (13с), и, согласно показаниям секундомера V, это базовое свойство остаётся одинаковым (пр 20с). Глядя на результаты секундомера V, можно обоснованно заключить, что Shakatashi и Tejaswini пробежали забег за одинаковое время. Этот атрибут называется эквивалентностью. Мы можем сделать вывод, что секундомер V достиг лишь номинального уровня измерения. Переменные, оцениваемые по номинальной шкале, называются категориальными. К примерам этого относятся имена, пол, раса, религия, национальность, таксономические разряды, части речи, просроченные и непросроченные товары, здоровый или больной, типы геологических пород и пр. Коррелировать две номинальные категории очень сложно, поскольку любые проявляющиеся связи обычно считаются ложными и, следовательно, не имеющими значения. Например, попытка выяснить имена скольких людей из Ассама начинаются с буквы ‘A’ оказалась бы чисто произвольной задачей со случайным результатом.

Порядковый уровень

Порядковая шкала в дополнение ко всем атрибутам, отражённым номинальным уровнем, отражает атрибут рангового порядка. Снова вернёмся к результатам соревнования. Возрастающий порядок времени, затраченного участниками согласно показателям истинного времени (соответствующий ранг указан в скобках), будет следующим: Navjot (1), Surbhi (2), Sayyed (3), Shatakshi/Tejaswini (4) и Shweta (5). Кроме отражения свойства совпадения/отличия номинального уровня, секундомеры W и X отразили верный порядок итогов забега. Мы говорим, что секундомеры W и X достигли порядкового уровня измерения. Примеры измерений на этом уровне включают баллы IQ, академические баллы (оценки), процентили и т.д. Ранговое упорядочение (порядковое измерение) возможно производить при помощи субъективных измерительных опросов. К примеру, опрос общественности в Индии для измерения её согласия с утверждением, что “Люди произошли от животных.” включал выбор участниками подходящего ответа из вариантов: ‘полностью согласен’, ‘скорее согласен’, ‘скорее несогласен’, ‘совершенно несогласен’.

Интервальный уровень

Шкала интервалов в дополнение ко всем атрибутам номинального и порядкового уровней отражает атрибут относительного расстояния. Другими словами, измерения на интервальном уровне находятся в правильной пропорции. Снова рассмотрим результаты соревнования. Значения в колонке Y (показания секундомера Y) при помощи простой формулы, являющейся линейным уравнением, могут быть получены из значений в колонке U (показания секундомера U):

Например, первые показания, 21 (время забега Surbhi) могут быть получены подстановкой в формулу выше: Y=(2x 10)+1=21.

Отличительной чертой шкалы интервалов является ‘относительное расстояние’ или пропорция. Коэффициенты разности значений на интервальном уровне остаются такими же, как и у истинного времени. Например, рассмотрим значения в колонке Y (Shatakshi-Surbhi)/(Sayyed-Surbhi)

Давайте выполним ту же операцию для значений из колонки U:

Обратите внимание, что относительное расстояние, 3, остаётся одинаковым между измерением на интервальном уровне и измерением реального времени. Другими словами, глядя на секундомер Y, можно с уверенностью заключить, что разница во времени (Shatakshi-Surbhi) в три раза (относительное расстояние 3) больше разницы времени (Sayyed-Surbhi). При измерении интервалов разница между двумя значениями играет важную роль. Тем не менее стоит отметить, что абсолютное расстояние различно, и совпадает лишь относительное. Когда числа отражают совпадение/различие, имеют правильный порядок и правильное относительное интервальное расстояние, мы говорим, что они достигли интервального уровня измерения.

Один из примеров измерения на уровне интервалов — это шкала Цельсия. Единицы измерения в Цельсиях (т.е. 1 °C) определяются как “1/100 разницы температур между точками замерзания и закипания воды при давлении в 1 атмосферу”. Обратите внимание, что определение основано на принципе относительного расстояния, описанном выше. Поскольку уровень интервальный, абсолютное расстояние окажется неподходящим. Тем не менее будет правильным заключить, что: “разница между температурой 50 °C и 40 °C такая же, как между 20 °C и 10 °C.”

Кроме того, стоит заметить, что показания ‘0’ не соответствуют отсутствию измеряемого на этом уровне атрибута. Например, 0 °C не означает отсутствие температуры. Другие примеры измерений, попадающих в интервальную шкалу, включают температуру по шкале Фаренгейта, проценты, даты, измеряемые от произвольной эпохи (например от Рождества Христова), положение по декартовым координатам, географическое положение по широте и долготе, высоту над уровнем моря, направление, измеряемое в градусах от истинного или магнитного юга и т.д.

Уровень коэффициента

Шкала коэффициента в дополнение ко всем атрибутам, отражённым номинальным, порядковым и интервальным уровнями, отражает атрибут коэффициента. И снова вернёмся к результатам в таблице. Значения в колонке Z (показания секундомера Z) могут быть получены из показаний колонки U (секундомер U — истинное время) с помощью простой формулы:

Коэффициент измерений между Z и U остаётся одинаковым. Например, коэффициент соотношения (Sayyed/Shatakshi) в колонке Z (22/26) такой же, как и в колонке U (11/13). Глядя на колонку Z, можно уверенно заключить, что “Shweta бежал вдвое дольше, чем Surbhi”. Также обратите внимание, что точка отсчёта секундомера верна. Navjot не участвовал в забеге, поэтому в показаниях секундомеров U и Z мы видим 0. Отсюда следует, что шкала коэффициента имеет ‘абсолютный ноль’ (точку, где измеряемых качеств не существует). Например, ‘ноль градусов’ на шкале Кельвина (находящейся на уровне коэффициента) означает полное отсутствие температуры.

Большая часть научных и инженерных измерений выполняется на шкалах коэффициента. В науке измерение обычно определяется как вычисление коэффициента между значением непрерывной величины и величиной единицы измерения того же рода. Некоторые примеры измерений по шкале коэффициента: концентрация химического вещества, плотность потока фотосинтетических фотонов, температура в Кельвинах, масса, длина, время, угол на плоскости, энергия, давление и электрический заряд.

Определить по какой шкале производится измерение: интервальной или коэффициента можно, задав два вопроса: имеет ли здесь смысл ноль? Допустимы ли операторы удвоения или деления пополам?

Также важно отметить, что некоторые научные измерения не попадают ни в один из этих уровней. Их примеры включают шкалу pH и значения logIC50. Оба этих измерения проводятся по логарифмической шкале. Как бы то ни было, когда эти значения выражаются на шкале концентрации (H+ion концентрация для значений pH или IC50), измерения попадают в уровень коэффициента.

Измерение и шкалы

Любая система содержит очень много различной информации. Конечно же, не вся она нам нужна, но ту, которая нам нужна, надо как-то измерить и преобразовать. Для этого информации нужно предать какую-нибудь форму, то есть перевести её в данные. Например, общую информацию о том, что потребителям нравится наша продукция, и они согласны покупать её в большем количестве, можно формализовать, проведя исследования и дав оценку удовлетворённости покупателей. В результате этого мы получим данные, с которыми можно уже работать и на основе которых можно принимать решение.

Во время такого преобразования исследователь явно или неявно выбирает шкалу, в которой он будет измерять данные. Существует много различных классификаций шкал, и даже есть специальный раздел математики, изучающий шкалы и операции с ними — теория измерений. Не вдаваясь в детали это дисциплины, рассмотрим то, что может нам пригодиться в прогнозировании.

Принято считать, что любая шкала может обладать следующими характеристиками:

  • описание,
  • порядок,
  • расстояние,
  • естественная точка отсчёта,
  • естественная единица измерения.

Последняя характеристика обычно опускается, так как для целей исследования особо полезной информации не несёт. С точки зрения прогнозирования выделение следующих четырёх видов шкал (упорядоченных по уровню) на основе первых четырёх характеристик вполне достаточно для использования по максимуму различных математических и не математических методов:

1. Номинальная шкала

Шкала, в которой есть только характеристика «описание». В ней нет естественного упорядочения, нет расстояния между элементами и тем более нет естественной точки отсчёта. С данными, измеренными в номинальной шкале возможна только одна операция — сравнение в форме «равно» или «неравно». То есть обладает ли объект указанным свойством или нет.

Пример (шутливый). Туристы бывают:

  • белые,
  • китайцы,
  • русские,
  • женщины,
  • другие.

Из-за ограниченности номинальной шкалы, практически всё, что можно сделать с данными, измеренными в ней — это посмотреть на количество объектов, имеющих указанные признаки. Например, мы можем понять, сколько в нашем распоряжении оказалось китайских туристов, какой процент от всех туристов они составляют. Если в нашем распоряжении несколько величин, измеренных в номинальной шкале, мы можем, например, использовать коэффициент сопряжённости, для того, чтобы оценить, есть ли связь в выборе признака в одной шкале с выбором признака в другой.

Для целей анализа номинальную шкалу бывает удобно трансформировать в бинарную, в которой «1» соответствует наличию, а «0» — отсутствию свойства. В случае с нашими туристами мы получим соответственно 5 новых переменных, измеренных в такой бинарной шкале.

2. Порядковая (ранговая) шкала

Это уже более сложная шкала, в ней появляется вторая характеристика — «порядок». Данные, измеренные в этой шкале можно сравнить и упорядочить, однако сказать насколько (и уж тем более во сколько раз) одна величина больше другой нельзя. То есть к операциям с данными, в этой шкале добавляется «больше» и «меньше».

Пример. Туристы бывают:

  • грустные,
  • нейтральные,
  • весёлые.

В этом примере, как видим, туристы упорядочены по настроению, но при этом нет возможности сказать, насколько один может быть веселее другого. К порядковой шкале будет относиться даже шкала, которая на первый взгляд не выглядит как порядковая.

Пример. Туристы бывают:

  • от 10 до 15 килограмм,
  • от 15 до 20 килограмм,
  • от 20 до 100 килограмм,
  • больше 100 килограмм.

Измерить расстояние между элементами в такой шкале не представляется возможным, поэтому она порядковая.

Точно так же оценки за экзамен измеряются в порядковой шкале: разница между 5 и 3 формально равна двум, но при этом не имеет смысла, так как в этой шкале двойка — это просто ещё одна оценка. Если по курсу вначале получить 3,а потом — 2, то пятёрки не получится.

В порядковой шкале можно уже использовать некоторые базовые статистические инструменты. Например, можно оценить моду, для того, чтобы понять, туристы какого веса чаще встречаются в выборке. Можно так же рассчитать ранговый коэффициент корреляции (Спирмена либо Кендалла), который может показать, есть ли статистическая линейная связь между весом туристов и их настроением. Расчёт средней величины (а так же медианы и стандартного отклонения) в порядковой шкале возможен, но в этом случае получаемое значение будет просто добавлять в нашу шкалу новые значения, но не более того. Например, если в шкале оценок за экзамены появилась «4.5» (как средняя между «4» и «5»), то это значение просто расширяет нашу шкалу, которая теперь будет содержать: «2», «3», «4», «4.5» и «5». Расстояние между «4» и «4.5», а так же «4.5» и «5» всё так же невозможно адекватно измерить.

3. Интервальная шкала

В интервальной шкале добавляется ещё одна характеристика — расстояние, но в ней всё так же отсутствует естественная точка отсчёта. Приемлемые операции в этой шкале (плюс к тем, которые уже были) — сложение и вычитание. Однако операции деления и умножения в этой шкале бессмысленны.

Пример. Температура туриста.

Если температура одного туриста — 36.6ºC, а другого — 18.3ºC, то мы можем сказать, что второй турист холоднее первого на 18.3ºC, но сказать, что первый турист горячее второго в два раза нельзя — это не имеет смысла. А всё потому что 0ºC — это не естественная точка отсчёта, а искусственная, привязанная к температуре замерзания воды. Если в качестве точки отсчёта в этой шкале взять, например, абсолютный ноль, то этот бессмысленный эффект «первый в два раза горячее второго» пропадёт.

В интервальной шкале имеют смысл и средняя величина, и медиана, и стандартное отклонение, и квантили распределения. Если очень хочется, то можно рассчитать и коэффициент корреляции Пирсона, который покажет, есть ли линейная связь между показателями.

4. Абсолютная шкала.

Это последний тип шкалы, и он имеет все рассмотренные нами характеристики. Наличие естественной точки отсчёта означает, что когда показатель принимает значение «0», то это говорит о том, что исследуемое свойство у объекта просто отсутствует. В этой шкале возможны все математические операции.

Пример. Количество туристов в комнате.

Думаю, комментарии к этому примеру излишни.

У шкал есть одно удобное свойство: любые данные, измеренные в шкале более высокого уровня, можно легко преобразовать в данные, измеренные в шкале более низкого уровня.
Например, количество туристов в комнате можно перевести в интервальную шкалу, если это количество центрировать относительно какой-нибудь величины (то есть фактически избавиться от естественной точки отсчёта). В таком случае положительное число будет означать превышение установленного лимита, а отрицательные — занижение. Ноль в таком случае будет соответствовать искусственной точке, в которой количество соответствует выбранному нами эталону.

Если провести ещё одну свёртку данных и избавиться от расстояний между значениями, то можно получить порядковую шкалу, например, следующего вида:

  • менее 5 туристов,
  • от 5 до 10 туристов,
  • более 10 туристов.

Продолжая упрощения, избавляясь от порядка, можно предложить простейшую номинальную шкалу:

  • 5 туристов,
  • не 5 туристов.

Очевидно, что обратное преобразование невозможно. Если мы изначально собирали данные в номинальной шкале, то получить из них данные, измеренные в шкале более высокого уровня, в принципе невозможно.

И последнее. В случае, если оказывается нужно оценить связь между показателями, измеренными в разных шкалах, нужно использовать коэффициенты, предназначенные для шкал более низкого уровня. Например, для определения связи настроения туриста с его температурой стоит обратиться к ранговому коэффициенту корреляции.

Типы статистических шкал

В эмпирическом исследовании могут встречаться, к примеру, следующие переменные (указано их наиболее вероятное кодирование):

Пол 1 = мужской
2 = женский
Семейное положение 1 = холост/не замужем
2 = женат/замужем
3 = вдовец/вдова
4 = разведен(а)
Курение 1 = некурящий
2 = изредка курящий
3 = интенсивно курящий
4 = очень интенсивно курящий
Месячный доход 1 = до 3000 DM
2 = 3001 — 5000 DM
3 = более 5000 DM
Коэффициент интеллекта (I.Q.)
Возраст (лет)

Рассмотрим сначала графу «Пол». Мы видим, что назначение соответствия цифр 1 и 2 обоим полам абсолютно произвольно, их можно было поменять местами или обозначить другими цифрами. Мы, конечно, не имеем в виду, что женщины стоят на ступеньку ниже мужчин, или мужчины значат меньше, чем женщины. Следовательно, отдельным числам не соответствует никакою эмпирического значения. В этом случае говорят о переменных, относящихся к номинальной шкале. В нашем примере рассматривается переменная с номинальной шкалой, имеющая две категории. Такая переменная имеет еще одно название — дихотомическая.

Такая же ситуация и с переменной «Семейное положение». Здесь также соответствие — между числами и категориями семейного положения не имеет никакого эмпирического значения. Но в отличии от Пола, эта переменная не является дихотомической — у нее четыре категории вместо двух. Возможности обработки переменных, относящихся к номинальной шкале очень ограничены. Собственно говоря, можно провести только частотный анализ таких переменных. К примеру, расчет среднего значения для переменной Семейное положение, совершенно бессмысленен. Переменные, относящиеся к номинальной шкале часто используются для группировки, с помощью которых совокупная выборка разбивается по категориям этих переменных. В частичных выборках проводятся одинаковые статистические тесты, результаты которых затем сравниваются друг с другом.

В качестве следующего примера рассмотрим переменную «Курение». Здесь кодовым цифрам присваивается эмпирическое значение в том порядке, в котором они расположены в списке. Переменная Курение, в итоге, сортирована в порядке значимости снизу вверх: умеренный курильщик курит больше, нежели некурящий, а сильно курящий — больше, чем умеренный курильщик и т.д. Такие переменные, для которых используются численные значения, соответствующие постепенному изменению эмпирической значимости, относятся к порядковой шкале.

Однако эмпирическая значимость этих переменных не зависит от разницы между соседними численными значениями. Так, несмотря на то, что разница между значениями кодовых чисел для некурящего и изредка курящего и изредка курящего и интенсивно курящего в обоих случаях равна единице, нельзя утверждать, что фактическое различие между некурящим и изредка курящим и между изредка курящим и интенсивно курящим одинаково. Для этого данные понятия слишком расплывчаты.

К классическими примерами переменных с порядковой шкалой относятся также переменные, полученные в результате объединения величин в классы, как «Месячный доход» в нашем примере.

Кроме частотного анализа, переменные с порядковой шкалой допускают также вычисление определенных статистических характеристик, таких как медианы. В некоторых случаях возможно вычисление среднего значения. Если должна быть установлена связь (корреляция) с другими переменными такого рода, для этой цели можно использовать коэффициент ранговой корреляции.

Для сравнения различных выборок переменных, относящихся к порядковой шкале, могут применяться непараметрические тесты, формулы которых оперируют рангами.

Рассмотрим теперь «Коэффициент интеллекта (IQ)«. Не только его абсолютные значения отображают порядковое отношение между респондентами, но и разница между двумя значениями также имеет эмпирическую значимость. Например, если у Ганса IQ равен 80, у Фрица — 120 и у Отто — 160, можно сказать, что Фриц в сравнении с Гансом настолько же интеллектуальнее насколько Отто в сравнении с Фрицем (а именно — на 40 единиц IQ). Однако, основываясь только на том, что значение IQ у Ганса в два раза меньше, чем у Отто, исходя из определения IQ нельзя сделать вывод, что Отто вдвое умнее Ганса.

Такие переменные, у которых разность (интервал) между двумя значениями имеет эмпирическую значимость, относятся к интервальной шкале. Они могут обрабатываться любыми статистическим методами без ограничений. Так, к примеру, среднее значение является полноценным статистическим показателем для характеристики таких переменных.

Наконец, мы достигли наивысшей статистической шкалы, на которой эмпирическую значимость приобретает и отношение двух значений. Примером переменной, относящейся к такой шкале является «Возраст«: если Максу 30 лет, а Морицу 60, можно сказать, что Мориц вдвое старше Макса. Шкала, к которой относятся данные называется шкалой отношений. К этой шкале относятся все интервальные переменные, которые имеют абсолютную нулевую точку. Поэтому переменные относящиеся к интервальной шкале, как правило, имеют и шкалу отношений.

Подводя итоги, можно сказать, что существует четыре вида статистических шкал, на которых могут сравниваться численные значения:

Статистическая шкала Эмпирическая значимость Примеры
Номинальная Нет Пол, семейное положение
Порядковая Порядок чисел Курение, месячный доход
Интервальная Разность чисел Коэффициент интеллекта (I.Q.)
Шкала отношений Отношение чисел Возраст (лет)

На практике, в том числе в SPSS, различие между переменными, относящимися к интервальной шкале и шкале отношений обычно несущественно. То есть в дальнейшем практически всегда речь будет идти о переменных, относящихся к интервальной шкале.

Пользователь SPSS должен четко разбираться в видах статистических шкал и при выборе метода обращать внимание на то, чтобы были определены надлежащие виды шкал.

Мы уже указывали, что переменные, относящиеся к номинальной шкале допускают весьма ограниченные возможности для проведения анализа. Исключение в некоторых ситуациях составляют дихотомические переменные. Для них можно, по крайней мере, определять ранговую корреляцию. Если, например, обнаруживается корреляция коэффициента интеллекта с полом, то положительный коэффициент корреляции означает, что женщины интеллектуальнее, чем мужчины. Однако если переменные, относящиеся к номинальной шкале не являются дихотомическими, вычисление коэффициентов ранговой корреляции не имеет смысла.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *