Другая психология » Специальная психология » Понятия стандартизации, надежности, валидности как основные психометрические свойства методик

Понятия стандартизации, надежности, валидности как основные психометрические свойства методик
Страница 2

То есть оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И если испытуемый набрал на 6 очков больше, чем «средний» испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения.

Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью, и его нельзя использовать как измерительный инструмент.

Показатель надежности R, который принято считать достаточно высоким, равен или превышает 0,95. Хотя в личностных тестах часто пользуются значительно менее надежными тестами с показателями 0,8 - 0,9.

Валидность теста

Соответствие теста измеряемому психическому свойству называется ВАЛИДНОСТЫО теста. Это, без преувеличения, важнейшее психометрическое свойство теста. Если высокая надежность теста говорит нам о том, что тест действительно «что-то» измеряет, то высокая валидность указывает на то, что тест измеряет именно то, что мы хотим. Конечно, на валидность теста также негативно влияют случайные факторы. Поэтому в психометрике принято следующее основное психометрическое неравенство:

ВАЛИДНОСТЬ ≤ НАДЕЖНОСТЬ,

что означает, что валидность не может превышать надежность теста.

Но в отличие от надежности помимо случайных факторов на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты. Эти факторы есть другие психические свойства, которые мешают проявиться в результатах теста тому свойству, на которое тест направлен.

Например, мы хотим измерять «потенциал обучаемости» (важнейший компонент общих интеллектуальных способностей человека). Но даем испытуемому тест с жестким ограничением времени исполнения и отсутствием возможности вернуться и исправить допущенную ошибку. Совершенно очевидно, что искомое психическое свойство оказывается смешанным в тесте с ложным психическим свойством - «стрессоустойчивостью»: испытуемые с высокими показателями стрессоустойчивости будут лучше выполнять тест. В этом проявится эффект систематического искажения.

В современной психометрике разработаны буквально десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом практически всех этих методов является так называемый «критерий». КРИТЕРИЙ ВАЛИДНОСТИ - это независимый от теста, внешний по отношению к тесту источник информации об измеряемом психическом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или хотя бы заведомо более валидной) информации об измеряемом свойстве - с критерием.

Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизация тестового балла».

Пусть мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет.д.ля такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.

Выборка, на которой определяются статистические тестовые нормы, называется ВЫБОРКОЙ СТАНДАРТИЗАЦИИ. Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм - в эксперименте по стандартизации теста.

Страницы: 1 2 3


Представления об отцовстве по материалам научных исследований
Социальные исследования отцовства проходят на фоне дискуссий о роли отца в развитии и воспитании детей. В своем недавнем анализе исторических путей развития американского идеала отцовства Плек видит отца как равного в правах с матерями. (С 1900 по 1970 идеальным отцом был отец, исполняющий воспитательные функции, а с 1830 по 1900 только ...

Анализ результатов исследования «Эмоциональная и социальная депривация как фактор формирования девиантного поведения у подростков» на примере подростков Санкт-Петербурга
В связи с чрезвычайной актуальностью данного вопроса нами было проведено исследование на тему: "Эмоциональная и социальная депривация как фактор формирования девиантного поведения у подростков". Изучались подростки в возрасте от 12 до 17 лет включительно. Формирование выборки и описание этапов исследования Объект исследовани ...

Схема профессиограммы
Профессиограммы имеют различное содержание в зависимости от тех целей, для которых они составляются. Основываясь на принципах системного анализа и изучении профессиографической литературы, Э.Ф. Зеером разработана обобщенная схема профессиограммы [1]. ...

Copyright © 2025 - All Rights Reserved - www.psyhologykey.ru