Другая психология » Специальная психология » Понятия стандартизации, надежности, валидности как основные психометрические свойства методик

Понятия стандартизации, надежности, валидности как основные психометрические свойства методик
Страница 2

То есть оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И если испытуемый набрал на 6 очков больше, чем «средний» испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения.

Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью, и его нельзя использовать как измерительный инструмент.

Показатель надежности R, который принято считать достаточно высоким, равен или превышает 0,95. Хотя в личностных тестах часто пользуются значительно менее надежными тестами с показателями 0,8 - 0,9.

Валидность теста

Соответствие теста измеряемому психическому свойству называется ВАЛИДНОСТЫО теста. Это, без преувеличения, важнейшее психометрическое свойство теста. Если высокая надежность теста говорит нам о том, что тест действительно «что-то» измеряет, то высокая валидность указывает на то, что тест измеряет именно то, что мы хотим. Конечно, на валидность теста также негативно влияют случайные факторы. Поэтому в психометрике принято следующее основное психометрическое неравенство:

ВАЛИДНОСТЬ ≤ НАДЕЖНОСТЬ,

что означает, что валидность не может превышать надежность теста.

Но в отличие от надежности помимо случайных факторов на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты. Эти факторы есть другие психические свойства, которые мешают проявиться в результатах теста тому свойству, на которое тест направлен.

Например, мы хотим измерять «потенциал обучаемости» (важнейший компонент общих интеллектуальных способностей человека). Но даем испытуемому тест с жестким ограничением времени исполнения и отсутствием возможности вернуться и исправить допущенную ошибку. Совершенно очевидно, что искомое психическое свойство оказывается смешанным в тесте с ложным психическим свойством - «стрессоустойчивостью»: испытуемые с высокими показателями стрессоустойчивости будут лучше выполнять тест. В этом проявится эффект систематического искажения.

В современной психометрике разработаны буквально десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом практически всех этих методов является так называемый «критерий». КРИТЕРИЙ ВАЛИДНОСТИ - это независимый от теста, внешний по отношению к тесту источник информации об измеряемом психическом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или хотя бы заведомо более валидной) информации об измеряемом свойстве - с критерием.

Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизация тестового балла».

Пусть мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет.д.ля такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.

Выборка, на которой определяются статистические тестовые нормы, называется ВЫБОРКОЙ СТАНДАРТИЗАЦИИ. Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм - в эксперименте по стандартизации теста.

Страницы: 1 2 3


Профессиограмма государственного служащего
Рассмотрим создание профессиограммы на примере профессии государственный служащий (государственная гражданская служба). Из всего многообразия методов профессиографии нами выбраны методы: социологические - опрос, включенное наблюдение, психологические – беседа, наблюдение. ...

Секс как наука и искусство
Можно ли назвать секс наукой или искусством? Или тем и другим вместе взятыми? Или лучше сформулировать вопрос таким образом: чем является секс для многих людей и чем он может и должен быть по идее? И какой взгляд на секс отвечает интересам людей в первую очередь? Формирует наше отношение к сексу общество, в котором мы существуем. И не ...

Диагностика родительских представлений о готовности их детей к школе
Ряд психологов признают, что в числе факторов способных затормозить или ускорить формирование психологической готовности ребенка к школе, затруднить или облегчить адаптацию к ней, существенное место занимают особенности семейной микросреды, позиция родителей ребенка. Некоторые исследователи считают главной причиной возникновения школьно ...

Copyright © 2019 - All Rights Reserved - www.psyhologykey.ru