Другая психология » Специальная психология » Понятия стандартизации, надежности, валидности как основные психометрические свойства методик

Понятия стандартизации, надежности, валидности как основные психометрические свойства методик
Страница 2

То есть оказывается, что ошибка измерения перекрывает большую часть разброса тестовых показателей, так как истинный балл по тесту может отклоняться от измеренного балла на целых 7 очков! И если испытуемый набрал на 6 очков больше, чем «средний» испытуемый, мы не можем с достаточной уверенностью (статистической достоверностью) говорить о том, что он значимо превзошел среднего испытуемого, так как это отклонение оказывается в пределах стандартной ошибки измерения.

Таким образом, низкая корреляция результатов теста между первым и повторным тестированием говорит о том, что случайные факторы существенно искажают результаты теста. Это значит, что тест не обладает необходимой помехоустойчивостью, и его нельзя использовать как измерительный инструмент.

Показатель надежности R, который принято считать достаточно высоким, равен или превышает 0,95. Хотя в личностных тестах часто пользуются значительно менее надежными тестами с показателями 0,8 - 0,9.

Валидность теста

Соответствие теста измеряемому психическому свойству называется ВАЛИДНОСТЫО теста. Это, без преувеличения, важнейшее психометрическое свойство теста. Если высокая надежность теста говорит нам о том, что тест действительно «что-то» измеряет, то высокая валидность указывает на то, что тест измеряет именно то, что мы хотим. Конечно, на валидность теста также негативно влияют случайные факторы. Поэтому в психометрике принято следующее основное психометрическое неравенство:

ВАЛИДНОСТЬ ≤ НАДЕЖНОСТЬ,

что означает, что валидность не может превышать надежность теста.

Но в отличие от надежности помимо случайных факторов на валидность теста влияют систематические факторы. Они привносят систематические искажения в результаты. Эти факторы есть другие психические свойства, которые мешают проявиться в результатах теста тому свойству, на которое тест направлен.

Например, мы хотим измерять «потенциал обучаемости» (важнейший компонент общих интеллектуальных способностей человека). Но даем испытуемому тест с жестким ограничением времени исполнения и отсутствием возможности вернуться и исправить допущенную ошибку. Совершенно очевидно, что искомое психическое свойство оказывается смешанным в тесте с ложным психическим свойством - «стрессоустойчивостью»: испытуемые с высокими показателями стрессоустойчивости будут лучше выполнять тест. В этом проявится эффект систематического искажения.

В современной психометрике разработаны буквально десятки разнообразных теоретических и экспериментальных методов проверки валидности тестов. Основным элементом практически всех этих методов является так называемый «критерий». КРИТЕРИЙ ВАЛИДНОСТИ - это независимый от теста, внешний по отношению к тесту источник информации об измеряемом психическом свойстве. Мы не можем судить о валидности теста до тех пор, пока не сравним его результаты с источником истинной (или хотя бы заведомо более валидной) информации об измеряемом свойстве - с критерием.

Первоначальный суммарный балл, подсчитанный с помощью ключа, не является показателем, который можно диагностически интерпретировать. Его называют в тестологии «сырым тестовым баллом». Применение тестовых норм в профессионально организованной психодиагностике основывается на переводе тестовых баллов из «сырой» шкалы в «стандартную». Эта процедура называется «стандартизация тестового балла».

Пусть мы провели тест из 20 заданий и испытуемый дал 12 правильных ответов. Можно ли при этом сказать, что способность у испытуемого выражена лучше или хуже, чем в среднем? Нет.д.ля такого вывода нужно сравнить балл 12 со средним баллом по представительной выборке испытуемых.

Выборка, на которой определяются статистические тестовые нормы, называется ВЫБОРКОЙ СТАНДАРТИЗАЦИИ. Ее численность, как правило, не меньше 200 человек. Столько должны принять участие в психометрическом эксперименте по определению тестовых норм - в эксперименте по стандартизации теста.

Страницы: 1 2 3


Фаллическая фаза
Между тремя и шестью годами интересы ребенка, обусловленные либидо, сдвигаются в новую эрогенную зону, в область гениталий. Фрейд считает, что эту стадию лучше всего характеризовать как фаллическую, поскольку в этот период ребенок либо замечает свой пенис, либо сознает, что у него таковой отсутствует. На этой стадии дети впервые сознают ...

Понятие о способностях. Структура. Врожденное и приобретенное
Понятие способностей. Когда мы пытаемся понять и объяснить, почему разные люди, обстоятельствами жизни поставленные в одинаковые или примерно одинаковые условия, достигают разных успехов, то обращаемся к понятию способности, полагая, что разницу в успехах можно вполне удовлетворительно объяснить ими. Это же понятие используется нами тог ...

Характеристика самосознания. Уровни, структура, компоненты самосознания
Самосознание - сознание субъектом самого себя в отличие от иного — других субъектов и мира вообще; это осознание человеком своего общественного статуса и своих жизненно важных потребностей, мыслей, чувств, мотивов, переживаний, действий. Самосознание не изначальная данность, присущая человеку, а продукт развития. Однако, зачаток сознан ...

Copyright © 2026 - All Rights Reserved - www.psyhologykey.ru