Этапы стандартизации. Педагогическая диагностика в воспитательном процессе. Требования, которым должны удовлетворять задания

24.02.2024

1 этап - Определение количества заданий (спецификация теста)

Прежде чем приступать к созданию теста, необходимо четко знать, для чего он нужен :

Ø формулирование цели будущего теста

Ø разработка спецификации будущего теста (таблица, по горизонтали содержательные области, по вертикали - их манифестации (пути, по которым содержательные области могут проявляться)). При спецификации манифестаций важно выделить различные формы их реализации (4-7 категорий). Далее определяется сколько заданий должно быть создано для каждой из ячеек и какое количество заданий должно быть включено в тест.

2 этап - Разработка заданий

Правила разработки заданий: в каждом задании может быть задан только один вопрос; сформулировано предельно ясно и просто; избегать двусмысленных формулировок и др.

В личностных опросниках, как правило, используют три типа заданий :

Ø дихотомические (задания с альтернативным выбором,которые просты для понимания. Недостаток - обследуемые часто не удовлетворены предлагаемой альтернативой, хотели бы видеть больше вариантов ответа).

Ø трихотомические (три варианта ответа, например «да», «не знаю», «нет». Преимущество - обследуемые могут более точно выразить себя. Недостаток - установка на выбор крайних вариантов ответа).

Ø задания с рейтинговыми шкалами (важно обеспечить достаточное количество градаций ответа, чтобы обследуемые смогли адекватно выразить самих себя). Следует помнить и о том, что в разрабатываемом опроснике желательно использовать только один тип заданий.

3 этап - Оформление теста

От оформления, формы представления методики, зависит, насколько серьезно воспринимается она испытуемыми в качестве инструмента обследования. Оформление опросника должно способствовать восприятию его как формального документа или приближать к игре (особенности шрифта, цвет бумаги и расположение заданий).

4 этап - Пилотажное исследование

предполагает выполнение заданий теста лицами, которые имеют сходные особенности с теми, для обследования которых он предназначается. Анализ полученных данных поможет отобрать наилучшие задания для окончательной версии опросника.

5 этап - Анализ заданий

Анализ заданий по результатам, полученным в пилотажном исследовании, имеет своей целью отбор наилучших заданий для окончательной версии опросника и включает в себя определение доли ответивших правильно (в соответствии с ключом) и дискриминантности каждого задания.

6 этап - Определение надежности теста

Тест обычно считается надежным, если с его помощью получаются одни и те же показатели для каждого обследуемого при повторном тестировании.

7 этап - Валидность теста

Тест называется валидным, если он измеряет то, для измерения чего предназначен.

Для определения валидности теста необходимо найти ВНЕШНИЙ КРИТЕРИЙ ВАЛИДНОСТИ – показатель проявления изучаемого свойства в повседневной жизни. ВКВ – непосредственная и независимая от валидизируемого теста мера психического свойства, которая исследуется психодиагностической методикой. Если связь между ними признается удовлетворительной, то делается вывод о практической эффективности, действенности диагностической методики.

Существует несколько видов валидности: внешняя, оценочная, содержательная, практическая, конструктивная. Не существует какого-либо единичного показателя устанавления валидности теста. Разработчик должен представить весомые доказательства в пользу валидности теста, что потребует от него психологических знаний и интуиции.

8 этап - Стандартизация теста

Стандартизация позволяет сравнить показатели, полученные одним испытуемым, с таковыми в генеральной совокупности или соответствующих группах. Тем самым достигается адекватная интерпретация показателя отдельного испытуемого. Стандартизация наиболее важна в тех случаях, когда осуществляется сравнение показателей обследуемых .

При этом вводится понятие нормы , или нормативных показателей. Нормы необходимы при интерпретации первичных показателей в качестве эталона, с которым сравниваются результаты тестирования.

Процесс создания теста, его научного обоснования, переработки и улучшения можно разбить на ряд этапов.

1.Определение цели тестирования, выбор вида теста и подхода к его созданию.

3.Определение структуры теста и стратегии расположения заданий.

4.Разработка спецификации теста, априорный выбор длины теста и времени его выполнения.

5.Создание предтестовых заданий.

6.Отбор заданий в тест и их ранжирование согласно выбранной стратегии предъявления на основании априорных авторских оценок трудности заданий.

7.Экспертиза содержания предтестовых заданий и теста.

8.Экспертиза формы предтестовых заданий.

9.Переработка содержания и формы заданий по результатам экспертизы.

10.Разработка методики апробационного тестирования.

11.Разработка инструкций для учеников и для преподавателей, проводящих апробацию теста.

12.Проведение апробационного тестирования.

13.Сбор эмпирических результатов.

14.Статистическая обработка результатов выполнения теста.

15.Интерпретация результатов обработки в целях улучшения качества теста. Проверка соответствия характеристик теста научно обоснованным критериям качества.

16.Коррекция содержания и формы заданий на основании данных предыдущего этапа. Чистка теста и добавление новых заданий для оптимизации диапазона значений параметра трудности и улучшения системообразующих свойств заданий теста. Оптимизация длины теста и времени его выполнения на основании апостериорных оценок характеристик теста. Оптимизация порядка расположения заданий в тесте.

17.Повторение этапа апробации для выполнения очередных шагов по повышению качества теста.

18.Интерпретация данных обработки, установление норм теста и создание шкалы для оценки результатов испытуемых.

Возникает своеобразный цикл, так как после чистки теста разработчику приходится возвращаться к этапу сбора эмпирических данных, причем, как правило, не один раз, а два, три и более. В определенном смысле этот цикл бесконечен, но не потому, что все задания плохи и разработчик не имеет достаточного опыта создания теста. Просто процесс конструирования теста довольно труден, поскольку необходим всесторонний подход к оценкам качества теста и характеристик тестовых заданий, к проверке их системообразующих свойств.

К тому же можно считать, что задача оптимального подбора состава теста не имеет единственного решения, так как не все здесь определяется качеством тестового материала, а многое еще зависит от уровня подготовки группы учеников. Задания, хорошо работающие на одной выборке учеников, могут оказаться совершенно бесполезными на другой, так как они будут или слишком легкими, или слишком трудными и их не выполнит правильно ни один ученик группы.

Успех создания теста во многом зависит от высокого качества начального тестового материала, которое обеспечивается правильным отбором проверяемого содержания и умением разработчика корректно отобразить его в заданиях теста. Крайне важен этап обработки эмпирических результатов тестирования, для выполнения которого необходимы специальные программные средства для профессиональной разработки тестов .

Конечно, далеко не всегда в процессе создания тестов необходимо достижение профессионального уровня качества, особенно если отвлечься от целей приема абитуриентов и аттестации выпускников. В повседневной деятельности педагога необходимы тесты разного, иногда невысокого качества, ориентированные на задачи текущего контроля. Выполнение последней задачи вполне по силам отдельному педагогу или группе педагогов. Однако и в этом случае можно самостоятельно сделать ряд расчетов, основанных на минимальном математическом аппарате и позволяющих значительно продвинуться от предтестовых заданий к настоящему тесту.

Выводы

1.Теория педагогических измерений носит междисциплинарный характер, объединяя достижения педагогики и психологии с достижениями математики, статистики и теории измерений.

2.Разработка понятийного аппарата теории педагогических измерений имеет важное значение для повышения качества тестов.

3. При формулировании понятийного аппарата необходимо классифицировать виды тестов, чтобы привести вводимые определения в соответствие с различными видами тестов и целями их создания. .

4. Педагогические тесты можно использовать для входного, текущего и итогового контроля при оценке результатов осуществленного учебного процесса.

5. Педагогические тесты разрабатываются в рамках двух подходов, позволяющих по-разному интерпретировать результаты их выполнения.

6. Наблюдаемые результаты выполнения теста получаются в результате взаимодействия множества испытуемых со множеством заданий теста.

7. Профессионально разработанные тесты обеспечивают представление об истинных баллах учащихся, определяемых с помощью специальных методов по наблюдаемым результатам выполнения теста.

8. Процесс конструирования теста включает ряд этапов, выполнение которых обязательно. Исключение любого этапа ведет к неизбежной потере качества теста.

ВОПРОСЫ И ЗАДАНИЯ

1.Каковы функции входного тестирования? Есть ли смысл разрабатывать входные тесты в школе?

2.Каковы цели разработки формирующих тестов? Есть ли различия между формирующими тестами и традиционными средствами текущего контроля?

3.Какова цель итогового тестирования?

4.В рамках какого подхода, по вашему мнению, следует разрабатывать тесты для проведения выпускных экзаменов в школе?

5.Правильно ли в вашей школе оценивают эффективность работы преподавателей?

6.Какой процесс называется стандартизацией теста?

7.Перечислите факторы, влияющие на устойчивость норм теста.

8.Какие тесты, по вашему мнению, необходимо разрабатывать в первую очередь для повышения эффективности учебного процесса в школе?

9.Сформулируйте определения предтестового задания, тестового задания, педагогического теста. Сравните свой ответ с содержанием соответствующих разделов пособия.

10.В чем проявляются преимущества предтестового задания по сравнению с традиционными контрольными заданиями?

11.Каковы общие требования к предтестовым заданиям? Сравните свой ответе предлагаемым в пособии перечнем общих требований.

12.Охарактеризуйте факторы, снижающие точность тестовых измерений.

13.Можно ли с помощью традиционных средств контроля получить представление об истинных баллах учеников?

14.Три ученика отвечали на 6 заданий теста, ранжированных по нарастанию трудности. По результатам ответов получились профили:

первый: 111000; второй: 101010; третий: 000111.

Кто, по вашему мнению, лучше усвоил содержание проверяемого курса? Сколько ошибок в профиле ответов каждого из трех учеников? У кого из трех учеников будет выше истинный балл? Правомерна ли постановка последнего вопроса по отношению к результатам третьего ученика?

15. Перечислите основные этапы разработки теста.

Целеполагание на этапе планирования

При создании теста внимание разработчика прежде всего привлекают вопросы отбора содержания, которое можно определить как оптимальное отображение содержания учебной дисциплины в системе тестовых заданий. Требование оптимальности предполагает использование определенной методики отбора, включающей вопросы целеполагания, планирования и оценки качества содержания теста.

Этап целеполагания является наиболее трудным и вместе с тем наиболее важным: от результатов его выполнения в первую очередь зависит качество содержания теста. В процессе целеполагания преподавателю необходимо решить вопрос о том, какие результаты учеников он хочет оценить с помощью теста. Ответ казалось бы прост, по крайней мере, он кажется таким тем, кто неоднократно проверяет знания учеников на уроках традиционными средствами. Однако наделе эта видимая простота зачастую оборачивается низким качеством результатов контроля, когда разные по подготовке ученики получают одинаковые оценки либо преподаватель приходит к неправильному выводу о достижении целей обучения, в то время как ученики не получили самых важных знаний или не научились их применять.

Основания для ошибок в выводах педагога далеко не всегда связаны с технологическими недостатками традиционных средств контроля. Иногда они обусловлены недоработками педагога на этапе целеполагания, когда центр тяжести проверки смещается на второстепенные цели обучения, а иногда этап целеполагания отсутствует вовсе, поскольку часть педагогов уверена в непогрешимости; своего опыта и интуиции, особенно при условии многолетней работы в школе. Однако никакие даже очень совершенные методы контроля и никакой опыт не дадут оснований для надежных выводов о достижении целей обучения до тех пор, пока нет уверенности в правильной постановке целей контроля и в их правильном, несмещенном отображении в содержании теста.

В отличие от отбора содержания традиционных средств контроля, который производится в основном интуитивно на основании практического опыта педагога, отбор содержания теста имеет четкую целевую направленность, а это при условии правильной постановки целей является серьезной заявкой на его высокое качество. Образно говоря, при создании теста в сознании разработчика содержание контроля преломляется сквозь призму поставленных целей измерения, и если они сформулированы правильно, то есть большая уверенность в том, что тест состоится.

Правда, сама по себе правильная постановка целей создания теста довольно непроста, к тому же положение осложняется рядом обстоятельств. С одной стороны, различные школы в современной педагогике при формулировке целей используют разные системы понятий и представлений, часто плохо сочетающиеся между собой. С другой стороны, использование отличающихся слов и выражений естественного языка в качестве терминов порождает изрядную путаницу, нередко контекст ряда педагогических подходов недостаточен для осуществления терминообразующей функции.

Вместе с тем в течение целого ряда лет особой потребности в формировании единых подходов к формулировке целей просто не возникало. Существовавшая в нашей стране на протяжении десятилетий преимущественная ориентация на традиционные средства контроля снимала потребность в этом процессе, так как расплывчатость и неопределенность действующих образовательных целей не приходила в рассогласование с требованиями практики, далекой от проблем создания объективных средств измерения. И наконец, нередко положение осложняли сами исследователи, которые, образно говоря, прорицали, но не слышали друг друга. В целом это привело к тому, что до сих пор не выработаны общие правила выбора оснований для классификации целей, не найдены разделяемые всеми принципы для количественной оценки степени их достижения.

Таким образом, сложившиеся на сегодняшний день представления о наиболее общих целях контроля не позволяют непосредственно перейти к разработке средств измерения. Для формулировок образовательных целей характерны излишняя общность, расплывчатость, многообразие и неопределенность. Поэтому для создания средств измерения в первую очередь необходима предварительная операционализация целей.

Процесс операционализации заключается в придании содержанию и форме представления целей характеристик, позволяющих отобразить цели в содержании стандартизованных средств измерения . Идея операционализации очень близка отдельным положениям работы М.В. Кларина , где вместо слова «операционализация»"используется иной, довольно удачный термин «конкретизация». Дело разумеется не в термине, а в сути предлагаемого процесса.

1. Этап целеполагания . Разработка теста начинается с формулирования его цели, то есть определения того, что тест должен измерять.

2. Подготовительный этап (спецификация).Анализируется и отбирается содержание проверяемого материала.

3. Этап составления плана теста . После составления спецификации разрабатывается план теста.

4. Этап составления теста (разрабатываются тестовые задания, проходит экспертиза и доработка заданий, стандартизируется и нормируется тест).

При составлении заданий теста следует соблюдать ряд правил, необходимых для создания надежного, сбалансированного инструмента оценки успешности овладения определенными учебными дисциплинами или их разделами.

Правила для разработки тестовых заданий:

– необходимо проанализировать содержание заданий с позиции равной представленности в тесте разных учебных тем, понятий, правил, действий и т.д. Тест не должен быть перегружен второстепенными терминами, несущественными деталями с акцентом на механическую память, которая может быть задействована, если в тест включены точные формулировки из учебника или фрагменты из него;

– задания теста должны быть сформулированы четко, кратко и не двусмысленно, чтобы все учащиеся однозначно понимали смысл того, что у них спрашивается. Важно проследить, чтобы ни одно задание теста немогло служить подсказкой для ответа на другое;

– варианты ответов на каждое задание должны подбираться таким образом, чтобы исключались возможности простой догадки или отбрасывания заведомо неподходящего ответа. Важно выбирать и наиболее приемлемую форму ответов на задания;

– учитывая, что задаваемый вопрос должен быть сформулирован коротко, желательно также кратко и однозначно формулировать ответы. Например, удобна альтернативная форма ответов, когда учащийся должен подчеркнуть одно из перечисленных решений «да - нет», «верно - неверно». Часто в задании делаются пропуски, которые должен заполнить испытуемый, или же выбирать из представленного набора ответов верный. Обычно навыбор предлагаются 4- 5 вариантов ответа.

Вместе с этим педагогический тест должен удовлетворять всем необходимым критериям, обладать высокой надежностью и удовлетворительной валидностью. Данный этап разработки теста включает в себя как само написание заданий, так и их анализ экспертными методами для выявления наилучших и выбраковки неудачных.

Выделяют две группы методов анализа заданий: экспертные и математические. Математические методы применяются после проведения тестирования на основании полученного эмпирического материала, поэтому о них речь пойдет ниже. Сразу же после написания заданий их анализ проводится экспертными методами, которые позволяют оценить, в какой степени задания соответствуют по содержанию предмету измерения, т.е. действительно ли задания позволяют измерить именно те знания, умения и навыки, для которых разрабатывается тест. С другой стороны, экспертные методы анализа позволяют оценить задания с точки зрения их формы. В основе экспертных методов лежит соотнесение содержания и формы заданий с требованиями, изложенными в спецификации.

5. Этап проведения теста . Отслеживается проведение теста.

6. Этап анализа полученных результатов . Обработка результатов, получение статистических данных для анализа и анализ результатов. Подготовка итогового отчета.

НАДЕЖНОСТЬ - один из критериев качества научного метода исследования, относящийся к точности психологических измерений.

ВАЛИДНОСТЬ теста - один из основных (наряду с надежностью, репрезентативностью, объективностью, достоверностью и эффективностью) критериев оценки тестовых результатов.

Читайте также:

I. Вспомните основные модальные глаголы и их эквиваленты. Чем они отличаются? Как спрягаются? (Заполните табличку).
I. При каких условиях эта психологическая информация может стать психодиагностической?
II. Основные принципы и правила служебного поведения государственных гражданских служащих Федеральной налоговой службы
II. Основные цели и задачи Программы, срок и этапы ее реализации, целевые индикаторы и показатели
II. Основные этапы развития физики Становление физики (до 17 в.).
III.2.1) Понятие преступления, его основные характеристики.

Создание психодиагностической методики – сложный, многошаговый процесс. Не претендуя в рамках данной статьи на полноту изложения этого вопроса, выделю основные этапы с кратким описанием их содержания. Сразу нужно заметить, что объектом внимания будет диагностическая методика (тест-опросник), так как для другого класса методик – исследовательских, проективных, клинических – существуют другие требования по созданию и апробации.

Создание психодиагностической методики не сводится только к проверке отдельных психометрических свойств – репрезентативности, надежности, валидности, достоверности и т.д. Первичная работа в этом направлении начинается с глубокой теоретической проработки оснований предмета, с выяснения методологических, концептуальных подходов к его исследованию. Прежде чем разрабатывать процедуру измерения, необходимо создать концепцию измеряемого психического свойства , построить его модель. Именно глубокая теоретическая подготовка является условием успешной работы по созданию методики, отвечающей всем критериям качества. Можно сказать, что прежде чем перейти к технологии разработки методики необходимо провести фундаментальное теоретическое исследование.

Если следовать логике исследования, то начинать его необходимо с определения проблемы . Это и будет первым этапом по созданию методики. Проблема – это задача, не имеющая решения, либо предполагающая неоднозначные решения. Проблемы могут порождаться как объективными условиями, реальной ситуацией, так и быть результатом собственной активности исследователя. Проблемы диагностики являются, как правило, прикладными и ориентированы на практическое решение возникших в реальной социальной ситуации задач. Исследователю необходимо помнить, что не все проблемы подлежат решению. Кроме реальных проблем, являющихся объектом непосредственного приложения усилий исследователя, существует категория проблем, неразрешимых средствами современной науки, а также «псевдопроблемы». Как уже было отмечено, проблемы диагностики – это реальные задачи, требующие своего прикладного решения. Скажем, в качестве примера можно привести проблему школьной тревожности. Данная проблема – пример уже операционализированной проблемы, переведенной, оформленной в терминах определенной научной отрасли. Иногда исследователю еще предстоит эта задача.

Следующим этапом по созданию психодиагностической методики будет определение предмета диагностики . Предмет имплицитно присутствует в операционализированной проблеме. Предмет – это то, что станет непосредственным объектом измерения, то, что будет измерять созданная методика. Предмет традиционно определяется как зафиксированные в опыте стороны, свойства и отношения объекта, исследуемые с определенной целью в данных условиях. Предмет существует в виде понятия. В нашем случае предметом диагностики будет феномен тревожности, представленный психологическим понятием «тревожность».

На следующем этапе необходимо определить границы понятия (этап уточнения предмета). Данная процедура осуществляется через проведение дифференциального анализа рассматриваемого понятия с близкими и противоположными по значению понятиями. Одним из способов определения понятия является принятое в логике сравнение с помощью кругов Эйлера – изображений посредством кругов отношений между объемами понятий. Круг, в данной процедуре, изображает объем конкретного понятия. В нашем случае, кроме понятий тревога и тревожность, необходимо рассматривать такие понятия, как страх, беспокойство и т.д.

Следующий шаг по конструированию методики связан с уточнением феноменального поля понятия . Для этого необходимо как можно более подробно описать тот феномен, который представлен в понятии, создать по возможности полную картину данного феномена. Как правило, это производится через операциональное определение понятия. Операциональное определение – это подробное указание операций, необходимых для представления и измерения понятия. В психологии часто используются абстрактные понятия, такие как интеллект, самооценка, память, научение, креативность и т.д. Необходимо их операционализировать, то есть описать все возможные объективные способы проявления рассматриваемого понятия. В объективной диагностике, какой является тест-опросник, используются лишь те способы проявления понятия, которые можно реально фиксировать как минимум в наблюдении с помощью наших органов чувств.

На следующем этапе из выделенных объективных способов проявления понятия необходимо отобрать наиболее значимые, которые будут выполнять роль критериев для распознавания (диагностики) предмета . Критерий (средство для суждения) – признак, на основании которого производится оценка, определение или классификация чего-либо, мерило оценки. Критерии измеряемого понятия должны представлять собой существенные, надежные и объективные признаки его проявления. Именно они найдут свое отражение в вопросах либо утверждениях, которые составят содержание стимульного материала методики. Таким образом, данный этап будет связан с выбором критериев, по которым будет диагностироваться предмет.

На следующем этапе создания методики производится выбор формы методики . Форма методики определяется спецификой предмета диагностики и исследовательскими целями. Методика может быть сконструирована в форме тест-опросника (как в нашем случае), проективной методики, клинической методики и др. Каждая из представленных форм имеет свою специфику, отличительные требования по критериям качества. На этом же этапе происходит выбор стимульного материала. В нашем случае стимульный материал может быть представлен в форме вопросов либо утверждений. Утверждения, в свою очередь, могут быть личные и безличные.

После определения формы стимульного материала производится его подбор. Выбор содержания стимульного материала осуществляется из того феноменального поля понятия, которое явилось результатом предшествующей работы с учетом выделенных критериев предмета диагностики. Качество отдельных заданий (вопросов, утверждений) является определяющим для всего тест-опросника, поэтому при разработке заданий теста необходимо учитывать наиболее часто встречающиеся проблемы, которые могут привести к его низкой валидности.

При отборе отдельных заданий (вопросов, утверждений) необходимо определить индекс эффективности каждого из них. Для этого можно прибегнуть к методу экспертов. Суть данного метода заключается в том, что нескольким специалистам в данной предметной области (5–7 человек) предлагают оценить список предполагаемых заданий из стимульного материала на предмет их валидности, то есть адекватности измеряемому предмету по рейтинговой шкале (3-, 5-, 7-бальной). Те из заданий, которые получат высокие оценки у всех или большинства экспертов будут обладать экспертной валидностью и их можно рекомендовать для включения в опросник. В качестве еще одной из стратегий отбора стимульного материала можно воспользоваться пилотажным исследованием. Проведение пилотажного исследования предполагает выполнение заданий теста лицами, которые имеют сходные особенности с теми, для диагностики которых он разрабатывается. Анализ полученных данных позволит разработчику теста отобрать лучшие задания для окончательной версии опросника. На репрезентативной выборке проводится пробное тестирование. Минимальный объем выборки должен быть в два раза больше, чем количество заданий. Далее рассматривается каждое из заданий стимульного материала с точки зрения того, как на него отвечали все испытуемые. При отборе разработчики руководствуются следующим правилом: не проходят те из заданий (вопросов, утверждений), которые получают у большинства испытуемых однозначные оценки. К примеру, если все испытуемые ответили «да» на какой-то из вопросов, то его не включают в будущий опросник, так как он не отражает индивидуальные особенности испытуемого, а направлен на некое общее для всех свойство. Индекс эффективности для каждого задания должен располагаться в интервале от 0,25 до 0,75, приближаясь в среднем к 0,5 для всего опросника. Кроме индекса эффективности, необходимо также определять дискриминативность задания – проверка того, измеряют ли отдельные задания (вопросы, утверждения) те же самые свойства, что и другие. Для определения дискриминативности заданий используется коэффициент корреляции каждого задания с общим баллом всего теста. Чем выше коэффициент корреляции, тем выше дискриминативность задания, тем оно лучше. Минимальный коэффициент корреляции должен составлять 0,2. Для расчета этого показателя чаще всего применяется коэффициент произведения моментов Пирсона.

Важным моментом в разработке стимульного материала является выбор формы вопросов .

После того как задания для тест-опросника отобраны, необходимо позаботиться о его достоверности . Данное свойство методики (в случае опросников) представляется достаточно важным и является одним из критериев ее качества. Чаще всего достоверность обеспечивается благодаря включению в содержание стимульного материала корректурной шкалы (шкалы лжи).

Важным этапом в создании психодиагностической методики является разработка инструкции . Инструкция составляется в письменной форме, так как на устную инструкцию влияют паралингвистические компоненты исследователя: мимика, жесты, интонации, паузы и т.д. Кроме того, устная инструкция забывается, к письменной же испытуемый может, в случае надобности, возвращаться по ходу выполнения заданий теста. Инструкция должна быть простой и понятной испытуемому, не должна содержать в себе специальных профессиональных терминов, непонятных тестируемому, неоднозначно трактуемых слов и выражений. В ней должно быть указано, как выбирать ответ и каким образом отмечать его в опроснике. В инструкции следует выделить ту информацию, которая может способствовать эффективной работе испытуемого, например о соблюдении конфиденциальности исследования. Основные функции, которые должна выполнять инструкция: информирующая и мотивирующая.

Разработкой инструкции завершается этап создания теста. Следующий этап будет посвящен его проверке соответствию критериям качества, а также его стандартизации и адаптации.

Основными критериями качества диагностической методики считаются валидность и надежность . Названные свойства теста являются необходимым атрибутом диагностического теста. Методика, которая не прошла испытания на валидность и надежность либо которая не отвечает требованиям по этим качествам, не может применяться как диагностический инструмент, хотя при этом ее можно использовать для исследовательских целей.

Заключительным этапом в разработке психодиагностической методики является ее стандартизация и адаптация . Диагностическая методика отличается от исследовательской методики тем, что она стандартизирована. Стандартизация методики включает в себя два этапа:

1. Выработка единых требований к процедуре тестирования. Этот этап включает в себя унификацию способов регистрации результатов, условий инструкций, бланков исследования и проведения тестирования.

2. Определение единого критерия для оценки результатов. На этом этапе производится определение тестовых норм.

Применение тестовых норм в психодиагностике основывается на переводе тестовых баллов из «сырой шкалы» в стандартную шкалу. Эта процедура называется стандартизацией тестового балла . Норма теста – это средний уровень выраженности исследуемого качества, установленный на большой выборке людей.

Для тест-опросников разрабатываются статистические тестовые нормы. Для их вычисления обращаются к методам математической статистики. Нормы для каждой группы должны быть представлены в средних величинах и показателе среднего отклонения. Результатом стандартизации теста является создание конверсионной таблицы для перевода «сырых» баллов в стандартные по заданной шкале. В ней приводится полный перечень соответствия между интервалами сырой шкалы и интервалами шкалы стандартной. Норма теста должна пересматриваться раз в 5 лет. В описании теста для каждой включенной в него нормы обязательно должно быть указано: где, когда, как и на ком она была установлена.

В заключение хочется сказать, что в конструировании тестов нельзя ограничиваться математическими расчетами. Математические модели в психодиагностике не смогут заменить разработку теоретических конструктов, фундаментальных принципов исследования. Без полного психологического описания измеряемого конструкта, без формулирования гипотез о его результатах процесс создания теста становится упражнением из математической статистики.

Страница 21 из 25

Основные этапы конструирования педагогического теста

Проблемы конструирования опросников.

При разработке заданий для опросников необходимо учитывать следующие проблемы, которые, если их не обойти, неизбежно приведут к низкой валидности тестов.

1. Установка на согласие. Это тенденция испытуемого соглашаться с утверждениями или отвечать на вопросы "да" независимо от их содержания. Чаще всего проявляется, когда утверждения (вопросы) неоднозначны и неопределенны.

2. Установка на социально одобряемые ответы. Это тенденция испытуемых отвечать на вопросы теста так, чтобы выглядеть "социально положительным": если возможен "социально желательный" ответ, то весьма вероятно, что испытуемые будут его давать.

3. Установка на неопределенные или средние ответы. Если в опроснике представлена средняя категория ответов, отражающая нерешительность или неуверенность в ответе (например
"не уверен", "не знаю" или "затрудняюсь ответить"), то многие испытуемые склонны к ней прибегать, как к безопасному компромиссу. Это приводит к снижению валидности, поскольку большинство методов анализа вопросов основывается на крайних значениях показателей.

4. Установка на "крайние" (расположенные по краям шкалы) ответы. Эта установка может проявляться при использовании многоэлементной рейтинговой шкалы. Некоторые испытуемые, независимо от содержания вопросов, предпочитают выбирать крайние ответы.

5. Очевидная валидность вопросов. Несомненно, в тестах личности необходима уверенность в том, что ответы на вопросы могут рассматриваться как правдивые.

6. Проблемы в установлении адекватного критерия валидности. Существует значительная трудность в нахождении адекватного критерия.

Таковы основные сложности, возникающие при конструировании опросников, и следует отчетливо их себе представлять, прежде чем вы приступите к формулированию вопросов или утверждений. Две последние проблемы, хотя они и являются определяющими, выходят на первый план уже после того, как подобраны задания теста.

Процесс создания теста, его научного обоснования, переработки и улучшения можно разбить на ряд этапов.

1. Определение цели тестирования, выбор вида теста и подхода к его созданию.

2. Анализ содержания изучаемого явления (качества).

3. Определение структуры теста и стратегии расположения заданий.

4. Разработка спецификации теста, выбор длины теста и времени его выполнения.

5. Создание предтестовых заданий.

6. Отбор заданий в тест и их ранжирование согласно выбранной стратегии предъявления на основании априорных авторских оценок трудности заданий.

7. Экспертиза содержания предтестовых заданий и теста.

8. Экспертиза формы предтестовых заданий.

9. Переработка содержания и формы заданий по результатам экспертизы.

10. Разработка методики апробационного тестирования.

11. Разработка инструкций для проводящих апробацию теста.

12. Проведение апробационного тестирования.

13. Сбор эмпирических результатов

14. Статистическая обработка результатов выполнения теста.

15. Интерпретация результатов обработки в целях улучшения качества теста. Проверка соответствия характеристик теста научно обоснованным критериям качества.

16. Коррекция содержания и формы заданий на основании данных предыдущего этапа. Чистка теста и добавление новых заданий для оптимизации диапазона значений параметра трудности и улучшения системообразующих свойств заданий теста. Оптимизация длины теста и времени его выполнения. Оптимизация порядка расположения заданий в тесте.

17. Повторение этапа апробации для повышения качества теста.

18. Интерпретация данных обработки, установление норм теста и создание шкалы для оценки результатов испытуемых.

Возникает своеобразный цикл, так как после чистки теста разработчику приходится возвращаться к этапу сбора эмпирических данных, причем, как правило, не один раз, а два, три и более. В определенном смысле этот цикл бесконечен, но не потому, что все задания плохи и разработчик не имеет достаточного опыта создания теста. Процесс конструирования теста довольно труден, поскольку необходим всесторонний подход к оценкам качества теста и характеристик тестовых заданий, к проверке их системообразующих свойств.

К тому же можно считать, что задача оптимального подбора состава теста не имеет единственного решения, так как не все здесь определяется качеством тестового материала, а многое еще зависит от уровня подготовки группы учеников. Задания, работающие на одной выборке учеников, могут оказаться бесполезными на другой, так как они будут или слишком легкими, или слишком трудными и их не выполнит правильно ни один ученик группы.

Конечно, далеко не всегда в процессе создания тестов необходимо достижение профессионального уровня качества, особенно если отвлечься от общих целей. В повседневной деятельности педагога необходимы тесты разного, иногда невысокого качества, ориентированные на задачи текущего контроля. Выполнение последней задачи вполне по силам отдельному педагогу или группе педагогов. Однако и в этом случае можно самостоятельно сделать ряд расчетов, основанных на минимальном математическом аппарате и позволяющих значительно продвинуться от предтестовых заданий к настоящему тесту.

На этапе сбора данных необходимо принять специальные меры, обеспечивающие единообразие процедуры выполнения теста. Стандартизация этой процедуры затрагивает вопросы формирования репрезентативной выборки испытуемых, правильного инструктирования, выбора оптимального времени тестирования, качественных материалов, подходящей окружающей обстановки. Определенное внимание следует уделить подготовке преподавателей, проводящих тестирование, принять меры по предотвращению списывания в процессе выполнения теста. Малейшее отступление от требований стандартизации повлечет за собой снижение достоверности эмпирических результатов выполнения теста. Помимо перечисленных, на результаты выполнения теста может повлиять множество других, менее очевидных факторов. В целом же для обеспечения сбора достоверных эмпирических данных необходимо:

Точно следовать процедурам стандартизации при сборе эмпирических данных;

Регистрировать любые нестандартные условия, приводящие к отступлениям от требований стандартизации;

Учитывать нестандартные условия тестирования при интерпретации теста.

Большое значение имеет разработка правильных инструкций по выполнению теста, которые следует подготовить как для педагога, руководящего процессом применения теста, так и для учеников, выполняющих тест.

В инструкции для педагога содержатся рекомендации по подготовке группы учащихся к выполнению теста, примерные обязанности педагога на этапе проведения тестирования, рекомендации по подготовке краткого отчета о выполненной процедуре предъявления теста.
В целом перед тестированием педагогу необходимо следующее.

1. Объяснить, зачем нужен тест, сообщить, какие результаты ожидаются.

2. Объяснить, почему испытуемые должны приложить максимум усилий для его выполнения, акцентировать внимание испытуемых на возможности проверки своих сил и подчеркнуть соревновательный мотив. При этом следует иметь в виду, что слишком сильная мотивация, как и слабая, в одинаковой степени негативно сказываются на результативности теста.

3. Медленно, четко прочесть инструкцию к тесту с примерами, если они имеются. Возможна ситуация, когда испытуемые самостоятельно следят по своим вариантам теста за инструкцией, а педагог зачитывает ее или воспроизводит по памяти.

4. Дать возможность испытуемым потренироваться, решив самостоятельно одну или более задач-образцов, если такие имеются. Проверить, правильно ли понята инструкция по результатам выполнения образцов заданий теста.

5. Сообщить о временном ресурсе, о правилах исправления допущенных ошибок, рассказать о том, чего не рекомендуется делать при выполнении задач и к кому обращаться в случае возникновения вопросов.

6. Вместе с испытуемыми записать, если требуется, паспортные и биографические данные в регистрационных бланках, проследить за правильностью их заполнения.

7. Ответить на имеющиеся вопросы до начала выполнения теста.

8. Раздать тест.

9. Дать команду начать выполнение заданий. Время начала записать самому или попросить сделать это испытуемых на регистрационном бланке.

10. Во время выполнения заданий следить:

За временем выполнения отдельных субтестов, если это необходимо, как, например, при выполнении скоростных тестов;

За наличием отточенных карандашей и других материалов;

За правильностью заполнения паспортной части регистрационных бланков (если замечена ошибка, своевременно ее устранить);

За тем, чтобы испытуемые не писали на тестовых брошюрах, если не предусмотрено;

За тем, чтобы соседи не общались, не мешали друг другу, не подглядывали;

За состоянием испытуемых;

За тем, чтобы испытуемые своевременно получили разрешенные инструкцией ответы на вопросы в ситуациях, связанных с процедурой проведения.

11. После сигнала к окончанию выполнения заданий теста при групповом проведении дать команду сложить брошюры и бланки для ответов в исходное положение или самому собрать (если участвуют не более 30 человек). Если участников тестирования больше 30 человек, то рекомендуется попросить всех остаться на своих местах и передать в начало ряда тестовые материалы в следующем порядке: бланки для ответов, брошюры, черновики. После этого пересчитать количество бланков и брошюр.

12. По окончании тестирования просмотреть все брошюры и стереть отметки в них.

Оглавление
Педагогическая диагностика в воспитательном процессе.
ДИДАКТИЧЕСКИЙ ПЛАН
Понятие педагогической диагностики
Исторические аспекты формирования диагностики как специфического вида познания
Личность как предмет педагогической диагностики