Тестирование как метод исследования

Тестирование - это исследовательский метод, который позволяет выявить уровень знаний, умений и навыков, способностей и других качеств личности, а также их соответствие определенным нормам путем анализа способов выполнения испытуемым ряда специальных заданий. Такие задания принято называть тестами. Тест - это стандартизированное задание или особым образом связанные между собой задания, которые позволяют исследователю диагностировать меру выраженности исследуемого свойства у испытуемого, его психологические характеристики, а также отношение к тем или иным объектам. В результате тестирования обычно получают некоторую количественную характеристику, показывающую меру выраженности исследуемой особенности у личности. Она должна быть соотносима с установленными для данной категории испытуемых нормами. Значит, с помощью тестирования можно определить имеющийся уровень развития некоторого свойства в объекте исследования и сравнить его с эталоном или с развитием этого качества у испытуемого в более ранний период.

Тесты обычно содержат вопросы и задания, требующие очень краткого, иногда альтернативного ответа («да» или «нет», «больше» или «меньше» и т.д.), выбора одного из приводимых ответов или ответов по балльной системе. Тестовые задания обычно отличаются диагностичностью, их выполнение и обработка не отнимают много времени. В то же время, как показала мировая практика, очень важно видеть, что реально могут выявить тесты, для того чтобы не подменить предмет диагностирования. Так, многие тесты, претендующие на выявление уровня развития, реально выявляют лишь уровень подготовленности, информированности или умелости испытуемых.

При подготовке тестовых заданий следует соблюдать ряд условий. Во-первых, нужно определить и ориентироваться на некоторую норму, что позволит объективно сравнивать между собой результаты и достижения различных испытуемых. Это означает также, что исследователь должен принять некоторую научную концепцию изучаемого явления, ориентироваться на нее и с этих позиций обосновывать создание и интерпретировать результаты выполнения заданий. Например, тесты-задания на выявление уровня сформированности знаний, умений и навыков по тем или иным учебным предметам составляются и применяются на основе некоторых представлений о критериях оценки знаний, умений и навыков учащихся и соответствующих норм отметок или могут быть рассчитаны лишь на сравнение испытуемых между собой по успешности. выполнения ими заданий. Во-вторых, испытуемые должны находиться в одинаковых условиях выполнения задания (независимо от времени и места), что позволяет исследователю объективно оценить и сравнить полученные результаты.

Норма каждого теста определяется составителем-разработчиком путем нахождения среднего показателя, соответствующего результатам большой совокупности людей, принадлежащих некоторой культуре (выборка стандартизации). Этот показатель принимается за средний показатель развития выявляемого тестом свойства, статистически характерного для среднего человека. Это может быть, например, возрастной нормой интеллектуального развития или какой либо личностной характеристикой. Такой показатель определяется опытным путем и принимается за точку отсчета. Результаты каждого испытуемого сравниваются с нормой и соответствующим способом оцениваются: каждый тест сопровождается способом обработки данных и интерпретации результатов. Например, в тесте на определение акцентуации характера (К. Леон-гардт) испытуемый по каждому из типов акцентуации может набрать максимум 24 балла; признаком сильной выраженности (акцентуации) считается показатель, превышающий 12 баллов (исследователь может сам, на основании накопленного опыта, дополнительно уточнить характеристику меры выраженности свойства при показателях до 24 баллов).

Тесты, ориентированные на определение среднестатистических норм и принятие их в качестве критериев оценки и интеграции, позволяют осуществлять нормативно-ориентированное тестирование (НОРТ). Такие нормативные оценочные действия часто используются в педагогической практике. Например, существуют критерии оценки знаний, умений и навыков и нормы отметок по тем или иным учебным предметам, применяются учебные задания тестового характера по разным предметам с установленными нормами выставления отметок. НОРТ можно осуществить с применением многих тестов (тест Равена, тест Кэттелла, методика диагностики уровня субъективного контроля и др.).

Бывает много случаев, когда важно учитывать изменения в показателях одного и того же испытуемого на определенном промежутке времени, например до начала обучения и после завершения обучения некоторому учебному материалу. Это позволяет фиксировать возможности испытуемого, а периодическая диагностика и сравнение его показателей с предыдущими позволяет выявлять темп и направление развития изучаемого свойства. В таких случаях интерпретация результатов тестирования осуществляется с позиции выбранных критериев, показывающих особенности продвижения испытуемого в усвоении содержания учебного материала и развитии определенных психических качеств. Многие интеллектуальные тесты, тесты достижений и др. позволяют использовать их в указанном выше смысле. Норма теста в подобных случаях индивидуальная.

Возможен и случай, когда определение нормы теста осуществляется по содержательному признаку, на основе анализа логико-психологической структуры материала заданий, когда успешность выполнения теста интерпретируется в терминах - качественных характеристиках исследуемого свойства. Такие качественные характеристики выступают как критерии оценки достижений испытуемого, а само тестирование становится критериально-ориентированным. Критериально-ориентированное тестирование (КОРТ) позволяет достаточно успешно сочетать тестирование, интерпретацию результата и коррекцию хода обучения (формирования). Напомним еще раз, что результаты выполнения заданий в КОРТ соотносятся с качественными характеристиками содержания задания (теста), а не с некоторым среднестатистическим уровнем успешности его выполнения, как в НОРТ.

Примером может служить использование «Методики АРП» и соответствующего ей блока методик, предложенного одним из авторов данного пособия. Выполнение данного блока позволяет определить уровень развития мышления испытуемого - школьника, которое может быть эмпирическим, аналитическим, планирующим и рефлектирующим. Поскольку сформированность того или иного уровня развития мышления является предпосылкой возможного становления в будущем следующего уровня развития, поэтому имеется возможность: 1) принятия этих уровней в качестве критериев оценки исследуемого свойства; 2) принятия следующего за установленным уровня в качестве направления последующего развития мышления и определение ближайшей зоны развития мышления ученика; 3) составление адекватного набора упражнений по одному или ряду учебных предметов, выполнение которых должно привести к достижению школьником соответствующего уровня развития мышления1.

Существуют определенные правила проведения тестирования и интерпретации полученных результатов. Эти правила достаточно четко проработаны, и основные из них имеют следующий смысл: 1)

информирование испытуемого о целях проведения тестирования; 2)

ознакомление испытуемого с инструкцией по выполнению тестовых заданий и достижение уверенности исследователя в том, что инструкция понята правильно; 3)

обеспечение ситуации спокойного и самостоятельного выполнения заданий испытуемыми; сохранение нейтрального отношения к тестируемым, уход от подсказок и помощи; 4)

соблюдение исследователем методических указаний по обработке полученных данных и интерпретации результатов, которыми сопровождается каждый тест или соответствующее задание; 5)

предупреждение распространения полученной в результате тестирования психодиагностической информации, обеспечение ее конфиденциальности; 6)

ознакомление испытуемого с результатами тестирования, сообщение ему или ответственному лицу соответствующей информации с учетом принципа «Не навреди!»; в этом случае возникает необходимость решения серии этических и нравственных задач; 7)

накопление исследователем сведений, получаемых другими исследовательскими методами и методиками, их соотнесение друг с другом и определение согласованности между ними; обогащение своего опыта работы с тестом и знаний об особенностях его применения.

Как уже было отмечено, каждый тест сопровождается конкретной инструкцией и методическими указаниями по обработке и интерпретации получаемых данных.

Выделяют также несколько типов тестов, каждому из которых сопутствуют соответствующие процедуры тестирования.

Тесты способностей позволяют выявить и измерить уровень развития тех или иных психических функций, познавательных процессов.

Такие тесты чаще всего связаны с диагностикой познавательной сферы личности, особенностей мышления и обычно называются также интеллектуальными. К ним относятся, например, тест Равена, тест Амтхауэра, соответствующие субтесты теста Век-слера и т.д., а также тесты-задания на обобщение, классификацию и множество других тестов исследовательского характера.

Тесты достижений ориентированы на выявление уровня сфор-мированности конкретных знаний, умений и навыков и как меры

1 См.: Атаханов Р.А. Математическое мышление и методики определения уровня его развития // Науч. ред. В.В.Давыдова. - Рига, 2000.

успешности выполнения, и как меры готовности к выполнению некоторой деятельности. В качестве примеров могут служить все случаи тестовых экзаменационных испытаний. На практике обычно применяются «батареи» тестов достижений.

Личностные тесты предназначены для выявления свойств личности испытуемых. Они многочисленны и разнообразны: существуют опросники состояний и эмоционального склада личности (например, тесты тревожности), опросники мотивации деятельности и предпочтений, определения черт характера личности и отношений.

Имеется группа тестов, называемых проективными, которые позволяют выявить установки, неосознаваемые потребности и побуждения, тревоги и состояние страха. Испытуемому предлагаются различные стимульные материалы типа сюжетно неопределенных картинок, незавершенных предложений, сюжетные рисунки с конфликтными ситуациями и др. с просьбой интерпретировать их. Механизм выполнения таких заданий проявляется в том, что испытуемый некоторым образом упорядочивает элементы стимульного материала и придает им субъективный смысл, отражающий его личный опыт и переживания. Иначе говоря, проективные тесты построены на признании существования механизма «проектирования» человеком своего внутреннего мира на внешний, когда он невольно приписывает другим людям те свои влечения, потребности и желания, которые в обычном состоянии подавлены. Значит, проективные тесты позволяют с достаточной мерой объективности диагностировать бессознательные переживания человека. Такими тестами являются тематический апперцептивный тест, тест «чернильных пятен» Роршаха, широко применяемый фрустрационный тест Розенцвейга и др. Используются также графические проективные методики, где исследователь ставит испытуемого в ситуацию проектирования своего состояния, особенностей личности и отношений на реальность путем изображения дома, дерева, семьи, человека, несуществующего животного и его интерпретации. Например, тест «Конструктивный рисунок человека из геометрических фигур» выявляет индивидуально-типологические различия путем анализа рисунка человека, составленного из десяти фигур (треугольников, квадратов и кругов, причем их сочетание может быть любым): испытуемый может оказаться принадлежащим к типу «руководителей», «тревожно-мнительных личностей» и т. д.

Применение тестов всегда связано с измерением проявления того или иного психологического свойства и оценкой уровня его развития или сформированности. Поэтому важное значение имеет качество теста. Качество теста характеризуется критериями его точности, т. е. надежностью и валидностью.

Надежность теста определяется тем, насколько получаемые показатели являются стабильными и насколько они не зависят от случайных факторов. Разумеется, речь идет о сравнении показаний одних и тех же испытуемых. Это значит, что надежному тесту должна быть свойственна согласованность показателей тестирования, полученных при повторном тестировании, и можно быть уверенным в том, что тест выявляет одно и то же свойство. Применяются разные способы проверки надежности тестов. Один способ - это только что упомянутое повторное тестирование: если результаты первого и через определенное время проводимого повторного тестирования покажут наличие достаточного уровня корреляции, то это будет свидетельствовать о надежности теста. Второй способ связан с применением другой эквивалентной формы теста и наличием высокой корреляции между ними (некоторые тесты предлагаются пользователям в двух формах; например, тест-опросник Айзенка EPI - по определению темперамента - имеет равнозначные формы А и Б). Возможно и применение третьего способа оценки надежности, когда тест допускает его расщепление на две части и одна и та же группа испытуемых обследуется с применением обеих частей теста. Надежность теста показывает, насколько результаты тестирования могут быть устойчивы, насколько точно измеряются психологические параметры и насколько высокой может быть мера доверия исследователя к полученным результатам.

Валидность теста отвечает на вопрос о том, что именно выявляет тест, насколько он пригоден для выявления того, для чего он предназначен. Например, тесты способностей нередко выявляют несколько иное: натренированность, наличие соответствующего опыта или, наоборот, его отсутствие. В таком случае тест не отвечает требованиям валидности.

В психодиагностике выделяют разные виды валидности. В простейшем случае валидность теста обычно определяется путем сопоставления полученных в результате тестирования показателей с экспертными оценками о наличии данного свойства у исследуемых (текущая валидность или валидность «по одновременности»), а также путем анализа данных, полученных в результате наблюдения за обследуемыми в различных ситуациях их жизни и деятельности, и их достижений в соответствующей области. Вопрос о валидности теста может быть решен еще и сравнением его данных с показателями, полученными с помощью методики, связанной с данной методикой, валидность которой считается установленной.

Тестирование

Тестирование (англ. test - испытание, проверка) - эксперементальный метод психродиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида.

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжиования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Основоположники тестирования - Ф.Гальтон, Ч.Спирман, Дж.Каттел, А.Бине, Т.Симон. Сам термин "умственный тест" придумал Кеттел в 1890 г. Начало развития современной тестологии массового применения тестов на практике связано с именем французского врача Бине, разработавшего в соавторстве с Симоном метрическую шкалу умственного развития, известную под названием "тест Бине-Симона".

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют обёективности оценок, не зависящих от субёективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

Тесты предъявляют требования:

Строгая формализация всех этапов тестирования,

Стандартизация заданий и условий их выполнения,

Квантификация полученных результатов и их структурирование по заданной программе,

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

Каждый тест, соответствующий критериям надежности, кроме набора заданий включает в себя следующие компоненты:

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий,

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится,

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученыный результат.

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь неодходимо учитывать, что переносить интерпретацию плученых результатов можно только на те группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров,

2) введение поправочных коэффициетнов с учетом характеристик выборки,

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос)

б) указаний относительно регистрации или интнграции полученых ответов.

Типичная для тестов стандартизация ситуации обеспечивает им в отличие от "свободного" наблюдения поведения большуюю объективность результатов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя различают тесты объективные и субъективные.

К объективным относятся большинство тестов достижений и психофизиологические тесты, к субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

Для проективных тестов типична ситуация, когда испытуемый не информирован о действительной цели исследования. При выполнениис заданий проективных тестов не существует "правильных" ответов. В зависимости от представленности в тесте речевого компонента различаются тесты вербальные и невербальные. Вербальным, например, является тест на словарный запас, невербальным - тест, требующий в качестве ответа определенных действий.

По формальной структуре различаются тесты простые,т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатичтияескими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой "идеальной норме".

Разработка теста состоит из четырех этапов.

На первомэтапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

На втором - производится отбор предварительных пунктов испытания с из последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

На третьем этапе тест проверяется повторно на той же самой популяции;

На четвертом - калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его пpоявления (напpимеp, способности, уpовень знаний, темпеpамент, интеpесы, установки);

б) связанную с этим валидизацию метода, т.е. опpеделение того, насколько он измеpяет тpебуемое свойство;

в) величину выбоpки из популяции, на котоpой должна пpоводиться оценка метода;

г) стимулиpующий матеpиал (таблички, изобpажения, игpушки, фильмы);

д) влияние исследователя в пpоцессе инстpуктиpования, постановки задач, pазъяснений, ответов на вопpосы;

е) условия ситуации;

ж) такие фоpмы поведения испытуеого, котоpые свидетельствуют об измеpяемом свойстве;

з) шкалиpование pелевантных фоpм поведения;

и) сведение pезультатов по отдельным измеpяемым пунктам в общие значения (напpимеp, суммиpование ответов типа "Да");

к) фоpмулиpовку pезультатов в ноpмиpованной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам. Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечаяя на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, крижочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал "лжи". Опросники применяются преимущественно для диагностики характера, диагностики личности (например, экстроверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций. Для таких свойств личности, как экстраверсия - интроверсия, доминирующий мотив, заторможенность, возбудимость, ригидность, разработан ряд диагностических методов (опросники и проективные тесты), с помощью которых можно определить выраженность этих свойств. При конструировании таких методов, как правило, пользуются факторным анализом (Г. Айзенк, Дж.Каттел, Дж. Гилфорд) и конструктивной валидизацией.

На современном этапе в прикладной социологии чаще всего используются тестовые методики, заимствованные из социальной психологии, касающиеся изучения качеств личности. Появляются тесты, специально разработанные социологами. Эти тесты часто используются в социологических анкетах.

Использованная литература:

1.Соц.справочник,Киев,1990.

2.Соц.словарь,Минск,1991.

3.Фонд времени и мероприятия в соц.сфере,М:Наука,1989.

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

знание тестовый задание

Одним из способов быстрой проверки знаний является тестирование. Однако в настоящее время, в связи с развитием информационных технологий, дистанционного обучения и в частности адаптивных обучающих систем, тестирование может применяться как средство идентификации личности обучаемого для построения индивидуальной последовательности обучения, когда каждый обучаемый проходит учебные курсы в том порядке и в том объеме, которые наиболее соответствуют его уровню подготовленности. В технологии дистанционного обучения при отсутствии непосредственного контакта обучаемого с преподавателем тестирование становится одним из основных средств контроля знаний, поэтому особенно остро встает проблема создания качественных тестов, которые могли бы быстро, объективно и адекватно измерять уровень знаний обучаемых.

Можно различать три вида тестирования:

· предварительное;

· текущее;

· итоговое.

Предварительное тестирование применяется перед началом обучения и направлено на выявление предварительных знаний обучаемого по ряду дисциплин, которые ему предстоит изучать. Сюда же могут включаться психологические тесты для определения индивидуальных характеристик личности обучаемого, которые учитываются в ходе обучения для настройки на работу с конкретным обучаемым. По результатам предварительного тестирования строится предварительная последовательность изучения учебных курсов.

Текущее тестирование - это контроль или самоконтроль знаний по отдельному элементу учебного курса, например, разделу или теме. По его результатам строится последовательность изучения тем и разделов внутри курса, а также может осуществляться возврат к темам, которые были изучены недостаточно хорошо.

Итоговое тестирование - это контроль знаний по курсу в целом или по совокупности курсов. По его результатам корректируется последовательность изучения учебных курсов.

При работе с тестами всегда нужно учитывать надежность результатов тестирования. Под надежностью тестовых результатов понимается характеристика, показывающая точность измерения знаний заданиями теста. Нужно отметить, что речь идет не о надежности теста, а о надежности результатов тестирования, т.к. на нее сильно влияет степень однородности различных групп обучаемых, уровень их подготовленности и ряд других факторов, связанных не с самим тестом, а с условиями проведения процесса тестирования.

1. Классификация тестов, методы тестирования, достоинства и недостатки тестовой проверки знаний студентов

1.1 Тестирование как метод исследования

Тестирование (англ. test - испытание, проверка) - экспериментальный метод психодиагностики, применяемый в эмпирических социологических исследованиях, а также метод измерения и оценки различных психологических качеств и состояний индивида .

Возникновение тестологических процедур было обусловлено потребностью сопоставления (сравнения, дифференциации и ранжирования) индивидов по уровню развития или степени выраженности различных психологических качеств.

Широкому распространению, развитию и совершенствованию тестов способствовал целый ряд преимуществ, которые дает этот метод. Тесты позволяют дать оценку индивида в соответствии с поставленной целью исследования; обеспечивают возможность получения количественной оценки на основе квантификации качественных параметров личности и удобство математической обработки; являются относительно оперативным способом оценки большого числа неизвестных лиц; способствуют объективности оценок, не зависящих от субъективных установок лица, проводящего исследование; обеспечивают сопоставимость информации, полученной разными исследователями на разных испытуемых.

К тестам предъявляют следующие требования:

Строгая формализация всех этапов тестирования;

Стандартизация заданий и условий их выполнения;

Квантификация полученных результатов и их структурирование по заданной программе;

Интерпретации результатов на основе предварительно полученного распределения по изучаемому признаку.

1) стандартная инструкция для испытуемого о цели и правилах выполнения заданий;

2) ключ шкалирования - соотнесение пунктов заданий со шкалами измеряемых качеств, указывающее, какой пункт заданий к какой шкале относится;

4) ключ интерпретации полученного индекса, представляющий собой данные нормы, с которыми соотносится полученный результат .

Традиционно нормой в тестологии являлись среднестатистические данные, полученные в результате предварительного тестирования на определенной группе лиц. Здесь необходимо учитывать, что переносить интерпретацию полученных результатов можно только на такие группы испытуемых, которые по своим основным социокультурным и демографическим признакам аналогичны базовой.

Для преодоления основного недостатка большинства тестов применяются различные приемы:

1) увеличение базовой выборки с целью повышения ее репрезентативности по большему числу параметров;

2) введение поправочных коэффициентов с учетом характеристик выборки;

3)введение в практику тестирования невербального способа предъявления материала.

Тест состоит из двух частей:

а) стимулирующего материала (задача, инструкция или вопрос);

б) указаний относительно регистрации или интеграции полученных ответов.

Тесты классифицируются по разным признакам.

По виду свойств личности они делятся на тесты достижений и личностные. К первым относятся тесты интеллекта, школьной успеваемости, тесты на творчество, тесты на способности, сенсорные и моторные тесты. Ко вторым - тесты на установки, на интересы, на темперамент, характерологические тесты, мотивационные тесты. Однако не все тесты (например, тесты развития, графические тесты) можно упорядочить по данному признаку. По виду инструкции и способу применения различаются индивидуальные и групповые тесты. При групповом тестировании одновременно обследуется группа испытуемых. Если в тестах уровня временных ограничений нет, то в тестах на скорость они обязательны. В зависимости от того, насколько в результате тестирования проявляется субъективность исследователя, различают тесты объективные и субъективные.

К объективным тестам относится большинство тестов достижений и психофизиологические тесты. К субъективным - проективные тесты. Это деление в определенной степени совпадает с делением на прямые и непрямые тесты, которые различаются в зависимости от того, знают или не знают испытуемые значение и цель теста.

По формальной структуре различаются тесты простые, т.е. элементарные, результатом которых может быть единственный ответ, и тесты сложные, состоящие из отдельных подтестов, по каждому из которых должна быть дана оценка. При этом могут высчитываться и общие оценки. Комплекс нескольких единичных тестов называют тестовой батареей, графическое изображение результатов по каждому подтесту - тестовым профилем. Нередко к тестам относят опросники, удовлетворяющие ряду требований, предъявляемых обычно к данному методу сбора психологической или социологической информации.

В последнее время все большее распространение получают критериально-ориентированные тесты, позволяющие оценивать испытуемого не в сопоставлении со среднестатистическими данными популяции, а по отношению к заранее заданной норме. Критерием оценки в таких тестах является степень приближения результата тестирования индивида к так называемой «идеальной норме» .

Разработка теста состоит из четырех этапов.

1) на первом этапе развивается исходная концепция с формулировкой основных пунктов испытания или основных вопросов, носящих предварительный характер;

2) на втором производится отбор предварительных пунктов испытания с последующей селекцией и приведением к окончательному виду, осуществляется одновременно оценка по качественным критериям надежности и валидности;

3) на третьем этапе тест проверяется повторно на той же самой популяции;

4) на четвертом калибруется по отношению к возрасту, уровню образования и другим признакам популяции.

На всех этапах разработки теста необходимо учитывать:

а) диагностируемое свойство личности (размер, положение, индикатор) или только наблюдаемые его проявления (способности, уровень знаний, темперамент, интересы, установки);

б) связанную с этим валидизацию метода, т.е. определение того, насколько он измеряет требуемое свойство;

в) величину выборки из популяции, на которой должна проводиться оценка метода;

г) стимулирующий материал (таблички, изображения, игрушки, фильмы);

д) влияние исследователя в процессе инструктирования, постановки задач, разъяснений, ответов на вопросы;

е) условия ситуации;

ж) такие формы поведения испытуемого, которые свидетельствуют об измеряемом свойстве;

з) шкалиpование релевантных форм поведения;

и) сведение результатов по отдельным измеряемым пунктам в общие значения (суммирование ответов типа «Да»);

к) формулировку результатов в нормированной шкале оценок.

Одним из вариантов теста может быть опросник, но при условии, что он отвечает требованиям, предъявляемым к тестам.

Опросник - это сборник вопросов, которые выбираются и располагаются по отношению друг к другу в соответствии с требуемым содержанием. Опросники используются, например, в целях психодиагностики, когда от испытуемого требуется самооценка его поведения, привычек, мнений и т.д. При этом испытуемый, отвечая на вопросы, выражает свои положительные и отрицательные предпочтения. С помощью опросников можно измерять у испытуемых и оценки ими других людей. Задание обычно выступает, как прямая реакция на вопросы, на которые надо ответить путем сожаления или опровержения. Возможности для ответа в большинстве случаев заданы и требуют лишь отметки в виде крестика, кружочка и т.п. Недостаток опросника состоит в том, что испытуемый может симулировать или диссимулировать те или иные свойства личности. Преодолеть указанный недостаток (хотя и не полностью) исследователь может посредством контрольных вопросов, контрольных шкал, шкал «лжи». Опросники применяются преимущественно для диагностики характера, диагностики личности (экстраверсии - интроверсии, интересов, установок, мотивов).

Диагностика личности - совокупность методов, позволяющих распознать ее внеинтеллектуальные свойства, носящие характер относительно устойчивых диспозиций.

1.2 Достоинства и недостатки тес товой проверки знаний студентов

В системе высшего образования применение тестирования знаний студентов имеет свои предпосылки. Поэтому тестирование имеет как достоинства, так и недостатки которые будут рассмотрены ниже.

В качестве достоинств можно отметить следующее:

1. Тестирование является более качественным и объективным способом оценивания. Для заочного обучения в условиях предельного ограничения количества аудиторных часов тестирование часто является единственной возможностью формирования достаточно объективной оценки знаний студентов.

2. Тестирование - более справедливый метод, оно ставит всех студентов в равные условия, как в процессе контроля, так и в процессе оценки, исключая субъективизм преподавателя.

3. Тесты это более объёмный инструмент, поскольку позволяет установить уровень знаний студента по предмету в целом, чем при выполнении контрольной работы.

4. Тестирование существенно экономит время преподавателя, отводимое на контроль знаний студентов, по сравнению с проверкой и защитой контрольных работ студентами заочной форме обучения. Это связано с тем, что тестированию одновременно подвергается сразу группа студентов.

Однако тестирование имеет также некоторые недостатки:

1. Жесткие временные ограничения, применяемые при выполнении тестовых заданий, исключают возможности определить структуру и уровень подготовленности тех испытуемых, которые в силу своих психофизиологических особенностей думают и делают все медленно, но при этом качественно.

2. Данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов.

3. Обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений.

4. В тестировании присутствует элемент случайности и интуиции. Причиной этого может быть угадывание ответа студентом, поэтому при разработке теста необходимо предвидеть такую ситуацию .

2 . Модели тестирования

Остановимся на основных моделях тестирования.

Классическая модель. Данная модель является самой первой и самой простой. Имеется n заданий по определенной области знаний, по нескольким областям знаний или части области знаний (разделу, теме и т.п.). Из этого множества заданий случайным образом выбирается k заданий (k

Достоинство:

Простота реализации.

Недостатки:

Из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных;

Оценка зависит только от количества правильных ответов и не учитывает сложность заданий.

Классическая модель из-за своих недостатков имеет самую низкую надежность, т.к. отсутствие учета параметров заданий часто не позволяет объективно оценить знания обучаемого.

В настоящее время происходит уход от использования данной модели к более совершенным и эффективным моделям, например, к адаптивному тестированию.

Классическая модель с учетом сложности заданий. Это тестирование проводится аналогично предыдущему, однако каждое задание имеет определенный уровень сложности Ti, i= и при подсчете результата тестирования учитывается сложность вопросов, на которые обучаемый дал правильный ответ. Чем выше сложность вопроса, тем выше будет результат тестирования. Для вопросов, на которые был дан неправильный ответ, сложность не учитывается.

Недостаток: из-за случайности выборки нельзя заранее определить, какие задания по сложности достанутся обучаемому. В итоге одному обучаемому могут достаться k легких заданий, а другому - k сложных.

Модели с учетом сложности заданий позволяют более адекватно подойти к оценке знаний. Но случайность выбора заданий не позволяет добиться параллельности тестов по сложности, т.е. одинаковости суммарных характеристик сложности заданий, что снижает надежность тестирования.

Модель с возрастающей сложностью. Имеется m уровней сложности. В тесте должны присутствовать задания всех уровней сложности. Из этого множества заданий случайным образом выбирается k заданий (k

Результат тестирования определяется аналогично модели с учетом сложности.

Данная модель обеспечивает параллельность тестов по сложности, т.е. надежность результатов тестирования еще выше, чем в предыдущих моделях.

Модель с разделением заданий по уровням усвоения.

Различают пять уровней усвоения учебного материала.

Нулевой уровень (Понимание) - это такой уровень, при котором обучаемый способен понимать, т.е. осмысленно воспринимать новую для него информацию. Фактически речь идет о предшествующей подготовке обучаемого .

Первый уровень (Опознание) - это узнавание изучаемых объектов при повторном восприятии ранее усвоенной информации о них или действиях с ними, например, выделение изучаемого объекта из ряда предъявленных объектов.

Второй уровень (Воспроизведение) - это воспроизведение усвоенных ранее знаний от буквальной копии до применения в типовых ситуациях. Примеры: воспроизведение информации по памяти, решение типовых задач по образцу.

Третий уровень (Применение) - это такой уровень усвоения информации, при котором обучаемый способен самостоятельно воспроизводить и преобразовывать усвоенную информацию для обсуждения известных объектов и применения ее в нетиповых ситуациях. При этом обучаемый способен генерировать новую для него информацию об изучаемых объектах. Примеры: решение нетиповых задач, выбор подходящего алгоритма из набора ранее изученных алгоритмов для решения конкретной задачи.

Четвертый уровень (Творческая деятельность) - это такой уровень владения учебным материалом темы, при котором обучаемый способен создавать новую информацию, ранее неизвестную никому. Пример: разработка нового алгоритма решения задачи.

Уровень представления обозначается a и может меняться от 0 до 4.

Задания составляются для каждого из пяти уровней. Сначала проводится тестирование с использованием заданий по уровню 0, затем по уровню 1, 2 и т.д. Перед переходом с уровня на уровень вычисляется степень владения учебным материалом на данном уровне и определяется возможность перехода на следующий уровень.

Для измерения степени владения учебным материалом на каждом уровне используют коэффициент:

где P 1 - количество правильно выполненных существенных операций в процессе тестирования;

Р 2 - общее количество существенных операций в тесте.

Под существенными операциями понимают те операции, которые выполняются на проверяемом уровне a. Операции, принадлежащие к более низким уровням, в число существенных не входят.

Исходя из этого: 0 ? К б? 1.

Таким образом, уровень усвоения учебного материала может быть использован для оценивания качества знаний у обучаемого и выставления оценки. Рекомендуются следующие критерии для выставления оценки:

К б < 0,7 Неудовлетворительно

0,7 ? К б <0,8Удовлетворительно

0,8 ? К б <0,9Хорошо

К б? 0,9 Отлично

При К б < 0,7 следует продолжать процесс обучения на том же уровне.

Модель с учетом времени ответа на задание. В данной модели при определении результата тестирования учитывается время ответа на каждое задание. Это делается для того, чтобы учесть возможность несамостоятельного ответа на задания: обучаемый может долго искать ответ в учебнике или других источниках, но в итоге его оценка все равно будет низкой, даже если на все вопросы он ответил правильно. С другой стороны, если он не пользовался подсказками, а долго думал над ответами, это означает, что он недостаточно хорошо изучил теорию, а в результате даже при правильных ответах оценка будет снижена.

Учет времени ответа может производиться, например, по формулам.

Результат ответа на i-е задание теста:

знание тестовый задание

Если R i > 1, то R i =1.

Если R i < 0, то R i =0.

где: t отв - время ответа на задание,

t max - время, в течение которого уменьшение оценки не происходит.

t max установлено для того, чтобы обучаемый имел возможность прочитать вопрос и варианты ответов, осмыслить их и выбрать правильный, по его мнению, ответ. Параметр t max может задаваться как константа для всех заданий теста или вычисляться для каждого отдельно взятого задания в зависимости от его сложности, т.е. t 2 max =f(T i), т.к. логично предположить, что для ответа на сложное задание требуется больше времени, чем на простое задание. Другая возможная зависимость параметра t max - от индивидуальных способностей обучаемого, которые должны быть определены ранее.

Результат тестирования:

Модели с учетом времени ответа на задание также позволяют повысить надежность результатов тестирования, особенно в сочетании с моделью с учетом сложности заданий.

Модель с ограничением времени на тест. Для оценки результатов тестирования берутся только те задания, на которые успел ответить обучаемый за данное время.

В настоящее время данная модель используется достаточно широко.

В некоторых работах рекомендуется обязательно сортировать задания по возрастанию сложности и устанавливать такое время тестирования, за которое на все задания теста не сможет ответить ни один, даже самый сильный обучаемый. Такой подход предлагается применять при тестировании на бланках, когда обучаемых видит перед собой сразу все задания. Суть его в том, что когда обучаемый ответит на все задания, а время у него еще останется, он может начать проверять свои ответы, сомневаться, а в итоге может исправить правильные ответы на неправильные. Поэтому рекомендуется или ограничивать время на тест или забирать бланк сразу после ответа на все задания теста.

Адаптивная модель. Данная модель является продолжением классической модели с учетом сложности заданий.

Адаптивным называется тест, в котором сложность заданий меняется в зависимости от правильности ответов испытуемого. Если обучаемый правильно отвечает на тестовые задания, сложность последующих заданий повышается, если неправильно - понижается. Также есть возможность задания дополнительных вопросов по темам, которые обучаемый знает не очень хорошо для более тонкого выяснения уровня знаний в данных областях. Таким образом, можно сказать, что адаптивная модель напоминает преподавателя на экзамене - если обучаемый отвечает на задаваемые вопросы уверенно и правильно, преподаватель достаточно быстро ставит ему положительную оценку. Если обучаемый начинает «плавать», то преподаватель задает ему дополнительные или наводящие вопросы того же уровня сложности или по той же теме. И, наконец, если обучаемый с самого начала отвечает плохо, оценку преподаватель тоже ставит достаточно быстро, но отрицательную.

Данная модель применяется для тестирования обучаемых с помощью компьютера, т.к. на бумажном бланке невозможно заранее разместить столько вопросов и в том порядке, сколько и в котором они должны быть предъявлены обучаемому.

Тестирование обычно начинается с заданий средней сложности, но можно начинать и с легких заданий, т.е. идти по принципу повышения сложности.

Тестирование заканчивается, когда обучаемый выходит на некоторый постоянный уровень сложности, например, отвечает подряд на некоторое критическое количество вопросов одного уровня сложности.

Достоинства:

1) позволяет более гибко и точно измерять знания обучаемых;

2) позволяет измерять знания меньшим количеством заданий, чем в классической модели;

3) выявляет темы, которые обучаемый знает плохо и позволяет задать по ним ряд дополнительных вопросов.

Недостатки:

1) заранее неизвестно, сколько вопросов необходимо задать обучаемому, чтобы определить его уровень знаний. Если вопросов, заложенных в систему тестирования, оказывается недостаточно, можно прервать тестирование и оценивать результат по тому количеству вопросов, на которое ответил обучаемый;

2) возможно применение только на ЭВМ.

Надежность результатов тестирования в данном случае самая высокая, т.к. осуществляется приспособление под уровень знаний конкретного обучаемого, что обеспечивает более высокую точность измерений.

Возможный алгоритм адаптивной модели тестирования. Данный алгоритм является достаточно простым и позволяет варьировать только уровень сложности, не учитывая статистику ответов на предыдущие вопросы. На каждом шаге тестирования по каждому уровню сложности обучаемому дается два задания, и по результатам ответов на них определяется уровень сложности для следующих заданий. Данное количество заданий (два) позволяют более адекватно оценивать уровень знаний, чем одно задание, на которое обучаемый может отгадать или случайно забыть ответ, и в то же время не дает большого количества сочетаний вариантов ответов, как в случае трех и тем более большего количества заданий.

Пусть имеется m уровней сложности. Вводится коэффициент k r =100/m.

Обозначим t - текущий уровень знаний обучаемого, t н - нижний уровень знаний, t в - верхний уровень знаний. Все уровни знаний будем измерять от 0 до 100 (0 - нет знаний, 100 - абсолютное знание) .

1. Установить t = 50; t н = 0; t в = 100.

2. Вычислить текущий уровень сложности T=t/k r .

3. Выдать два задания сложности T. Пусть k пр - количество правильных ответов, k пр?.

4. Пересчет уровня знаний:

· если k пр = 2, то t н = t; t в = t в + 0.5t. Если t в > 100, то t в = 100;

· если k пр = 1, то t н = t н / 4; t в = t в + 0.1t. Если t в > 100, то t в = 100;

· если k пр = 0, то t н = t н / 2; t в = t.

5. Если |t-t 1 |<е, то уровень знаний равен t 1 , выход.

6. Перейти к шагу (2).

е устанавливается исходя из необходимой точности оценки знаний. Однако с уменьшением е возрастает число вопросов, необходимых для включения в тест.

Модель тестирования по сценарию. Данная модель также является продолжением классической модели. Данная модель реализуется в системе Дистанционного Асинхронного Обучения, разрабатываемой в Татарском Институте Содействия Бизнесу (ТИСБИ) .

Существенным недостатком классической модели является непараллельность тестов для различных обучаемых, т. к. нельзя заранее определить, какие задания по сложности и по каким темам достанутся обучаемому. Поэтому при сценарном тестировании преподаватель перед тестированием формирует сценарий тестирования, где может указывать:

· количество заданий по каждой теме, которые должны быть включено в тест;

· количество заданий каждого уровня сложности, которые должны быть включено в тест;

· количество заданий каждой формы, которые должны быть включено в тест»;

· время прохождения теста

· и другие параметры.

Сценарий может создаваться по любому объему учебного материала: разделу, предмету, специальности и т.д.

Существует четыре формы тестовых заданий:

1. Задания с выбором, которые делятся на 3 подгруппы: задания с выбором одного правильного ответа или одновариантные задания, задания с выбором нескольких правильных ответов или многовариантные задания, задания с выбором наиболее правильного ответа.

2. Открытые задания.

3. Задания на установление соответствия.

4. Задания на установление правильной последовательности.

Непосредственно при тестировании выборка заданий каждого уровня сложности, по каждой теме, каждой формы и т.д. производится случайным образом из общей базы заданий, поэтому каждый обучаемый получает свои задания. Получаемые тесты для всех обучаемых являются параллельными, т.е. имеют одинаковое число заданий и одинаковую суммарную сложность. Но в отличие от модели с возрастанием сложности, которая также обеспечивает параллельность, здесь разработчик теста решает сам, сколько и каких заданий должно быть предъявлено по каждой теме, следовательно, обеспечиваются абсолютно одинаковые условия тестирования для всех обучаемых.

По сравнению с адаптивной моделью данная модель является менее эффективной, т.к. не настраивается под индивидуальные особенности каждого обучаемого, однако имеет преимущество психологического характера: при тестировании по адаптивной модели обучаемые отвечают на разное количество вопросов и как будто бы находятся в разных условиях. В случае тестирования по сценарию все обучаемые получают одинаковое количество вопросов по каждой теме и по каждому уровню сложности.

Надежность результатов тестирования сопоставима с надежностью, получаемой при тестировании с возрастанием сложности.

Модель на нечеткой математике. Цель введения нечеткой математики - попытка математической формализации нечетких, качественных явлений и объектов с размытыми границами, встречающихся в реальном мире. Нечеткое управление оказывается особенно полезным, когда описываемые процессы являются слишком сложными для анализа с помощью общепринятых количественных методов или когда доступные источники информации интерпретируются качественно, неточно или неопределенно. Экспериментально показано, что нечеткое управление дает лучшие результаты по сравнению с получаемым при общепринятых алгоритмах управления. Нечеткая логика, на которой основано нечеткое управление, ближе по духу к человеческому мышлению и естественным языкам, чем традиционные логические системы. Нечеткая логика, в основном, обеспечивает эффективные средства отображения неопределенностей и неточностей реального мира. Наличие математических средств отражения нечеткости исходной информации позволяет построить модель, адекватную реальности .

Данная модель тестирования является развитием любой предыдущей модели, в которой вместо четких характеристик тестовых заданий и ответов используются их нечеткие аналоги. Примерами могут служить:

Сложность задания («легкое», «среднее», «выше среднего», «сложное» и т.п.);

Правильность ответа («правильно», «частично правильно», «скорее неправильно», «неправильно» и т.п.);

Время ответа («маленькое», «среднее», «большое», «очень большое» и т.п.);

Процент правильных ответов («маленький», «средний», «большой», «очень большой» и т.п.);

Итоговая оценка;

Введение нечетких характеристик может помочь преподавателям разрабатывать тесты. Например, преподаватель может достаточно быстро определить, является ли задание сложным или нет. Но сказать точно, насколько оно сложно, например, по 100-бальной шкале или точно оценить разницу сложностей двух заданий будет для него достаточно трудно. С точки зрения обучаемого нечеткая оценка его знаний в виде «хорошо», «отлично», «не очень хорошо» и т.п. более понятна ему, чем четкое количество баллов, которое он набрал в результате тестирования.

Модели могут быть комбинированными, например:

Классическая модель с учетом сложности заданий и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с учетом времени ответа на задание;

Модель с возрастающей сложностью и модель с ограничением времени на тест;

Модель с учетом времени ответа на задание и адаптивная модель;

Модель с учетом времени ответа на задание и модель на нечеткой математике;

Модель с разделением заданий по уровням усвоения и модель с учетом сложности заданий;

3 . Разработка тестовых заданий

3.1 Создание компьютерного тестирования

Компьютерный тест - инструмент, предназначенный для измерения обученности учащегося, состоящий из системы тестовых заданий в электронном виде, определённой процедуры проведения, обработки и анализа результатов. Компьютерный тест формируется программным способом из электронного банка тестовых заданий в соответствии со спецификацией (планом, паспортом теста).

Систематическая проверка знаний большого числа проверяемых приводит к необходимости автоматизации проведения тестирования знаний, использованию компьютерной техники и соответствующих программ проверки знаний.

Компьютерное тестирование как эффективный способ проверки знаний находит в образовании все большее применение. Одним из его достоинств является минимум временных затрат на получение надежных итогов контроля, и получение результатов практически сразу по завершении контролирующего теста. От традиционных оценок и контроля знаний - тесты отличаются объективностью измерения результатов обучения, поскольку они ориентируются не на субъективное мнение преподавателей, а на объективные критерии.

Главные требования к системе компьютерного контроля заключаются в том, что:

Тестовые вопросы и варианты ответов на них должны быть четкими и понятными по содержанию;

Компьютерный тест должен быть простым в использовании;

Тестовых вопросов должно быть настолько много, чтобы совокупность этих вопросов охватывала весь материал, который обучающийся должен усвоить;

Вопросы должны подаваться испытуемому в случайном порядке, чтобы исключить возможность механического запоминания их последовательности;

Варианты возможных ответов должны следовать так же в случайном порядке;

Необходимо проводить учет времени, затраченного на ответы, и ограничивать это время.

Был создан тест для проверки знаний студентов физического факультета по дисциплине специализации «Допуски, посадки и технические измерения». Опрос в форме тестирования проводится в течение 15 минут и включает в себя 15 вопросов, которые последовательно предъявляются студенту в автоматизированном режиме. Во время тестирования на экране монитора располагается только одно тестовое задание.

Каждый студент имеет право пройти тест только один раз. По истечении 15 минут компьютерная программа автоматически завершает процедуру тестирования и выдает на экран монитора итоговый результат.

Во время тестирования переговоры между студентами не разрешаются. С вопросами, не касающимися содержания учебного материала, следует обращаться к преподавателю или администратору компьютерного класса, предварительно подняв руку, чтобы не отвлекать других испытуемых во время тестирования.

Наличие учебных и справочных материалов во время сеанса тестирования не допускается. Выходить из компьютерного класса во время сеанса тестирования не разрешается.

Для компьютерного тестирования была использована программа «Краб 2», в которой случайным образом из 50 вопросов выбирается 15 и предлагаются студенту. На каждый вопрос дается по 4 варианта ответа. Правильными может быть от одного до трёх ответов.

Рисунок 1 - Пример вопроса с одним правильным ответом

Рисунок 2 - Пример вопроса с несколькими правильными ответами

При тестировании допускается пропускание вопроса, возвращение к предыдущему вопросу, а также своевременное завершение теста. Результат тестирования выводится на экран при завершении теста. Указывается количество правильных, неправильных и пропущенных ответов. По завершению теста можно посмотреть все задания, на который студент дал неверный ответ.

Рисунок 3 - Результат тестирования

3.2 Тестовые задания

1. Качество изделия следует рассматривать:

a. на протяжении всего «жизненного цикла»;

b. на этапе изготовления;

c. на этапе эксплуатации;

d. нет правильного ответа

2. Термин, условно применяемый для обозначения наружных элементов деталей, включая и нецилиндрические элементы:

a. отверстие;

b. вал;

d. шарнир.

3. Размер элемента, установленный измерением:

a. наименьший предельный размер;

b. номинальный;

c. предельный размер;

d. действительный размер.

Какая схема изображена на представленном рисунке

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

4. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

5. Какая схема изображена на представленном рисунке:

a. схемы посадок в системы основного отверстия;

b. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

c. поля допусков с разными основными отклонениями и уровнями относительной точности;

d. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

6. Какая схема изображена на представленном рисунке:

схемы посадок в системы основного отверстия;

a. поля допусков основных отверстий и основных валов разной относительной точности с основными отклонениями;

b. поля допусков с разными основными отклонениями и уровнями относительной точности;

c. поля допусков с одинаковыми основными отклонениями и разными уровнями относительной точности.

7. Какие калибры обеспечивают контроль по наибольшему и наименьшему придельным значениям параметров:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

8. Калибры, предназначенные для контроля деталей в процессе их изготовления:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

9. Калибры, предназначенные для контроля рабочих калибров-скоб:

a. предельные;

b. рабочие;

c. контрольные;

d. нормальные.

10. Допуск формы - это:

a. нормативные ограничения отклонения формы назначенными полями допусков;

b. характеристики любой реальной поверхности;

c. прямолинейность осей поверхности вращения;

d. прямолинейность цилиндра и конуса.

11. Какие виды взаимозаменяемости различают:

a. функциональная;

b. алгебраическая;

c. геометрическая;

d. полная.

12. К суммарным отклонениям формы и расположения относятся:

a. торцовое биение;

b. заданное биение;

c. радиальное биение;

d. нормальное биение.

13. Условный знак допуска плоскости выглядит:

a. ;

14. Условный знак допуска формы заданной поверхности:

c. ;

15. По каким классам точности установлены общие допуски размеров:

a. последний, средний;

b. нормальный, точный;

c. точный, средний;

d. грубый, очень грубый.

16. Какое обозначение имеет шариковый радиальный подшипник:

a. 0;

17. Какое обозначение имеет шариковый радиальный сферический подшипник:

b. 1;

18. Какое обозначение имеет роликовый радиальный с витыми роликами подшипник:

d. 5.

19. Какое обозначение имеет шариковый радиально-упорный подшипник:

c. 6;

20. Основными достоинствами резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

21. Основными недостатками резьбовых соединений являются:

a. усложнение конструкции;

b. легкая сборка;

c. высокий уровень взаимозаменяемости изделий;

d. усложнение технологии.

22. Для метрических резьб стандартизированы:

a. профиль резьбы;

b. номинальные диаметры и шаги;

c. нормы точности;

d. нет правильного ответа.

23. В зависимости, от каких характеристик функционирования различают резьбовые соединения:

a. неподвижные;

b. подвижные;

c. стандартные;

d. нестандартные.

24. Качество измерений, отражающее близость к нулю систематических погрешностей и их результат:

a. правильность измерений;

b. сходимость измерений;

d. нормальность измерений.

25. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в одинаковых условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

26. Качество измерений, отражающее близость друг к другу результатов измерений, выполняемых в различных условиях:

a. правильность измерений;

b. сходимость измерений;

c. воспроизводимость измерений;

d. нормальность измерений.

27. Какой взаимозаменяемости полная взаимозаменяемость предполагает наличие:

a. полная;

b. неполная;

c. начальная;

d. конечная.

28. Предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

29. Действительный размер это:

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

30. Номинальный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

31. Наибольший предельный размер это:

a. два предельно допустимых размера элементов, между которыми должен находиться действительный размер;

b. наибольший допустимый размер элемента;

c. размер элемента, установленный измерением;

d. размер, относительно которого определяются отклонения.

32. Действительное отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

33. Предельное отклонение это:

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

34. Верхнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

35. Нижнее отклонение это:

a. алгебраическая разность между действительным и соответствующим номинальным размерами;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

36. Основное отклонение это:

a. одно из двух предельных отклонений определяющее положение поля допуска относительно нулевой линии;

b. алгебраическая разность между предельным и соответствующим номинальным размерами;

c. алгебраическая разность между наибольшим предельным и соответствующим номинальным размерами;

d. алгебраическая разность между наименьшими предельным и соответствующим номинальным размерами.

37. Квалитет - это:

c. совокупность допусков, рассматриваемых как соответствующие одному уровню точности для всех номинальных размеров;

38. Допуск - это:

a. поле, ограниченное наибольшим и наименьшим предельными размерами и определяемое величиной допуска и его положением относительно номинального размера;

b. разность между наибольшим и наименьшим предельным размерами или алгебраическая разность между верхними и нижними отклонениями;

d. отверстие, нижнее отклонение которого равно нулю.

39. Поле допуска - это:

d. отверстие, нижнее отклонение которого равно нулю.

40. Основное отверстие - это:

d. отверстие, нижнее отклонение которого равно нулю.

41. Характер соединения двух деталей, определяемый разностью их размеров до сборки:

a. допуск;

b. посадка;

42. Разность между размерами отверстия и вала до сборки, если размер отверстия больше размера вала:

a. допуск;

b. посадка;

c. зазор;

43. Разность между размерами вала и отверстия до сборки, если размер вала больше размера отверстия:

a. допуск;

b. посадка;

d. натяг.

44. Разность между наибольшим и наименьшим предельными размерами или алгебраическая разность между верхним и нижним отклонениями:

a. допуск;

b. посадка;

45. Наименьший зазор - это:

a. разность между наименьшим предельным размером отверстия и наибольшим предельным размером вала в посадке с зазором;

46. Наибольший зазор - это:

b. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

47. Посадка с натягом - это:

c. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке.

48. Наименьший натяг - это:

c. наименьший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

d. разность между наименьшим предельным размером вала и наибольшим предельным размером отверстия до сборки в посадке с натягом.

49. Наибольший натяг - это:

a. разность между наибольшим предельным размером вала и наименьшим предельным размером отверстия до сборки в посадке с натягом или в переходной посадке;

b. наибольший предельный размер отверстия меньше наименьшего предельного размера вала или равен ему;

c. разность между наибольшим предельным размером отверстия и наименьшим предельным размером вала в посадке с зазором или в переходной посадке;

Заключение

Тестирование является одним из основных видов проверки знаний, как во время вступительной комиссии в высшее учебное заведение, так и в процессе обучения. Этот метод проверки знаний позволяет давать оценку беспристрастно, системно, объективно и достаточно быстро, исключая субъективные особенности экзаменатора.

В курсовой работе были рассмотрены основные модели тестовых заданий (классический, адаптивный, с учетом времени, с учетом сложности), их достоинства и недостатки. Так же было разработано компьютерное тестирование для проверки знаний у студентов физического факультета по темам: «Допуски, посадки и технические измерения».

Тестовые задания познавательны для обучающихся, они способствуют развитию интереса к предмету и повышают качество знаний. Обучающиеся с разным уровнем подготовки чувствуют себя психологически комфортно при проведении теста. Тестовые задания способствуют развитию мышления, учат сопоставлять и сравнивать, анализировать и делать выводы, планировать дальнейшую деятельность.

На основе материала данной курсовой работы можно сказать, что использование тестов для проверки знаний студентов является надежным и перспективным методом и может широко использоваться и в дальнейшем.

Список использованных источников

знание тестовый задание

1. Социологический справочник / под ред. В.И. Воловича. - Киев, 1990. - 379 с.

2. Социологический словарь / сост.: А.Н. Елсуков, К.В. Шульга. - Мн., 1991. - 528 с.

3. Фонд времени и мероприятия в социальной сфере / под ред. В.Д. Патрушева. - М.: Наука, 1989. - 176 с.

4. Беспалько, В.П. Системно-методическое обеспечение учебно-воспитательного процесса подготовки специалистов / В.П. Беспалько, Ю.Г. Татур - М.: «Высшая школа», 1989. - 144 с.

6. Глова, В.И. Мягкие вычисления (soft computing) и их приложения / В.И. Глова, И.В. Аникин, М.А. Аджели. - Казань: 2000. - 98 с.

Подобные документы

История возникновения тестирования. Понятие теста, тестовых заданий. Классификация тестов, основные формы тестирования. Закрытые и открытые тестовые задания. Задания на соответствие и установление правильной последовательности. Анализ систем тестирования.

презентация , добавлен 07.04.2014

Особенности организации тестирования знаний. Рекомендации по использованию тестовых заданий на разных этапах обучения и в различных видах занятий, оценка их результатов. Анализ роли и места тестовых заданий по истории в проверке знаний и умений учащихся.

курсовая работа , добавлен 30.08.2010

Значение проверки знаний учащихся по биологии. Классификация тестовых заданий. Основные формы и методы проверки знаний и умений учащихся. Использование тестовых заданий для текущей и итоговой проверки. Обучение учащихся работе с тестовыми заданиями.

курсовая работа , добавлен 17.03.2010

Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.

курсовая работа , добавлен 28.10.2008

Использование электронных систем управления обучением. Формирование банка тестовых заданий всех основных форм. Матрица результатов тестовых заданий. Индекс легкости заданий для тестируемой группы. Средства анализа результатов тестовых заданий системы.

реферат , добавлен 31.03.2011

Цель проведения и методы оценочной процедуры. Составление контрольно-измерительных материалов для итоговой аттестации по технической механике. Структуризация банка заданий. Оценка результатов тестирования. Экспертиза и апробация банка тестовых заданий.

дипломная работа , добавлен 25.05.2014

Качественные экспертно-ориентированные методы оценки знаний и умений учащихся. Цель и основные задачи тестирования. Основные виды тестовых заданий. Функции теста и основные этапы его разработки. Сквозное применение педагогами метода тестирования.

курсовая работа , добавлен 27.12.2011

История проверки знаний и способностей с помощью различных заданий. Опыт централизованного абитуриентского и репетиционного тестирования в России. Тесты в американской системе образования. Характерные черты тестовых методов, используемых в Америке.

реферат , добавлен 05.02.2008

Методологические основы создания тестовых заданий, их особенности, класификация, критерии качества, экспертиза. Проверка в тестовых заданиях законов сохранения энергии, сохранения импульса и сохранения момента импульса.

дипломная работа , добавлен 29.07.2011

Теоретико-методические основы тестовых заданий и его видов. Психолого-педагогические основы. Тесты на уроках математики. Анализ опыта учителей по применению тестовых заданий. Краткая характеристика преимуществ использования тестовой формы контроля.

Как и процесс разработки, процесс последующего тестирования программного обеспечения также следует определенной методологии. Под методологией в данном случае мы понимаем разнообразные комбинации принципов, идей, методов и концептов, к которым вы прибегаете во время работы над проектом.

В настоящее время существует довольно большое количество разнообразных подходов к тестированию, каждый со своими отправными точками, продолжительностью выполнения и методами, используемыми на каждом этапе. И выбор того или иного из них может быть довольно непростой задачей. В этой статье мы рассмотрим разные подходы к тестированию ПО и поговорим об их основных особенностях, чтобы помочь вам сориентироваться в существующем многообразии.

Каскадная модель (Линейная последовательная модель жизненного цикла ПО)

Каскадная модель (Waterfall Model) является одной из наиболее старых моделей, которую можно применять не только для разработки или тестирования ПО, но также практически для любого другого проекта. Его базовым принципом является последовательный порядок выполнения задач. Это значит, что мы можем переходить к следующему шагу разработки или тестирования только после того, как предыдущий был успешно завершен. Эта модель подходит для небольших проектов и применима только в том случае, если все требования точно определены. Главными достоинствами этой методологии являются экономическая эффективность, простота использования и управления документацией.

Процесс тестирования ПО начинается после завершения процесса разработки. На этой стадии все необходимые тесты переносятся с юнитов на системное тестирование для того, чтобы контролировать работу компонентов как по отдельности, так и в комплексе.

Помимо упомянутых выше достоинств, данный подход к тестированию также имеет и свои недостатки. Всегда существует вероятность обнаружения критических ошибок в процессе тестирования. Это может привести к необходимости полностью изменить один из компонентов системы или даже всю логику проекта. Но подобная задача невозможна в случае каскадной модели, поскольку возвращение на предыдущий шаг в этой методологии запрещено.

Узнайте больше о каскадной модели из предыдущей статьи .

V-Model (Модель верификации и валидации)

Как и каскадная модель, методика V-Model основана на прямой последовательности шагов. Основным отличием между этими двумя методологиями является то, что тестирование в данном случае планируется параллельно с соответствующей стадией разработки. Согласно этой методологии тестирования ПО, процесс начинается как только определены требования и становится возможным начать статическое тестирование, т.е. верификацию и обзор, что позволяет избежать возможных дефектов ПО на поздних стадиях. Соответствующий план тестирования создается для каждого уровня разработки ПО, что определяет ожидаемые результаты, а также критерии входа и выхода для данного продукта.

Схема данной модели показывает принцип разделения задач на две части. Те, которые относятся к дизайну и разработке, размещены слева. Задачи, относящиеся к тестированию ПО, размещены справа:

Основные этапы этой методологии могут изменяться, однако обычно они включают следующие:

Этап определения требований . Приемочное тестирование относится к этому этапу. Его основная задача состоит в оценке готовности системы к финальному использованию
Этап, на котором происходит высокоуровневое проектирование, или High-Level Design (HDL) . Этот этап относится к системному тестированию и включает оценку соблюдения требований к интегрированным системам
Фаза детального дизайна (Detailed Design) параллельна фазе интеграционного тестирования, во время которой происходит проверка взаимодействий между различными компонентами системы
После этапа написания кода начинается другой важный шаг — юнит-тестирование. Очень важно убедиться в том, что поведение отдельных частей и компонентов ПО корректно и соответствует требованиям

Единственным недостатком рассмотренной методологии тестирования является отсутствие готовых решений, которые можно было бы применить, чтобы избавиться от дефектов ПО, обнаруженных на этапе тестирования.

Инкрементная модель

Данная методология может быть описана, как мультикаскадная модель тестирования ПО. Рабочий процесс разделяется на некоторое количество циклов, каждый из которых также делится на модули. Каждая итерация добавляет определенный функционал к ПО. Инкремент состоит из трех циклов:

дизайн и разработка
тестирование
реализация.

В этой модели возможна одновременная разработка разных версий продукта. Например, первая версия может проходить этап тестирования в то время, как вторая версия находится на стадии разработки. Третья версия в то же самое время может проходить этап дизайна. Этот процесс может продолжаться до самого завершения проекта.

Очевидно, что данная методология требует обнаружения максимально возможного количества ошибок в тестируемом ПО настолько быстро, насколько это возможно. Так же, как и фаза реализации, которая требует подтверждения готовности продукта к доставке к конечному пользователю. Все эти факторы существенно увеличивают весомость требований к тестированию.

В сравнении с предыдущими методологиями, инкрементная модель имеет несколько важных преимуществ. Она более гибкая, изменение требований ведет к меньшим затратам, а процесс тестирования ПО является более эффективным, поскольку гораздо проще проводить тестирование и дебаггинг за счет использования небольших итераций. Тем не менее, стоит отметить, что общая стоимость все же выше, чем в случае каскадной модели.

Спиральная модель

Спиральная модель это методология тестирования ПО, которая основана на инкрементном подходе и прототипировании. Она состоит из четырех этапов:

Планирование
Анализ рисков
Разработка
Оценка

Сразу после того, как первый цикл завершен, начинается второй. Тестирование ПО начинается еще на этапе планирования и длится до стадии оценки. Основным преимуществом спиральное модели является то, что первые результаты тестирования появляется незамедлительно после появления результатов тестов на третьем этапе каждого цикла, что помогает гарантировать корректную оценку качества. Тем не менее, важно помнить о том, что эта модель может быть довольно затратной и не подходит для маленьких проектов.

Несмотря на то, что эта модель является довольно старой, она остается полезной как для тестирования, так и для разработки. Более того, главная цель многих методологий тестирования ПО, включая спиральную модель, изменилась в последнее время. Мы используем их не только для поиска дефектов в приложениях, но также и для выяснения причин, их вызвавших. Такой подход помогает разработчикам работать более эффективно и быстро устранять ошибки.

Читайте подробнее o спиральной модели в предыдущем блог посте .

Agile

Методология гибкой (Agile) разработки и тестирование ПО может быть описана как набор подходов, ориентированных на использование интерактивной разработки, динамического формирования требований и обеспечения их осуществления как результата постоянного взаимодействия внутри самоорганизующейся рабочей группы. Большинство гибких методологий разработки ПО нацелены на минимизацию рисков посредством разработки в рамках коротких итераций. Одним из главных принципов этой гибкой стратегии является возможность быстрого реагирования на возможные изменения, нежели стремление положиться на долгосрочное планирование.

Узнайте больше об Agile (прим. — статья на английском языке) .

Экстремальное программирование (XP, Extreme Programming)

Экстремальное программирование является одним их примеров гибкой разработки ПО. Отличительной особенностью этой методологии является “парное программирование”, ситуация, когда один разработчик работает над кодом, в то время как его коллега постоянно проводит обзор написанного кода. Процесс тестирования ПО является довольно важным, поскольку начинается даже раньше, чем написана первая строка кода. Каждый модуль приложения должен иметь юнит-тест, чтобы большинство ошибок могло быть исправлено на стадии написания кода. Другим отличительным свойством является то, что тест определяет код, а не наоборот. Это значит, что определенная часть кода может быть признана завершенной только в том случае, если все тесты пройдены успешно. В противном случае, код отклоняется.

Главными достоинствами такой методологии являются постоянное тестирование и короткие релизы, что помогает обеспечить высокое качество кода.

Scrum

Scrum — Часть методологии Agile, итеративный инкрементный фреймворк, созданный для управления процессом разработки ПО. Согласно принципам Scrum, команда тестировщиков должна участвовать в следующих этапах:

Участие в Scrum планировании
Поддержка в юнит-тестировании
Тестирование пользовательских историй
Сотрудничество с заказчиком и владельцем продукта для определения критериев приемлемости
Предоставление автоматического тестировании

Более того, участники QA-отдела должны присутствовать на всех ежедневных собраниях, как и другие члены команды, чтобы обсудить, что было протестировано и сделано вчера, что будет протестировано сегодня, а также общий прогресс тестирования.

В то же время принципы Agile методологии в Scrum к появлению специфических особенностей:

Оценка усилий, необходимых для каждой пользовательской истории является обязательной
Тестировщик должен быть внимательным к требованиям, поскольку они могут постоянно изменяться
Риск регрессии возрастает вместе с частыми изменениями в коде
Одновременность планирования и выполнения тестов
Недопонимание между членами команды в случае если требования заказчика не до конца ясны

Узнайте больше о методологии Scrum из предыдущей статьи .

Заключение

В заключение важно отметить, что сегодня практика использования той или иной методологии тестирования ПО подразумевает мультиверсальный подход. Иными словами, не стоит рассчитывать на то, что какая-то одна методология окажется подходящей для всех типов проектов. Выбор одной из них зависит от большого числа аспектов, таких как тип проекта, требования заказчика, поставленные сроки, а также многих других. С точки зрения тестирования ПО, для некоторых методологий характерно приступать к тестированию на ранних этапах разработки, в то время как при работе с другими принято ожидать до тех пор, пока система не готова полностью.

Если вам нужна помощь с разработкой программного обеспечения или тестированием, выделенная команда разработчиков и QA инженеров готова к работе.

Приступая к рассказу о тестировании, мы начнем с самого главного - с определения понятия «тест». В общенаучном смысле тест (от англ. test - опыт, проба) - это кратковременное стандартизованное испытание, направленное на получение в относительно сжатый отрезок времени наиболее существенной информации о признаках данного конкретного объекта с целью установления у него наличия или степени выраженности определенного психического свойства (черты, характеристики) или качества, а также совокупности психических свойств личности или психических состояний (отношений, взаимовосприятия) групп и коллективов. Тест позволяет с заранее установленной степенью вероятности определить существующий у человека в данное время уровень знаний, относительно устойчивые личностные свойства, черты поведения, а также получить качественные и количественные оценки измеряемых характеристик.

Концепция тестирования как метода оценки и измерения качеств личности базируется на следующих общих предпосылках:
1. Внутренние (психологические) свойства личности выявляются с помощью индикаторов - показателей или внешних поведенческих характеристик (ответов на вопросы, результатов решения разного рода задач и т.п.), посредством которых проявляются структуры и свойства личности.
2. Эти индикаторы имеют такое выражение, которое может быть объектом наблюдения и измерения с помощью специальных процедур.
3. Между внешней (поведенческой) чертой и внутренним свойством личности существует однозначная причинная зависимость:
наблюдаемое действие или реакция человека порождены определенным личностным свойством и только им.
4. Измеряемые тестами черты и соответственно получаемые результаты распределены среди большой совокупности людей достаточно равномерно. Это означает, что тест должен не только оценивать конкретно взятого человека, но и быть применимым к большой совокупности людей.

Последнее требование отражается в понятии «норма теста», под которой понимается «средний уровень развития большой совокупности людей, похожих на данного испытуемого по ряду социально-демографических характеристик»3. Иными словами, норма теста - это средний уровень распределения выявляемых с его помощью характеристик в большой группе людей, на применимость в которой он претендует. В большинстве случаев норма теста определяется с помощью усреднения результатов тестирования большой выборки людей одного пола, примерно одинакового возраста и дифференциации полученных результатов по важнейшим показателям. Норма теста отражает его репрезентативность или свойство выборочной совокупности людей (группы или ряда групп, на основе анализа качеств которых был разработан тест) представлять генеральную совокупность всех лиц, обладающих подобными типологическими характеристиками. Репрезентативность позволяет классифицировать результаты тестирования и выступает показателем качественности тестовой методики.

Еще одним критерием добротности теста, тесно связанным с репрезентативностью, является его адаптированность - способность учитывать национальные (в том числе и социальные) и региональные особенности. Авторы берут нужный для построения тестов материал из исторически сложившейся культуры близкой им социальной общности. Тесты, «свободные от культуры», а значит одинаково понятные по материалу индивидам из разных социальных общностей, создать нельзя - это неустранимое свойство тестовых программ. При использовании тестов, разработанных в иной социально-культурной среде, в проверке и переоценке нуждаются нормы, валидность, надежность тестов, а также их применимость в целом. Особенно остро проблема адаптированности заявила о себе в последние годы, когда в Россию широким потоком хлынули западные тестовые методики и российские специалисты в области кадрового менеджмента бросились применять их, подчас не задумываясь о необходимости внесения определенных корректив.

В силу фактического запрета на использование тестов, существовавшего в СССР (после известного постановления ЦК ВКПб 1936 г. «О педологических извращениях в системе Наркомпроса»), российский кадровый менеджмент является дилетантом в этой области. Многих буквально очаровывает магия «фирменных» латинских букв, аббревиатур, обозначающих «классические» методики, такие, например, как MMPI (личностный опросник, разработанный в Миннесотском университете), на основании которых» предлагается получение развернутых заключений о сотрудниках фирмы или кандидатах на имеющиеся вакансии. Несомненно, вышеупомянутый тест занимает в мировой психологии лидирующую (по популярности) позицию. Однако нельзя забывать тот факт, что он был разработан специально для пациентов психиатрических клиник (!) и широко используется в практике психоанализа. При приеме нормальных здоровых людей в американские фирмы этот тест в последние годы не применяется! Лица, подвергшиеся подобному тестированию, уже выиграли по суду немало исков, а компаниям пришлось уплатить солидные штрафы за нанесение морального ущерба.

Вообще западные личностные тесты, в том числе и более подходящие для ситуации приема на работу («16 личностных факторов» Кэттелла- 16PF, Калифорнийский личностный перечень - CPI, Опросник Айзенка - EPI, Тест Майерс-Бриггс, основанный на типологии Юнга), для корректного применения в России нуждаются в серьезной доработке («культурной и психометрической адаптации»). Неадаптированное, без внесения существенных поправок использование этих и подобных им тестов в современных, российских условиях явно неправомерно, хотя бы уже потому, что в нашей стране условия труда, его оплаты, традиции трудового сознания во многом отличны от западных. Далеко не для всех тестов проведена адаптация, что уж говорить о «пиратских» версиях западных тестов. Как правило, неадаптированные версии используют дилетанты в области психометрики, которые наивно полагают, что достаточно просто перевести на русский язык тестовые задания и тест будет работать. На самом же деле работа по адаптации тестовых методик должна включать пересчет не только так называемых тестовых норм, но и ключей к тест-заданиям (пунктам).

Для того чтобы тесты соответствовали своему назначению, адекватно выявляли и достаточно точно измеряли определенные качества, они должны также соответствовать таким критериям, как объективность, валидность, надежность и научность. Объективность означает, что результаты тестирования должны быть интерсубъективны, т.е. независимы от того, кто проводит тест. Валидность (от англ. valid- действительный, пригодный) - это пригодность теста для измерения именно того качества, на оценку которого он направлен. Так, например, если тест используется для оценки уровня знаний человека в области управления персоналом, он должен измерять именно эти знания, а не, например, общую эрудицию или знания в области экономики. Существуют, по меньшей мере, три условия обоснования валидности: валидность относительно критерия (требующая демонстрации корреляции или иного статистического взаимоотношения между результатами теста и требованиями работы); валидность относительно содержания (требующая демонстрации того, что содержание теста представляет важнейшие относительно работы черты поведения); валидность относительно конструктов (требующая демонстрации того, что тест определяет именно тот конструкт или характеристику, для определения которой он предназначен, и что эта характеристика важна для успешности в работе).

Надежность отражает степень точности и постоянства, с которой измеряется качество личности, и характеризует свободу процедуры тестирования от погрешностей. Точность проявляется в уровне совпадения результатов данного теста с показателями других тестов, используемых для этой же цели, постоянство - в устойчивости, стабильности результатов при повторной оценке той же группы тестируемых. Вместе с тем специалисты отмечают существование нескольких причин, по которым индивид, вновь проходящий тест, не получает сходные оценки. К ним относятся: временные психологические или физические изменения состояния тестируемого; факторы окружения (температура комнаты, освещение, уровень шума или даже личность проводящего тест); форма теста (многие тесты имеют разную форму или версию - на бумажном носителе, в электронном виде, в устном исполнении) и т.п. Указателем надежности теста является степень, в которой сфера оценок теста не подвержена влиянию указанных факторов.

Надежность теста определяется его коэффициентом, который может колебаться от 0 до 1. Обычно говорится, что если надежность теста 0,9 и более, то результаты его превосходны, тест с надежностью 0,8-0,89 дает хорошие результаты, тест с надежностью 0,7-0,79 дает адекватные результаты, тест с надежностью менее 0,7 имеет ограниченную применимость. Допустимый уровень надежности будет отличаться в зависимости от типа теста и используемой оценки его надежности. Ниже приводятся основные типы надежности тестовых процедур:
♦ надежность типа «тест - повторный тест» указывает на возможность получения таких же результатов по тесту по прошествии времени;
♦ надежность альтернативной, или параллельной, формы: речь идет о том, что результаты теста подобны, если индивид выбирает одну или несколько его альтернативных форм;
♦ надежность типа «интероценка» указывает, что результаты теста подобны при проведении его двумя или более оценщиками;
♦ надежность типа «внутренняя непротиворечивость» указывает границы, в которых тест измеряет одно и то же.

Надежность и валидность теста взаимосвязаны. Вместе с тем между ними следует проводить различия: надежность говорит о том, насколько истинные результаты дает тест, валидность - насколько хорош тест для отдельной ситуации. Таким образом, тест может быть надежным, но не быть валидным. Он может оказаться невалидным для различных целей: например, адекватно показывать технические навыки, но быть бесполезным при определении лидерских качеств. Сходным образом валидность теста обоснована относительно специфических групп индивидов (так называемых референтных групп); вполне реальна ситуация, когда целевая группа может не входить в число последних. В целом валидность теста может быть либо равна (идеальный случай), либо меньше его надежности.

Научность - это обоснованность теста фундаментальными исследованиями, его концептуальная осмысленность. Особенно необходимо научное обоснование при обращении к батарее тестов - серии испытаний, призванных оценить комплекс качеств человека, свидетельствующий о его профессиональной пригодноста и ожидаемых трудовых успехах, - широко применяемой при отборе персонала.

Масштабность использования процедуры тестирования в управлении персоналом объясняется, на наш взгляд, целым рядом ее достоинств:
♦ объективностью оценки (итоги тестирования практически не зависят от субъективного подхода тестирующего; к тому же они могут быть оценены не только качественно, но и количественно);
♦ оперативностью оценки (сама процедура тестирования занимает сравнительно немного времени, в то же время с ее помощью можно в короткий срок собрать требующуюся информацию о большом количестве людей);
♦ простотой и доступностью тестирования (в управлении персоналом используются стандартизированные тесты, которые содержат описание процедуры их проведения и оценки результатов; после профессиональной апробации ими может пользоваться широкий круг руководителей, а также сотрудников служб персонала);
♦ пригодностью результатов тестирования для компьютерной обработки и использования статистических методов оценки;
♦ большими эвристическими оценочными возможностями;
♦ конкретностью и непосредственной практической направленностью (тесты позволяют получить сведения об определенных свойствах личности и ее поведении, а не о человеке вообще).

В то же время, как и любые другие инструменты кадрового менеджмента, метод тестирования имеет свои ограничения и тонкости, которые необходимо знать в процессе его применения:
♦ существует серьезная проблема установления однозначной причинно-следственной связи между выявляемыми вопросами (заданиями) тестов и качествами личности, определяющими ее профессиональный успех: при разработке тестов далеко не всегда удается однозначно «перевести» тестовые задания (индикаторы черт) в конкретные качества личности, а последние - в факторы трудовых достижений;
♦ результаты тестов обычно оценивают лишь актуальные, т.е. существующие в данный момент, качества; в то же время большинство характеристик личности и ее поведения подвержены изменениям, порой достаточно динамичным;
♦ квалифицированное использование тестов требует соответствующей психодиагностической и этической подготовки тестирующего;
♦ применение тестов может вызывать у испытуемых страх, искажающий результаты тестирования;
♦ публичное объявление результатов тестирования может задевать чувство собственного достоинства аутсайдеров, компрометировать их в глазах окружающих и тем самым осложнять отношения в коллективе.

Существует строго математизированная, экспериментальная наука - тестология, мало известная в нашей стране, которая позволяет вполне однозначно установить, какой тест можно считать хорошим, а какой - плохим. В развитых странах все профессиональные и психологические тесты проходят сертификацию - неависимую экспертизу. В некоторых случаях проводящие специалисты объединены в национальную психологическую ассоциацию, в других - в специализированную тестологическую ассоциацию. К сожалению, в России подобная практика находится пока в зачаточном состоянии.

Тесты могут быть полезными только при условии их грамотного применения подготовленными к этому специалистами. Избегать проблем и получать объективные результаты помогают общие правила тестирования, к которым относятся следующие:
♦ любое сложное тестирование должно проводиться при участии специалиста по психодиагностике или при последующем его участии в качестве консультанта;
♦ человека нельзя подвергать психологическому обследованию обманным путем или против его воли, недопустимы никакие формы прямого или косвенного принуждения;
♦ перед проведением тестирования испытуемого необходимо предупредить о том, что в ходе исследования он невольно может сообщить такую информацию о себе, своих мыслях и чувствах, которую не осознает сам;
♦ любой человек (за исключением случаев, оговоренных за коном) имеет право знать результаты своего тестирования; итоговые данные в доступной для понимания форме предоставляет испытуемым тот, кто проводил обследование; ознакомление с результатами тестирования должно исключать их неправильное толкование или появление у испытуемых каких-либо опасений;
♦ результаты тестирования не должны травмировать исследуемого или снижать его самооценку, поэтому их следует сообщать в ободряющей форме, по возможности сопровождая конструктивными рекомендациями;
♦ испытуемый должен быть информирован о целях тестироввания и формах использования его результатов;
♦ тестирующий должен обеспечить беспристрастный подход к процедуре и результатам исследования;
♦ информация о результатах тестирования должна предоставляться только тем, кому она предназначается; тестирующий обязан обеспечить конфиденциальность психодиагностической информации, полученной от испытуемого на основе «личного доверия» или в социометрических тестах.

Помимо вышеперечисленных правил, обеспечивающих эффективность процедуры тестирования, особые требования предъявляются и к тестирующему. Общеизвестно, что эффективность тестирования во многом зависит не только от соответствующих знаний, но и от личностных качеств проводящего его человека. Важными для профессионального тестирования качествами являются: общительность и коммуникабельность; динамичность и гибкость поведения; эмоциональная сдержанность и терпимость; профессиональный такт (основой которого являются прежде всего соблюдение профессиональной тайны и деликатность); умение держать свою линию поведения; эмпатия (т.е. готовность и способность проникнуться чувствами и переживаниями других людей и тем самым эмоционально понять их); умение привлекать других людей к активному сотрудничеству, совместному анализу и решению проблем, а также конфликтологическая грамотность. В процессе подготовки и проведения тестирования можно выделить четыре основных этапа, учет особенностей которых во многом определяет успех использования этого метода:
♦ выбор тестовых методик (ознакомление с методиками и их проверка на предмет соответствия целям исследования и удобности применения);
♦ инструктирование испытуемых (разъяснение им целей и задач тестирования, порядка выполнения тестовых заданий и поведения во время их выполнения);
♦ контроль за выполнением заданий;
♦ интерпретация результатов и подведение итогов тестирования.

Еще одним непременным условием эффективности тестирования является учет особенностей различных типов тестов. По предмету исследования можно выделить три класса тестов: а) общеличностные, с помощью которых фиксируют некоторую целостность психических свойств личности (одно из направлений современной психологии личности - дифференциальная психология - целиком опирается на использование приемов психодиагностики); б) личностные - специальные тесты, предназначенные для диагностики той или иной особой черты, характеристики, свойства субъекта (например, творческих способностей, уровня общей ответственности, самоконтроля и т.п.); в) групповые, предназначенные для диагностики групповых психических процессов - уровня сплоченности групп и коллективов, особенностей группового психологического климата, межличностного восприятия, силы нормативного «давления» группы на ее членов и др.

Общие особенности психологических тестов определяются предметом изучения и спецификой применяемой техники. С точки зрения технических приемов обычно выделяют четыре разновидности тестов: а) так называемые объективные, преимущественно аппаратурные, часто психофизиологические испытания (на пример, измерение кожно-гальванического рефлекса, служащее индикатором эмоционального состояния); б) опросные методики или субъективные тесты, как, например, общеличностные тесты Г. Айзенка и Р. Кеттела (эти тесты состоят из серии взаимоконтролирующих суждений о различных проявлениях личностных черт с предложением испытуемому фиксировать наличие или отсутствие данного свойства, черты, особенности поведения); в) тес ты «с карандашом и бумагой», например, для диагностики внимания - вычеркивание определенных букв в тексте («корректорский тест» - см. приложение 1) или вычерчивание оптимального вы хода из лабиринта (оценка некоторых свойств интеллекта) и т.д.; г) тесты, основанные на экспертной оценке поведенческих проявлений испытуемых, например активно использовавшаяся советски ми психологами методика «ГОЛ» - групповой оценки личности.