Оценивание тестовых заданий разных типов и определение их уровня сложности
В статье описывается технология оценивания тестовых заданий, а также распределение заданий разных типов по уровням сложности на основе результатов предварительного тестирования. При распределении тестовых заданий по уровням сложности предлагается использовать интегрированную функциональную модель...
Gespeichert in:
| Datum: | 2009 |
|---|---|
| Hauptverfasser: | , , , , |
| Format: | Artikel |
| Sprache: | Russian |
| Veröffentlicht: |
Інститут проблем штучного інтелекту МОН України та НАН України
2009
|
| Schlagworte: | |
| Online Zugang: | https://nasplib.isofts.kiev.ua/handle/123456789/8190 |
| Tags: |
Tag hinzufügen
Keine Tags, Fügen Sie den ersten Tag hinzu!
|
| Назва журналу: | Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| Zitieren: | Оценивание тестовых заданий разных типов и определение их уровня сложности / М.Ф. Бондаренко, В.В. Семенец, Н.В. Белоус, И.В. Куцевич, И.А. Белоус // Штучний інтелект. — 2009. — № 4. — С. 322-329. — Бібліогр.: 7 назв. — рос. |
Institution
Digital Library of Periodicals of National Academy of Sciences of Ukraine| id |
nasplib_isofts_kiev_ua-123456789-8190 |
|---|---|
| record_format |
dspace |
| spelling |
nasplib_isofts_kiev_ua-123456789-81902025-02-09T21:46:10Z Оценивание тестовых заданий разных типов и определение их уровня сложности Оцінювання тестових завдань різних типів та визначення їх рівня складності Бондаренко, М.Ф. Семенец, В.В. Белоус, Н.В. Куцевич, И.В. Белоус, И.А. Обучающие и экспертные системы В статье описывается технология оценивания тестовых заданий, а также распределение заданий разных типов по уровням сложности на основе результатов предварительного тестирования. При распределении тестовых заданий по уровням сложности предлагается использовать интегрированную функциональную модель, позволяющую применять разные способы распределения тестовых заданий, включенных в тест, в зависимости от их типов. У статті розглядається технологія оцінювання тестових завдань, а також розподілення завдань різних типів за рівнями складності на основі результатів попереднього тестування. При розподіленні тестових завдань за рівнями складності запропоновано використовувати інтегровану функціональну модель, яка дозволяє використовувати різноманітні способи розподілення тестових завдань, які було включено до тесту, залежно від їх типів. The paper is devoted to the test items marking technology and distribution of different types items on complexity levels on the basis of preliminary testing results. At distribution of test items on complexity levels it is offered to use the integrated functional model which allows to apply different ways of the test items distribution included in the test. 2009 Article Оценивание тестовых заданий разных типов и определение их уровня сложности / М.Ф. Бондаренко, В.В. Семенец, Н.В. Белоус, И.В. Куцевич, И.А. Белоус // Штучний інтелект. — 2009. — № 4. — С. 322-329. — Бібліогр.: 7 назв. — рос. 1561-5359 https://nasplib.isofts.kiev.ua/handle/123456789/8190 519.854:004.8 ru application/pdf Інститут проблем штучного інтелекту МОН України та НАН України |
| institution |
Digital Library of Periodicals of National Academy of Sciences of Ukraine |
| collection |
DSpace DC |
| language |
Russian |
| topic |
Обучающие и экспертные системы Обучающие и экспертные системы |
| spellingShingle |
Обучающие и экспертные системы Обучающие и экспертные системы Бондаренко, М.Ф. Семенец, В.В. Белоус, Н.В. Куцевич, И.В. Белоус, И.А. Оценивание тестовых заданий разных типов и определение их уровня сложности |
| description |
В статье описывается технология оценивания тестовых заданий, а также распределение заданий разных
типов по уровням сложности на основе результатов предварительного тестирования. При распределении
тестовых заданий по уровням сложности предлагается использовать интегрированную функциональную
модель, позволяющую применять разные способы распределения тестовых заданий, включенных в
тест, в зависимости от их типов. |
| format |
Article |
| author |
Бондаренко, М.Ф. Семенец, В.В. Белоус, Н.В. Куцевич, И.В. Белоус, И.А. |
| author_facet |
Бондаренко, М.Ф. Семенец, В.В. Белоус, Н.В. Куцевич, И.В. Белоус, И.А. |
| author_sort |
Бондаренко, М.Ф. |
| title |
Оценивание тестовых заданий разных типов и определение их уровня сложности |
| title_short |
Оценивание тестовых заданий разных типов и определение их уровня сложности |
| title_full |
Оценивание тестовых заданий разных типов и определение их уровня сложности |
| title_fullStr |
Оценивание тестовых заданий разных типов и определение их уровня сложности |
| title_full_unstemmed |
Оценивание тестовых заданий разных типов и определение их уровня сложности |
| title_sort |
оценивание тестовых заданий разных типов и определение их уровня сложности |
| publisher |
Інститут проблем штучного інтелекту МОН України та НАН України |
| publishDate |
2009 |
| topic_facet |
Обучающие и экспертные системы |
| url |
https://nasplib.isofts.kiev.ua/handle/123456789/8190 |
| citation_txt |
Оценивание тестовых заданий разных типов и определение их уровня сложности / М.Ф. Бондаренко, В.В. Семенец, Н.В. Белоус, И.В. Куцевич, И.А. Белоус // Штучний інтелект. — 2009. — № 4. — С. 322-329. — Бібліогр.: 7 назв. — рос. |
| work_keys_str_mv |
AT bondarenkomf ocenivanietestovyhzadaniiraznyhtipoviopredelenieihurovnâsložnosti AT semenecvv ocenivanietestovyhzadaniiraznyhtipoviopredelenieihurovnâsložnosti AT belousnv ocenivanietestovyhzadaniiraznyhtipoviopredelenieihurovnâsložnosti AT kucevičiv ocenivanietestovyhzadaniiraznyhtipoviopredelenieihurovnâsložnosti AT belousia ocenivanietestovyhzadaniiraznyhtipoviopredelenieihurovnâsložnosti AT bondarenkomf ocínûvannâtestovihzavdanʹríznihtipívtaviznačennâíhrívnâskladností AT semenecvv ocínûvannâtestovihzavdanʹríznihtipívtaviznačennâíhrívnâskladností AT belousnv ocínûvannâtestovihzavdanʹríznihtipívtaviznačennâíhrívnâskladností AT kucevičiv ocínûvannâtestovihzavdanʹríznihtipívtaviznačennâíhrívnâskladností AT belousia ocínûvannâtestovihzavdanʹríznihtipívtaviznačennâíhrívnâskladností |
| first_indexed |
2025-12-01T03:58:37Z |
| last_indexed |
2025-12-01T03:58:37Z |
| _version_ |
1850276862304976896 |
| fulltext |
«Искусственный интеллект» 4’2009 322
7Б
УДК 519.854:004.8
М.Ф. Бондаренко, В.В. Семенец, Н.В. Белоус, И.В. Куцевич, И.А. Белоус
Харьковский национальный университет радиоэлектроники, г. Харьков, Украина
belous@kture.kharkov.ua
Оценивание тестовых заданий разных типов
и определение их уровня сложности
В статье описывается технология оценивания тестовых заданий, а также распределение заданий разных
типов по уровням сложности на основе результатов предварительного тестирования. При распределении
тестовых заданий по уровням сложности предлагается использовать интегрированную функциональную
модель, позволяющую применять разные способы распределения тестовых заданий, включенных в
тест, в зависимости от их типов.
Введение
Контроль знаний является важной частью процесса обучения и позволяет полу-
чить всестороннюю оценку уровня знаний обучаемых. Одной из хорошо зарекомендо-
вавших себя повсеместно форм контроля знаний является тестирование. Тестирование,
несмотря на множество определенных недостатков, является в принципе единственным
по-настоящему технологическим средством для измерения уровня знаний и незаменимо
как инструмент, позволяющий реализовать эффективный педагогический контроль и
должным образом организовать управление учебным процессом.
Одним из сложных и противоречивых вопросов при проведении тестирования
является проблема оценивания знаний. Самым распространенным способом решения
данной проблемы является использование дихотомической системы оценивания тес-
товых заданий, в которой за каждое задание можно получить 0 или 1 балл. Данная
система удобна при оценивании заданий с выбором одного правильного ответа из
многих, т.е. заданий закрытого типа. В то же время существует определенное много-
образие типов тестовых заданий: закрытые (многоальтернативные и одноальтернатив-
ные), открытые, на установление соответствия между элементами, на установление
правильной последовательности, ситуационные тестовые задания [1]. Для оценивания
заданий разных типов применение дихотомической системы недостаточно, т.к. обу-
чаемый может дать неполный или частично правильный ответ, что в предложенной
системе недостаточно точно оценивается как неправильный ответ. Для эффективного
решения данной проблемы необходимо использовать политомическую систему оце-
нивания, в которой допускается несколько категорий ответа на задание, каждая из
которых оценивается по-разному. Например, за полностью верный ответ назначается
2 балла, за частично верный – 1 балл и за неверный – 0 баллов. Недостатком этой сис-
темы является сложность вычисления общего результата на основе баллов, получен-
ных за задания. Кроме того, в этом случае не учитываются неправильно выбранные
варианты ответа. Простое суммирование баллов не соответствует истинному уровню
знаний обучаемых. Для решения данной проблемы авторами предлагается введение
непрерывной системы оценивания знаний на интервале от 0 до 1 и специализированные
технологии определения оценок за выполнение каждого из типов тестовых заданий [2].
Оценивание тестовых заданий разных типов и определение их уровня сложности
«Штучний інтелект» 4’2009 323
7Б
Предварительные исследования в области построения системы контроля зна-
ний показали необходимость разделения заданий на уровни сложности. Отсутствие
разделения заданий на уровни сложности приводит к недостаточной объективности
оценивания знаний и часто не коррелируется с истинным уровнем знаний обучаемых [3].
Так, если сильному студенту попадаются только сложные задания, а слабому – только
легкие, то в результате оценивания у обоих студентов будет одинаковый уровень зна-
ний, что не соответствует действительности. И наоборот, если студентам с одинаковым
уровнем знаний попадутся задания разного уровня сложности, то проверка знаний
выявит у них разный уровень подготовленности, что не является объективным. Рас-
пределение заданий по уровням сложности преподавателем вносит субъективизм в
процесс оценивания знаний обучаемых по причине того, что не всякое легкое задание
для преподавателя является столь же легким и для студентов. Таким образом, разра-
ботка технологии распределения тестовых заданий по уровням сложности является
актуальной.
Целью работы является разработка технологии проведения тестирования и рас-
пределения тестовых заданий по уровням сложности для тестов, оцениваемых по не-
прерывной системе оценивания знаний, частным случаем которой является дихотоми-
ческая система. Для этого авторами предложена методика оценивания тестовых заданий
разных форм. Для распределения тестовых заданий по уровням сложности авторами
разработана функциональная интегрированная модель современной теории тестов, ко-
торая по результатам проведения предварительного контроля знаний определяет способ
вычисления уровня сложности тестовых заданий и, после приведения результирующих
уровней сложности к единой шкале, выдает устойчивые значения уровней сложности
заданий, включенных в тест.
1. Технология оценивания тестовых заданий
разных типов
Для создания теста необходимо включать в него задания разных типов. Авторами
предлагается при построении теста использовать следующие типы тестовых заданий:
закрытого типа (многоальтернативные и одноальтернативные), на установление соот-
ветствия, на установление последовательности, открытого типа (введение термина,
заполнение таблиц, введение арифметического выражения), ситуационных (авторами
предлагается здесь ввести понятие многошагового теста). Для объективной оценки
тестовых заданий разных типов предлагается использовать для каждого из них свой
специализированный подход для расчета оценки. Введем для определения оценки от-
ветов на задания разных типов коэффициент оценивания ri.
1.1. Одноальтернативные тестовые задания
Для оценивания одноальтернативного тестового задания достаточно применения
дихотомической системы оценивания, где ir = 1 соответствует правильному ответу,
ir = 0 – неправильному.
1.2. Многоальтернативные тестовые задания
При оценивании многоальтернативных заданий дихотомической системы недо-
статочно, потому что обучаемый может дать как неполный ответ, так и один из выб-
ранных вариантов ответа будет неточен. В данном случае необходимо учитывать не
Бондаренко М.Ф., Семенец В.В., Белоус Н.В., Куцевич И.В., Белоус И.А.
«Искусственный интеллект» 4’2009 324
7Б
только правильность ответа на задание в целом, но и количество допущенных оши-
бок. В данном случае коэффициент ir предлагается рассчитывать по формуле (1).
)( 31
2
ii
s
QQ
Q
ri
, (1)
где Q1 – множество всех правильных вариантов ответа в задании,
Q2 – количество правильных вариантов ответа, выбранных обучаемым,
Q3 – количество неправильных вариантов ответа обучаемого.
1.3. Задания на установление соответствия
При ответе на задание на установление соответствия каждую пару ответов можно
рассматривать как отдельный вариант ответа и при определении результата следует
учитывать, сколько пар было выбрано верно. Коэффициент ri для этого типа заданий
рассчитывается по формуле (2).
i
i
Q
Q
ri
1
2 , (2)
где Q1 – количество пар для сопоставления,
Q2 – количество верно составленных пар.
1.4. Задания на установление последовательности
При оценивании заданий на установление правильной последовательности возмо-
жен только один заведомо правильных ответ. Для оценивания данного типа тестовых
заданий достаточно использовать дихотомическую шкалу оценивания, коэффициент ir
принимает значение 0 или 1.
1.5. Открытые тестовые задания
При оценивании заданий на введение термина и на введение арифметического
выражения достаточно использовать дихотомическую шкалу оценивания, коэффициент
ir принимает значение 0 или 1. При выполнении заданий на заполнение таблиц каждая
ячейка таблицы является отдельным вариантом ответа. Если одна из ячеек заполнена
неправильно, такой ответ нельзя засчитывать как полностью неправильный (введение
одного неверного значения в ячейку может быть механической ошибкой, и поэтому
оно должно не полностью обнулить результат выполнения работы, а лишь снизить
результат выполнения задания). Для определения коэффициента оценивания заданий
на заполнение таблиц рекомендуется использовать показательную функциональную
зависимость:
,12 1
2
i
i
Q
Q
ir (3)
где Q1 – количество ячеек, которые предлагается заполнить обучаемому,
Q2 – количество ячеек, которое обучаемый заполнил правильно.
1.6. Многошаговые тестовые задания
Многошаговые тестовые задания состоят из набора заданий (набора шагов), ре-
шаемых последовательно, когда переход к следующему шагу задания осуществляется
только после правильного ответа на предыдущий шаг. Это дает возможность обучае-
Оценивание тестовых заданий разных типов и определение их уровня сложности
«Штучний інтелект» 4’2009 325
7Б
мому анализировать не только задание в целом, но и разбираться в каждой состав-
ляющей задания. Благодаря этому обучаемый сразу может увидеть, где им допущена
ошибка и в дальнейших шагах получить правильные исходные данные, т.е. ошибки в
заданиях не будут накапливаться. Многошаговое задание считается пройденным, если
на каждом его шаге получен правильный ответ. Для объективного оценивания ответа
и глубины знаний обучаемого используется счетчик допускаемых ошибок, количест-
во которых учитывается при выставлении оценки. Кроме того, необходимо решить
проблему оценивания таких вопросов. Рекомендуемая формула для вычисления коэф-
фициента правильности для многошагового тестового задания имеет вид :
,
1
1
1
n
m
r
n
i i
i
(4)
где i – номер шага,
mi – количество ошибок, допущенных на i-м шаге,
n – количество шагов.
Формула (4) справедлива для многошаговых тестовых заданий, в которых на
каждом шаге используются одноальтернативные задания или задания на установ-
ление правильной последовательности. В случае использования на каком-либо из
шагов тестового задания на соответствие или многоальтернативного тестового зада-
ния целесообразно использовать формулы (5) и (6) соответственно.
),1(1
1 1 2
1
n
i
m
ji
i
i
ji
ji
Q
Q
mn
r (5)
где j – номер попытки прохождения шага, если на нем была допущена ошибка,
ji
Q2 – количество пар для составления на i-м шаге при j-й попытке;
ji
Q1 – количество верно составленных пар на i-м шаге при j-й попытке.
,
)(
1
1
1
31
2
n
i
m
j
i
i i
jiji
i
QQ
Qm
n
r (6)
где
ji
Q1 – количество правильных вариантов ответов на i-м на шаге при j попытке;
i
Q2 – количество правильных ответов, выбранных тестируемым на i-м шаге;
ji
Q3 – количество неправильных ответов, выбранных тестируемым на i-м шаге при
j-й попытке.
2. Технология определения результата выполнения теста
В каждой стране для оценивания уровня знаний обучаемых применяется своя, а
иногда и несколько шкал оценивания знаний. Так, в Украине применяются 4 различ-
ных шкалы оценивания знаний: 100-балльная (рейтинговая), ECTS, 12-балльная и нацио-
нальная (4-балльная) шкала. Для получения результата в заданной шкале оценивания
знаний введем специальный параметр В – балльность системы в виде максимального
значения единицы измерения оценки в рассматриваемой шкале. Рассмотрим алгоритм
перевода результата тестирования в произвольную шкалу оценивания знаний. Для кор-
ректного перевода результата в любую систему оценивания знаний необходимо всем
значимым результатам оценивания в порядке возрастания поочередно присвоить коэф-
фициенты балльности, начиная с 1. Максимальное значение коэффициента балльности
Бондаренко М.Ф., Семенец В.В., Белоус Н.В., Куцевич И.В., Белоус И.А.
«Искусственный интеллект» 4’2009 326
7Б
и будет соответствовать значению параметра В. Для некоторых систем оценивания зна-
ний целесообразно применение интервальной системы перевода результата, в которой в
зависимости от процента выполнения работы выставляется оценка.
При оценивании теста, содержащего несколько уровней сложности, каждому из
заданий присваивается уровень сложности zi ( Zzi ,1 ). Итоговая оценка выполнения
всего теста R, состоящего из набора тестовых заданий, содержащего Z уровней слож-
ности, определяется по формуле:
,
1
N
ii
i
zr
Z
BR (7)
где B – балльность системы,
N – количество тестовых заданий, включенных в тест,
iz – уровень сложности i-го задания,
Z – суммарная сложность теста.
Параметр
Z является накопительным и определяется по формуле:
.
1
N
i
izZ (8)
3. Технология распределения тестовых заданий
разных типов по уровням сложности
Для распределения тестовых заданий по уровням сложности авторами предла-
гается модификация современной теории тестирования IRT. Модификация IRT зак-
лючается в следующем:
– в классическом случае IRT предлагается для вычисления уровня знаний обучае-
мых. Авторами предлагается применение IRT для определения уровней сложности
тестовых заданий;
– модели IRT рассматриваются для случая применения только дихотомической си-
стемы оценивания тестовых заданий. Авторами предлагается использование данных
моделей для непрерывной системы оценивания знаний, частным случаем которой яв-
ляется дихотомическая;
– предлагается рассматривать одно-, двух- и трехпараметрические модели не в от-
дельности, а в совокупности, в зависимости от типа тестовых заданий.
Задача распределения тестовых заданий по уровням сложности сводится к опре-
делению сложности тестовых заданий с использованием модифицированной современной
теории тестирования IRT, исходя из экспериментальных данных предварительного
тестирования.
Недостатком современной теории тестирования IRT является наличие трех мо-
делей, каждая из которых в отдельности применима для тестовых заданий определенного
типа. При попытке применения модели к разным типам тестовых заданий уменьша-
ется точность вычисления параметров.
Для определения уровня сложности тестовых заданий авторами предлагается ин-
тегрированная функциональная модель (рис. 1), рассчитанная на оценивание тестовых
заданий по непрерывной шкале оценивания знаний, включающей тестовые задания
разных типов:
)),,res,c,a(И),P,res,a(И),P,res(Иf(Pв ijjjijijjijijijj 321 (9)
Оценивание тестовых заданий разных типов и определение их уровня сложности
«Штучний інтелект» 4’2009 327
7Б
где j – параметр, определяющий сложность j-го тестового задания,
),res,c,a(И),P,res,a(И),P,res(ИP ijjjijijjijijij 321 – модифицированные одно-, двух- и трех-
параметрические модели, построенные по непрерывной системе,
i – параметр, определяющий уровень знаний i-го обучаемого,
resij – переменная, которая соответствует результату выполнения тестового зада-
ния и принимающая значения на интервале от 0 до 1, что соответствует непрерывной
шкале оценивания знаний,
aj – параметр характеристики дифференцирующей способности задания,
cj – параметр, характеризующий возможность правильного ответа на j-е задание
в том случае, если этот ответ угадан.
Достоинством и новизной интегрированной функциональной модели является
ее возможность одновременно анализировать тестовые задания всех рассматриваемых
выше типов. Технология использования интегрированной функциональной модели за-
ключается в следующем. Тестовое задание Ti, которое подается на вход модели, сначала
поступает на блок анализатора типа заданий. Затем, в зависимости от выделенного
анализатором типа, задание подается на соответствующий блок определителя резуль-
тата выполнения тестового задания, где рассчитываются оценки за ответы resj, а для
тестовых заданий закрытого типа дополнительно вычисляется вероятность угадыва-
ния правильного ответа cj.
Рисунок 1 – Интегрированная функциональная модель распределения тестовых
заданий по уровням сложности
В блоке «Статистика» проводится сбор статистических данных по результатам
тестирования знаний обучаемых. После проведения предварительного тестирования
группы обучаемых в блоке вычисляется начальный уровень их знаний 0
iИ , начальный
уровень сложности тестовых заданий 0
j и рассчитывается дифференцирующая способ-
ность тестовых заданий [4]:
,
)(r
)(r
a,
q
p
в,
q
pИ
jb
jb
j
j
j
j
i
i
i 2
00
1
lnln
(10)
где pi – доля правильных ответов, полученных от i-го студента,
qi – доля неправильных ответов, полученных от i-го студента,
pj – доля правильных ответов, полученных за выполнение j-го задания,
Бондаренко М.Ф., Семенец В.В., Белоус Н.В., Куцевич И.В., Белоус И.А.
«Искусственный интеллект» 4’2009 328
7Б
qj – доля неправильных ответов, полученных за выполнение j-го задания,
rb – бисериальный коэффициент корреляции.
Далее данные передаются в блок «Вычислитель устойчивых значений», где
производится распределение заданий по уровням сложности на основе латентного
анализа. После поступления данных в блок «Вычислитель устойчивых значений» про-
изводится распределение ответов на тестовые задания и начальных значений пара-
метров для уровней сложности по трем компонентам (P1, P2, P3) в зависимости от
типа задания.
Первый компонент P1 «1-параметрическая модель» применяется для проверки приз-
нака гомогенности уровня сложности тестовых заданий относительно гомогенной
группы испытуемых. Группа испытуемых является гомогенной, если большинство зна-
чений расположено на небольшом интервале оси латентной переменной . Гомогенный
тест представляет собой систему заданий возрастающей трудности, специфической
формы и определенного содержания, создаваемую с целью применения объективного,
качественного и эффективного метода оценки структуры и измерения уровня подго-
товленности обучаемых по одной учебной дисциплине. В случае гетерогенной по зна-
ниям выборки испытуемых значения параметра трудности должны охватывать больший
интервал оси , а характеристические кривые заданий могут быть расположены до-
вольно далеко друг от друга. Проверка этого условия и реализована в компоненте P1
«1-параметрическая модель».
Для повышения точности измерения уровня сложности тестовых заданий вводит-
ся параметр характеристики дифференцирующей способности задания аj, который
связан с крутизной кривой задания в точке ее перегиба. При значениях аj, близких к
нулю, тестовые задания утрачивают функцию разделения обучаемых по уровням слож-
ности, что делает их бесполезными при дифференциации по уровню сложности. Число
заданий в тесте должно сокращаться в первую очередь за счет удаления таких зада-
ний, что приводит к повышению надежности и валидности теста. Таким образом, для
определения уровня сложности j тестовых заданий разных типов, за исключением
закрытого, служит компонент P2 «2-параметрическая модель».
Для тестов с заданиями закрытого типа отмечается существенное отклонение
эмпирических данных от теоретической кривой, предсказывающей вероятность пра-
вильного выполнения задания при различных значениях переменной . Для решения
этой проблемы вводится параметр cj, который характеризует возможность правиль-
ного ответа на задание j в случае, если ответ угадан. Оценки resj за задания закрытого
типа передаются в третий компонент P3 «3-параметрическая модель» блока «Вычис-
литель устойчивых значений».
Для определения устойчивых значений уровней сложности тестовых заданий при-
меняется метод наибольшего правдоподобия Фишера [5], адаптированный к оценива-
нию знаний обучаемых по непрерывной системе:
,ijres
ijQijres
ijP
n
j
П}i|Иix{iL
1
1
(11)
где Li – вероятностная модель выполнения тестовых заданий для i-го обучаемого;
}in,...,xi,xi{xix 21 – вектор, характеризующий результат выполнения i-м обучае-
мым n заданий теста,
Pij – вероятность правильного выполнения i-м испытуемым j-го задания теста,
Qij – вероятность неправильного выполнения i-м испытуемым j-го задания, Qij = 1 – Pij.
Таким образом, выходными параметрами интегрированной функциональной мо-
дели является набор параметров j, которые соответствуют устойчивым оценкам уров-
Оценивание тестовых заданий разных типов и определение их уровня сложности
«Штучний інтелект» 4’2009 329
7Б
ня сложности тестовых заданий и могут использоваться в тестах, включающих задания
нескольких уровней сложности как параметр сложности заданий.
Выводы
Предлагаемая технология реализована программно. Данная технология программно
реализована и содержит 2 основных подсистемы:
– модуль проведения контроля знаний, который поддерживает Международный стан-
дарт обмена тестовой информацией [6], сертифицирован [7] и проходит внедрение в
высших учебных заведениях Украины;
– модуль распределения тестовых заданий по уровням сложности, который может
применяться как при работе с авторским программным комплексом проведения кон-
троля знаний, так и с данными, полученными из внешних систем автоматизированного
тестирования. Это делает разработанную систему универсальной.
Соответствующая программная система прошла апробацию на достоверной вы-
борке (более 100 обучаемых).
Внедрение предлагаемой системы в высших учебных заведениях позволит про-
водить объективное тестирование знаний обучаемых. Применима как в учебных заве-
дениях любого уровня аккредитации, так и в организациях и учреждениях, где проводит-
ся профессиональный отбор с помощью тестирования, а также на курсах повышения
квалификации, где имеются компьютерные классы.
Литература
1. Комплекс нормативних документів для розробки складових системи стандартів вищої освіти. – Київ, 1998.
2. Belous N. Lifelong education conception using computer testing / N. Belous, I. Voytovich // Материалы
VIII Международной конференции Украинской ассоциации дистанционного образования «Образование
и виртуальность». – 2004. – С. 307-313.
3. Аванесов В.С. Трудность теста и тестовых заданий / В.С. Аванесов // Управление школой. – 1999. – № 40.
4. Baker F.B. The Basics of Item Response Theory. / Baker F.B. – [2 ed.]– Hieneman, Portsmouth, New Hemp-
shire, 2001. – 174 p.
5. Guilford J.P. Fundamental Statistics in Psychology and Education / Guilford J.P. – N-Y. : McGraw – H.U., 1956.
6. IMS Question & Test Interoperability Specification. [Electronic resource] / IMS Global Learning Consortium:
IMS Question & Test Interoperability Specification. – Режим доступа :
http://www.imsglobal.org/question/ index.cfm – 15.09.2008 г. – The title from the screen.
7. Белоус Н.В. Программный комплекс для проведения компьютерного и интерактивного обучения и
тестирования знаний «КОДЭКС УМА» / Н.В. Белоус, И.В. Войтович // Свидетельство про регистрацию
авторского права № 14030 / Государственный департамент интеллектуальной собственности, 02.09.2005.
М.Ф. Бондаренко, В.В. Семенець, Н.В. Білоус, І.В. Куцевич, І.А. Білоус
Оцінювання тестових завдань різних типів та визначення їх рівня складності
У статті розглядається технологія оцінювання тестових завдань, а також розподілення завдань різних типів
за рівнями складності на основі результатів попереднього тестування. При розподіленні тестових завдань
за рівнями складності запропоновано використовувати інтегровану функціональну модель, яка дозволяє
використовувати різноманітні способи розподілення тестових завдань, які було включено до тесту,
залежно від їх типів.
M.F. Bondarenko, V.V. Semenets, N.V. Bilous, I.V. Kutsevich, I.А. Bilous
Test Tasks Estimation of Different Types and Definition of their Level of Complexity
The paper is devoted to the test items marking technology and distribution of different types items on complexity
levels on the basis of preliminary testing results. At distribution of test items on complexity levels it is offered to
use the integrated functional model which allows to apply different ways of the test items distribution included in
the test.
Статья поступила в редакцию 06.07.2009.
|