Оставьте свои данные
и мы вам перезвоним:
Или свяжитесь с нами сами, если не хотите ждать:
Материал подготовлен по следам профессиональной презентации ИЦЭО (Израильского центра экзаменов и оценки, на иврите: המרכז הארצי לבחינות ולהערכה) о переходе экзамена Яэль на компьютеризированную модель ЯэльНет и о переводе оценок из IRT-модели в многолетнюю шкалу баллов.
Когда экзамен переводят в компьютерный формат, меняется не только интерфейс, но и логика построения вариантов, оценки результатов и сравнения баллов с предыдущими годами.
Именно этому посвящено исследование ИЦЭО по экзамену Яэль / ЯэльНет: как перейти к современной модели оценивания (IRT), но при этом сохранить понятную и справедливую шкалу, с которой университеты уже умеют работать.
Экзамен Яэль предназначен для проверки знания иврита у абитуриентов, которые сдавали психометрический экзамен не на иврите.
Для поступления в вуз обычно требуется пройти определенный порог по этому экзамену, который устанавливает учебное заведение.
В презентации описан переход от классической модели (бумажный линейный тест) к компьютеризированной версии ЯэльНет и ключевая психометрическая задача:
как сделать так, чтобы новый способ расчета результата был современным и точным, но при этом оставался сопоставимым со старой многолетней шкалой.
В классической модели тестирования результат во многом воспринимается как функция от числа правильных ответов.
В IRT-подходе (Item Response Theory, теория ответа на задание) центральным становится другой показатель оценка скрытой способности, которую в презентации обозначают как Тета (θ).
Это значит, что система учитывает не только количество правильных ответов, но и характер самих заданий:
насколько они трудные, насколько хорошо различают сильных и слабых участников, и какова вероятность случайного угадывания.
IRT (Item Response Theory) — это современная психометрическая модель, которая оценивает вероятность правильного ответа на конкретный вопрос в зависимости от уровня подготовки экзаменуемого.
В исследовании использовалась модель 3PL (трехпараметрическая логистическая модель).
В модели 3PL у каждого задания есть три ключевых параметра:
Хотя официальный экзаменационный скоринг выполняет ИЦЭО по своим психометрическим моделям, для подготовки важно понимать сам принцип:
качество тренировки зависит не только от количества задач, но и от того, какие именно задачи попадают в подборку.
В системе Окей мы тоже используем похожую по идее логику подбора заданий для тренировок и анализа:
не просто «дать много задач подряд», а собирать наборы с учетом типа задания, уровня сложности, повторяемости ошибок и учебной цели.
Что это дает на практике в Окей:
При переходе к компьютерной версии возник естественный риск: если использовать ограниченное число разделов, они будут быстрее «засвечиваться».
Поэтому было принято решение создавать много новых вариантов разделов, которые автоматически собираются из базы существующих заданий.
Для этого сначала были проанализированы и откалиброваны задания прошлых лет, а затем на основе их параметров начали автоматически формировать новые эквивалентные разделы.
Что особенно важно в масштабе проекта:
Даже если IRT дает более точную оценку способности, университетам и абитуриентам все равно нужна привычная шкала, по которой принимаются решения.
В случае Яэль речь идет о многолетней шкале 50-150.
И вот здесь начинается самое важное: перевод из θ в стандартный балл не является тривиальным.
Он не сводится к простой линейной формуле, потому что исторически шкалирование классического экзамена учитывало:
В исследовании использовали очень большой массив данных — записи примерно 340 000 экзаменуемых за последние 13 лет.
Для данных был оценен IRT-модельный параметр θ (по модели 3PL), а затем исследователи сравнили несколько способов преобразования этих значений в шкалу 50-150.
Сравнивались три типа трансформаций:
Для каждого метода дополнительно проверяли варианты с «изломом» (doglegging) и без него.
Критерии сравнения были очень практичными:
В презентации отдельно показано, что еще до шкалирования связь между θ и существующим многолетним баллом очень высокая (корреляция около 0.974).
Это хороший знак, но он не отменяет задачу выбора правильной трансформации: при массовом применении даже небольшая системная разница важна.
Итоговая таблица (главный вывод исследования):
| Метод | Вариант | Корреляция (новая / старая шкала) | Средняя абсолютная ошибка |
|---|---|---|---|
| Стандартные оценки | без doglegging | 0.977 | 4.000 |
| Стандартные оценки | doglegging 5/95 | 0.978 | 4.035 |
| Линейная регрессия | без doglegging | 0.977 | 4.061 |
| Линейная регрессия | doglegging 5/95 | 0.978 | 4.117 |
| Процентили | без doglegging | 0.980 | 3.803 |
| Процентили | doglegging 3/97 | 0.979 | 3.832 |
По двум основным критериям лучший результат дал именно вариант:
перевод по процентилям без дополнительного «излома».
Для абитуриента главный смысл этой работы не в математических терминах, а в следующем:
при смене технологии экзамена ИЦЭО не просто «перерисовали шкалу», а проверили, какой способ пересчета лучше сохраняет смысл старых оценок.
Проще говоря:
Хотя презентация посвящена именно экзамену Яэль / ЯэльНет, для системы поступления в Израиле это показательный кейс.
Он демонстрирует общий принцип работы ИЦЭО при переходе к новым форматам:
сначала психометрическая калибровка, затем проверка сопоставимости, и только потом массовое внедрение новой модели оценивания.
Для студентов и родителей это полезный сигнал:
когда меняется формат экзамена, важно смотреть не только на то, что появилось на экране, но и на то,
как именно будет обеспечена преемственность баллов.
Для нас в Окей эта презентация ИЦЭО важна не только как новость про ЯэльНет, но и как подтверждение подхода, который мы считаем правильным в подготовке:
сильный результат растет там, где есть система, статистика и грамотный подбор задач.
Это хорошо совпадает с тем, как мы строим тренировочный процесс:
анализируем типовые ошибки, смотрим повторяющиеся паттерны, подбираем задания под конкретную задачу ученика и постепенно повышаем уровень сложности.
Что это значит для ученика:
Статья подготовлена Отделом Исследований и Разработок Окей.