Cовместный семинар ИППИ РАН, НИУ ВШЭ и Сколтеха
21 марта (вторник), 1830, аудитория 615 ИППИ РАН
Александр Адуенко (МФТИ)
Название: Выбор мультимоделей в задачах классификации
Аннотация: В работе рассматривается задача выбора мультимоделей при решении задач классификации. Необходимость использования мультимоделей возникает при невыполнении гипотезы простоты выборки, когда важность признаков зависит от их значений, а описание в виде одиночной обобщенно-линейной модели не позволяет это учесть. Мультимодели являются интерпретируемым обобщением случая одиночной модели, однако они могут содержать большое число близких моделей, что ведет к низкому качеству прогноза и потере интерпретируемости. Для решения этой проблемы предложен статистический подход к сравнению моделей и основанные на нем методы прореживания мультимоделей, позволяющие получить адекватную мультимодель, содержащую попарно статистически различимые модели. Для статистического сравнения моделей предложена функция сходства апостериорных распределений параметров моделей. Исследованы свойства предложенной функции сходства, получены результаты об асимптотическом распределении ее значений для совпадающих обобщенно-линейных моделей. На основании этих результатов получены верхняя и нижняя оценки на максимальное число моделей в адекватной мультимодели. Диагональная оценка максимума обоснованности для ковариационной матрицы весов признаков используется для отбора признаков в мультимодели. Доказана асимптотическая вырожденность недиагональной оценки максимума обоснованности для ковариационной матрицы параметров логистической модели. Предложен метод детектирования и учета мультиколлинеарности между признаками путем их комбинирования. Проведены вычислительные эксперименты, подтверждающие значимость улучшения качества классификации на реальных данных, а также существенное сокращение числа моделей в мультимоделях.
18.03.2017 | |