Семинар «Цвет, математика и искусственный интеллект»
Тема: Как видят цвет мультимодальные большие языковые нейронные сети?
Докладчик: Лобарев Георгий Романович, стажер - исследователь ИППИ РАН
Аннотация: Современные мультимодальные модели — такие как Qwen-VL, LLaVA или GPT — объединяют язык и зрение, чтобы «понимать» мир ближе к человеку. Но насколько это понимание действительно перцептивно? Особенно в такой тонкой области, как цвет: ведь для человека он — не RGB-код, более абстрактное ощущение, зависящее от контекста, освещения и даже эмоций.
На семинаре мы поговорим о том, как устроено цветовое пространство внутри MLLM и сравним его с психофизическим пространством человека: извлекаются ли визуальные энкодеры (ViT) достаточно точные представления? И главное — вносит ли языковой блок (LLM) коррекцию, приближающую восприятие модели к человеческому? Мы представим результаты анализа эмбеддингов Qwen-VL на основе классических психофизических данных — шкалы Манселла действительно ли «язык помогает видеть».
Когда: четверг, 23 октября 2025 г., 17:00
Где: 615 ауд. ИППИ РАН
Ссылка для подключения онлайн: https://telemost.yandex.ru/j/63389006341822
22.10.2025 | Плющай Татьяна Николаевна |