Безопасность
16 декабря 2025 г.

GPT‑5.2 назвали самой ограниченной ИИ‑моделью на рынке после провала в рейтинге Sansa Bench
Новая версия чат-бота GPT‑5.2 от OpenAI после своего релиза оказалась на последней строчке рейтинга Sansa Bench, оценивающего уровень цензуры в коммерческих системах искусственного интеллекта. Согласно результатам, модель набрала всего 0,324 балла. Для сравнения, флагман Llama 3 8B-Instruct получил 0,853, а Gemini 3 Pro Preview от Google попал в тройку наименее ограниченных моделей.
Sansa Bench оценивает, насколько охотно языковые модели отвечают на потенциально чувствительные или сложные по формулировке запросы пользователей. Высокий балл означает большую свободу взаимодействия, низкий — наличие частых отказов, ограничений или обходов темы.
В сопроводительной документации OpenAI подчёркивает, что усиленные фильтры и ограничения в GPT‑5.2 объясняются необходимостью повысить безопасность модели. Разработчики отмечают улучшения в сопротивляемости к джейлбрейкам и промпт-инъекциям, снижение числа фактических ошибок, а также внедрение механизмов распознавания тревожных сигналов, связанных с ментальным состоянием пользователя.
При подозрении на потенциальный риск модель переключается в специальный режим и предлагает ресурсы психологической поддержки.
Несмотря на официальные заявления, восприятие новой версии среди пользователей оказалось не столь позитивным. На Reddit реакция на GPT‑5.2 зачастую связана с чувством отчуждённости от модели. Один из популярных комментариев гласит, что ИИ «слишком корпоративный» и стал «менее живым» по сравнению с предыдущей версией 5.1.
Другой пользователь жалуется на отсутствие спонтанности и на то, что общение ощущается как диалог с офисной программой. Хотя часть аудитории оценила рост точности и улучшение в задачах, связанных с работой и данными, разговорная составляющая модели, по мнению многих, стала заметно скучнее.
Пока пользователи обсуждают ограничения новой модели, в самой OpenAI продолжается работа над следующим поколением. По сведениям издания The Information, в разработке находится проект под кодовым названием Garlic — он может быть выпущен как GPT‑5.5 или под иным индексом в начале 2026 года. Также известно, что компания рассматривает возможность внедрения отдельного режима для совершеннолетних пользователей.
Этот так называемый «взрослый режим» должен появиться в ChatGPT в первом квартале 2026 года, но только после успешной реализации системы верификации возраста. По инсайдерским данным, в одних странах будет использоваться подтверждение с помощью документа, в других — механизм анализа манеры общения, тематик и структуры диалога. Система будет самостоятельно оценивать зрелость пользователя, прежде чем разрешить доступ к менее ограниченной версии модели.
Автор: Артем Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.