Slowpoke news

Регистрация | Войти

Курсы валют

    Обновить данные

    Погода

    Прогноз погоды

    22 ℃

    UNKNOWN

    50%

    Влажность

    15 км/ч

    Ветер

    Ошибка в имени города

    Безопасность

    9 февраля 2026 г.

    Anthropic ускорила Claude Opus 4.6 и резко подняла тарифы на быстрый режим


    Компания Anthropic ускорила модель Claude Opus 4.6, запустив отдельный быстрый режим генерации. В формате fast модель теперь выдаёт около 100 токенов в секунду, что примерно в 2,5 раза превышает скорость предыдущей версии. Параллельно выросла и цена использования, сразу в 6 раз, что моментально вызвало активное обсуждение в профессиональной среде.
    Быстрый режим стал доступен пользователям Claude Code через команду /fast. При его активации лимиты начинают расходоваться заметно интенсивнее — это касается и недельной квоты, и 5-часовых ограничений. В результате ускорение напрямую влияет на стоимость практической работы с моделью, особенно при длинных сессиях и активном использовании.
    В сообществе почти сразу появились версии о причинах такого скачка производительности. Основная линия рассуждений сводится к тому, что Anthropic могла пойти не по пути обновления аппаратной базы, а изменить параметры инференса. Речь идёт о снижении размера батча, то есть количества сессий, которые одновременно обрабатываются на одном GPU. При таком подходе каждый отдельный пользователь получает более высокую скорость отклика, но суммарная пропускная способность видеокарты падает.
    Подписка Claude Code при этом не получила ускоренную модель автоматически. Доступ возможен только через отдельную оплату API. Несмотря на это, новый режим довольно быстро появился у сторонних агрегаторов нейросетей. Например, BotHub уже позволяет протестировать ускоренную версию, предлагая новым пользователям бонус в размере 300 тыс. капсов своей внутренней валюты.
    Часть специалистов уверена, что с точки зрения железа в инфраструктуре Anthropic ничего принципиально не изменилось. При уменьшении батча растёт скорость генерации для конкретного запроса, но падает эффективность использования GPU. Это автоматически снижает выручку с одной видеокарты и вынуждает повышать цену, чтобы сохранить финансовые показатели.
    Похожие эффекты ранее подробно разбирались аналитиками Semianalysis, которые с осени поддерживают проект InferenceMAX. В его рамках разные модели запускаются на различных видеокартах с замером реальной производительности. В качестве ориентира часто приводят DeepSeek R1. При генерации около 100 токенов в секунду на одну сессию эта модель в среднем выдаёт порядка 6000 токенов в секунду на один GPU. При разгоне сессии до 250 токенов в секунду общая производительность видеокарты падает примерно до 1000 токенов в секунду.
    В итоге при ускорении в 2,5 раза суммарный выпуск токенов сокращается почти в 6 раз. Цена растёт пропорционально, а итоговая выручка и маржинальность остаются на прежнем уровне. Этот же экономический баланс многие наблюдатели видят и в случае с Claude Opus 4.6 Fast.

    Автор: Артем Представитель редакции CISOCLUB. Пишу новости, дайджесты, добавляю мероприятия и отчеты.