🏋️♂️ Дело не в модели. Дело в том, что вокруг неё
Многие спорят, чья модель умнее: Claude, GPT, Gemini. А свежее исследование заходит с другой стороны и говорит, что гонка за «самым умным мозгом» упёрлась не в сам мозг. Узкое место теперь в его окружении.
Исследователи разбирают, почему два человека с одним и тем же Claude получают совершенно разный результат. Вывод простой: вся разница в обвязке вокруг модели.
⏺Память. Помнит ли система, что вы обсуждали вчера, или каждый раз начинает с чистого листа.
⏺Инструменты. Может ли модель не только болтать, но и лезть в браузер, базу, код, файлы.
⏺Контекст. Что именно вы кладёте в запрос. Мусор на входе, мусор на выходе.
⏺Маршрутизация. Какую задачу какой модели отдавать: дешёвой и быстрой или дорогой и думающей.
⏺Проверка. Кто ловит ошибки до того, как они уйдут пользователю.
Мысль простая: умная модель в плохой обвязке проигрывает средней модели в хорошей.
Это ровно то, что я почувствовал на Креаторе. Делал его ещё на Sonnet 4.5, но к моменту кода продуктовая часть уже была закрыта полностью: готовый дизайн, детально прописанный пользовательский путь, критерии приёмки. Модели оставалось просто писать код по понятным правилам. Поэтому продукт собрался быстро и почти без проблем. Сработала не магия модели, а контекст, который я ей дал.
Так что если ваш агент (claude code, codex, cursor и тд.) выдаёт не то, первым делом смотрите не на модель, а на обвязку: контекст, правила, проверку. Поменять модель — самый очевидный ход и самый редко работающий.
Кстати какой моделью чаще пользуетесь в работе и разработке?
В ежедневной работе я часто использую Claude Opus 4.7 или Gemini 3.1 Pro, а для кода Sonnet 4.6. (effort: max) Sonnet работает не сильно хуже Opus, особо не замечаю, при этом лимиты жрёт значительно меньше.