Опубликовано 28.04.2026 | Автор: kmveg

Стратегия ИИ: не просто расходы, а осмысленный подход

Вопрос стоимости искусственного интеллекта (ИИ) кажется простым, но его значение огромно: ответ определит судьбу компаний и сформирует будущее общества. Однако дать однозначный ответ без дополнительного контекста крайне сложно.

Возможный ответ: «слишком дорого». Согласно Индексу искусственного интеллекта Стэнфордского университета за 2026 год, объём частных инвестиций в ИИ в США достиг 285,9 миллиарда долларов в 2025 году. Эти вложения приносят экономические выгоды, но также создают значительную нагрузку на окружающую среду, коммунальные службы и сообщества. Отчёт указывает, что мощность центров обработки данных для ИИ выросла до 29,6 гигаватт, что сопоставимо с пиковым потреблением электроэнергии штатом Нью-Йорк. При этом годовое потребление воды только для работы модели GPT-4o может превысить потребности в питьевой воде 12 миллионов человек.

Существуют также издержки для человеческой компетентности, когда навыки атрофируются или не развиваются из-за чрезмерной зависимости от «одноруких бандитов» из подсказок (систем генерации текста). Однако это трудно измерить в краткосрочной перспективе. На фоне текущей позиции правительства США, проявляющего ограниченный интерес к регулированию или общественным опасениям, проще сосредоточиться на финансовых аспектах до тех пор, пока правительство и промышленность не будут вынуждены решать эти вопросы.

Реальная стоимость токенов ИИ

Начать можно с токена — базовой единицы для продажи входных и выходных данных моделей ИИ. Стоимость токенов является предметом постоянного внимания разработчиков, использующих подписочные планы ИИ, поскольку провайдеры, такие как Anthropic и GitHub, активно переводят клиентов с субсидированных подписок на оплату по факту использования.

Деванш, исследователь машинного обучения, руководитель отдела ИИ в юридическом стартапе Iqidis и основатель сообщества по ИИ, в своей публикации этого года, провёл расчёт стоимости. Она составляет около 0,0038 доллара за миллион токенов — но в очень специфическом контексте.

Эта цифра представляет собой базовую стоимость вывода (инференса) на графическом процессоре Nvidia H100, арендованном по цене 2,50 доллара в час и генерирующем 185 токенов в секунду при 100-процентной загрузке.

Однако, как отмечает Деванш, никто не работает при 100-процентной загрузке. При загрузке в 30 процентов цена составила бы около 0,013 доллара за миллион токенов; при 10 процентах — около 0,038 доллара за миллион токенов.

Для сравнения, Anthropic взимает 5 долларов за миллион входных токенов и 25 долларов за миллион выходных токенов для своей последней модели Opus 4.7. Для Google Gemma 4 26B A4B средневзвешенная цена входных данных на момент написания составляет 0,096 доллара за миллион токенов. При расчётах на другом оборудовании, с другими ценами, энергозатратами, моделями и коэффициентами загрузки, будут получены совершенно иные результаты.

По словам Деванша, данные о стоимости API, предоставляемые крупными лабораториями, являются хорошим индикатором их собственных затрат на токены. По некоторым данным, Anthropic стремится к валовой прибыли около 50 процентов. Однако в реальности стоимость токена — это совокупность многих переменных: сама модель, исследования, лежащие в её основе, постоянные обновления, которые остаются невидимыми для пользователей. Всё это необходимо учитывать. Стоимость не ограничивается лишь одним вызовом вывода, и такой подход к системе не является оптимальным.

Как отмечает Деванш, организации, как правило, не концентрируются на конкретной стоимости токенов, поскольку их приоритет — предоставление ценных услуг клиентам. В юридической сфере, например, затраты часто можно переложить на клиента, и это не вызывает нареканий, так как заказчики ценят прозрачность выполнения работ. Таким образом, беспокойство о стоимости токенов уменьшается, пока компания способна обосновать свои расходы и постоянно предоставлять ценность.

Токены как KPI: опасный путь

Такие компании, как Meta и Shopify, допустили ошибку, рассматривая использование токенов в качестве ключевого показателя эффективности (KPI). В результате сотрудники начинают активно применять ИИ-инструменты, пытаясь продемонстрировать свою ценность, что может быстро привести к неоправданным расходам и не принести значимой пользы для более важных бизнес-метрик.

«Прямая ли зависимость между расходами на токены и производительностью? Абсолютно нет, — подчеркнул Деванш. — Я проводил обширные исследования по этой теме. Раньше существовали такие нелепые метрики продуктивности, как количество строк кода или напечатанных слов. Теперь мы наблюдаем новейший этап этой глупости. Думаю, менеджеры среднего звена всегда будут стремиться оправдать себя и найти способ ранжировать сотрудников, не прибегая к мыслительным усилиям».

Однако одна из проблем с большими языковыми моделями (БЯМ) заключается в том, что мы ещё не знаем, как их лучше всего применять, отметил Деванш. Поэтому есть потенциальная ценность в том, чтобы просто поощрять использование токенов, если это приведёт к созданию новых рабочих процессов, которые укажут на эффективные и неэффективные подходы.

ИИ и облачная инфраструктура: скрытые риски

Боб Венеро, генеральный директор ИТ-консалтинговой компании Future Tech, сообщил, что его компания работает преимущественно с клиентами из списка Fortune 100 (крупнейшие американские компании), и многие из них запускают ИИ-проекты, вкладывая значительные средства без чёткого понимания целей.

По словам Венеро, когда его компания взаимодействует с клиентами, цель состоит в том, чтобы определить желаемый бизнес-результат, который может включать или не включать ИИ.

Недавняя работа Future Tech с Northrop Grumman включала внедрение ИИ: ИТ-компания помогла оборонному предприятию развернуть контроллер доставки приложений (ADC), устройство или программу, которая распределяет сетевой трафик и оптимизирует работу приложений, для обработки ИИ-нагрузок, связанных с его проектами.

Венеро отметил, что компании испытывают трудности с оценкой влияния ИИ на свою среду, измерением рентабельности инвестиций (ROI) и определением потенциальной пользы технологии.

«Поэтому необходимо проделать большую предварительную работу, чтобы определить, куда инвестировать средства и каким будет результат, особенно когда затраты в три раза выше, чем полгода назад», — подчеркнул он, ссылаясь на «Рамагеддон» — нехватку оперативной памяти, вызванную бумом вычислений для ИИ.

Среди катализаторов текущего кризиса оперативной памяти он назвал усилия Microsoft по закупке чипов памяти у Samsung и SK Hynix, а также переход производителей оборудования, таких как Micron, на память с высокой пропускной способностью (HBM). Это усложняет расчёты рентабельности инвестиций для внедрений ИИ, поскольку всё стало значительно дороже.

Поставщики облачных услуг могут помочь, предлагая ценообразование на основе потребления, однако у Венеро есть определённые оговорки. Он выразил опасения по поводу использования облачных решений для ИИ, назвав это «немного пугающим» с точки зрения их компании.

Отбросив вопросы безопасности, Венеро отметил, что риск для продуктивности из-за зависимости от облака существенен для крупных организаций. Он привёл в пример Microsoft Office 365, который, по его словам, неоднократно подвергался сбоям: «Происходит так много подобных отключений».

Если простой облачного сервиса обходится компании в тысячу долларов в минуту, это, возможно, приемлемо. Однако, если речь идёт о миллионе долларов в минуту, необходимо задуматься о мерах контроля, и, вероятно, это потребует локального решения, считает он.

ИИ может ухудшать стабильность облачных сервисов за счёт развёртывания недостаточно проверенного кода и инфраструктурной нагрузки, вызванной интенсивным использованием ИИ. Клиенты, по словам Венеро, «абсолютно видят это. А если нет, то мы их информируем».

В свете проблем с мощностями, вызванных внезапной популярностью OpenClaw, Венеро отметил: «Люди просто внедряют это в свою среду, и происходят странные вещи. Поэтому определённо необходим диалог об экосистеме, касающийся риска и трёх различных столпов риска, связанных с ним».

Он также добавил, что гиперскейлеры (крупные облачные провайдеры) усугубили проблему, сосредоточившись на скорости в ущерб качеству. «Сейчас это гонка: кто победит, кто возьмёт больше. Все бросают все силы, и это вызывает невероятный хаос».

«Мы хотим, чтобы наши клиенты сделали шаг назад, — сказал он. — Внимательно оценили, чего они хотят достичь и почему. Изучили сопутствующие инвестиции и подходящие сроки, а затем измерили результаты».

Вдумчивый и целенаправленный подход к ИИ повышает вероятность успешного внедрения ИИ-проектов в производство.

Венеро сообщил, что среди компаний, с которыми он работал, до получения образования по вопросам ИИ лишь около 15 процентов их прототипов доходили до внедрения. С правильным руководством этот показатель, по его словам, увеличивается до 45–50 процентов.

«Успех зависит от конкретного сценария использования, — объяснил он. — Если есть чёткие цели, и эти результаты измеряются, тогда будет успех. В противном случае, если ИИ внедряется ради самого ИИ, вероятность успеха составляет лишь пять процентов».

Возможно, вопрос о стоимости ИИ не должен быть первым. Цитируя давление, которое некоторые сотрудники испытывают, пытаясь показать свою ценность, расходуя токены, Венеро заключил, что вопрос должен быть: «Зачем? И для чего вы их используете?»

Comments are closed.