За моніторингом 1M AI News, платна модель для Coding Plan від Volcano Engine Ark була виявлена користувачами як така, що має приховані механізми, про які розкрито недостатньо. Один розробник на V2EX повідомив, що швидкість витрачання квоти значно вища, ніж у аналогічних пакетах на інших платформах; після звернення до служби підтримки він отримав відповідь: «Токени, що витрачаються за один виклик моделі, якщо значно перевищують витрати в середньому на виклик, то прогнозована кількість можливих викликів протягом періоду також буде значно меншою за 6,000 разів».
У якості прикладу візьмемо пакет Pro (200 грн/міс). Заявлена квота — 6,000 запитів кожні 5 годин, 45,000 разів на тиждень і 90,000 разів на місяць. Але фактичне списання не означає, що за один виклик списується один раз, натомість воно конвертує витрату токенів за один виклик у багаторазове списання. Формула перерахунку, яку обчислив користувач, має вигляд: usage = max(round(use_token/token_limit), 1); приховані множники для різних моделей різні: DeepSeek-V3.2 — приблизно 2x, Doubao-Seed-2.0-Code — приблизно 4x, Doubao-Seed-2.0-Pro — приблизно 6x. Тобто один виклик з використанням Doubao-Seed-2.0-Pro може бути зарахований як 6 разів витрачання квоти.
Цей користувач навів приклад: його один виклик витрачає 510,000 токенів, тоді як на інших платформах, зокрема на Alibaba Bailei, це рахується як один раз. На Volcano Engine це може бути перераховано приблизно у 20 разів. Під час виконання складних завдань агентом для AI-програмування витрата за один виклик у десятки або навіть сотні тисяч токенів є типовою ситуацією; така система оплати призведе до швидкого вичерпання квоти пакета.
Пакети Coding Plan у Китаї наразі здебільшого оплачуються за кількістю викликів; на платформах на кшталт Alibaba Bailei, Xiaomi MiMo тощо за один виклик списується один раз, без перерахунку за токенами. Та подвійна схема оплати від Volcano Engine, що «заявляє за кількістю, але перераховує за токенами», у галузі трапляється доволі рідко, і про неї не зазначено на видному місці на сторінці пакета; користувачі можуть дізнатися про цей механізм лише після того, як під час фактичного споживання виникне аномалія, і після звернення до служби підтримки. Теж нещодавно інструмент для AI-програмування Trae від ByteDance отримав відгуки від користувачів про те, що він перейшов від чистої оплати за рази до схожого способу перерахунку кількості через токени.