План кодування Volcano Engine повідомлено про подвійне нарахування: заявлено за кількістю разів, але фактично також враховується витрата токенів для зменшення кількості використань

BlockBeatNews

За моніторингом 1M AI News, платна модель для Coding Plan від Volcano Engine Ark була виявлена користувачами як така, що має приховані механізми, про які розкрито недостатньо. Один розробник на V2EX повідомив, що швидкість витрачання квоти значно вища, ніж у аналогічних пакетах на інших платформах; після звернення до служби підтримки він отримав відповідь: «Токени, що витрачаються за один виклик моделі, якщо значно перевищують витрати в середньому на виклик, то прогнозована кількість можливих викликів протягом періоду також буде значно меншою за 6,000 разів».

У якості прикладу візьмемо пакет Pro (200 грн/міс). Заявлена квота — 6,000 запитів кожні 5 годин, 45,000 разів на тиждень і 90,000 разів на місяць. Але фактичне списання не означає, що за один виклик списується один раз, натомість воно конвертує витрату токенів за один виклик у багаторазове списання. Формула перерахунку, яку обчислив користувач, має вигляд: usage = max(round(use_token/token_limit), 1); приховані множники для різних моделей різні: DeepSeek-V3.2 — приблизно 2x, Doubao-Seed-2.0-Code — приблизно 4x, Doubao-Seed-2.0-Pro — приблизно 6x. Тобто один виклик з використанням Doubao-Seed-2.0-Pro може бути зарахований як 6 разів витрачання квоти.

Цей користувач навів приклад: його один виклик витрачає 510,000 токенів, тоді як на інших платформах, зокрема на Alibaba Bailei, це рахується як один раз. На Volcano Engine це може бути перераховано приблизно у 20 разів. Під час виконання складних завдань агентом для AI-програмування витрата за один виклик у десятки або навіть сотні тисяч токенів є типовою ситуацією; така система оплати призведе до швидкого вичерпання квоти пакета.

Пакети Coding Plan у Китаї наразі здебільшого оплачуються за кількістю викликів; на платформах на кшталт Alibaba Bailei, Xiaomi MiMo тощо за один виклик списується один раз, без перерахунку за токенами. Та подвійна схема оплати від Volcano Engine, що «заявляє за кількістю, але перераховує за токенами», у галузі трапляється доволі рідко, і про неї не зазначено на видному місці на сторінці пакета; користувачі можуть дізнатися про цей механізм лише після того, як під час фактичного споживання виникне аномалія, і після звернення до служби підтримки. Теж нещодавно інструмент для AI-програмування Trae від ByteDance отримав відгуки від користувачів про те, що він перейшов від чистої оплати за рази до схожого способу перерахунку кількості через токени.

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.
Прокоментувати
0/400
Немає коментарів