وفقًا لمتابعة 1M AI News، وُجد أن طريقة التسعير الخاصة بخطة الفوترة لدى Volcano Engine Ark Coding Plan تحتوي على آليات خفية لم يتم الإفصاح عنها بشكل كافٍ، وذلك بعد أن اكتشفها المستخدمون. أشار أحد المطورين في V2EX إلى أن سرعة استهلاك الحصة تكون أسرع بكثير من المنصات الأخرى المماثلة ضمن نفس نوع الباقات. وبعد التواصل مع خدمة العملاء، تلقى ردًا نصّه: «إذا كان عدد Tokens المستهلك في كل استدعاء للنموذج أعلى بكثير من متوسط عدد Tokens المستهلك في الاستدعاءات، فستكون التوقعات لعدد مرات الاستدعاء الممكنة خلال الفترة أقل بكثير من 6,000 مرة.»
كمثال على باقة Pro (200 يوان/شهريًا)، يُعلن عن حصة قدرها 6,000 طلب لكل 5 ساعات، و45,000 طلب أسبوعيًا، و90,000 طلب شهريًا. لكن الخصم الفعلي لا يتم خصم مرة واحدة مقابل كل استدعاء؛ بل يتم تحويل استهلاك الـ token في كل استدعاء إلى خصومات متعددة. صيغة التحويل التي حسبها المستخدم هي: usage = max(round(use_token/token_limit), 1). وتختلف نسبة المضاعفة الخفية بين النماذج: DeepSeek-V3.2 تبلغ حوالي 2x، وDoubao-Seed-2.0-Code حوالي 4x، وDoubao-Seed-2.0-Pro حوالي 6x. أي أن الاستدعاء الواحد باستخدام Doubao-Seed-2.0-Pro قد يُحسب على أنه يستهلك 6 مرات من الحصة.
يذكر هذا المستخدم مثالًا يقول فيه إن استدعاءً واحدًا لديه يستهلك 510,000 token، بينما يتم احتسابه مرة واحدة فقط على منصات أخرى مثل Alibaba Bailian، لكن في Volcano Engine قد يتم تحويله إلى حوالي 20 مرة. وعند تنفيذ مهام معقدة بواسطة وكيل برمجة بالذكاء الاصطناعي (AI 编 programming Agent)، يُعد استهلاك مئات الآلاف وحتى عشرات الآلاف من الـ token في الاستدعاء الواحد أمرًا شائعًا. وستؤدي طريقة الفوترة هذه إلى نفاد حصة الباقة بسرعة.
حاليًا، تُسعّر باقات Coding Plan في الصين عادةً حسب عدد مرات الاستدعاء. ففي منصات مثل Alibaba Bailian وXiaomi MiMo يتم خصم مرة واحدة مقابل كل استدعاء، ولا يتم إجراء تحويل حسب token. إن الفوترة الثنائية مثل التي تتبعها Volcano Engine «تسمي عدد المرات وفقًا لعدد المرات، ثم تتحول وفقًا للـ token» نادرة نسبيًا في الصناعة، ولم تُذكر بوضوح في موضع بارز على صفحة الباقة. ولا يعرف المستخدمون عن هذه الآلية إلا بعد أن يصبح استهلاكهم غير طبيعي ويتواصلون مع خدمة العملاء. كما أن أداة البرمجة بالذكاء الاصطناعي Trae التابعة لشركة ByteDance تلقت أيضًا في الآونة الأخيرة شكاوى من المستخدمين بأنها انتقلت من الفوترة الصرفة حسب المرات إلى طريقة مشابهة لتحويل token إلى عدد مرات.