Según el monitoreo de 1M AI News, se descubrió que el esquema de facturación del plan Coding Plan de Ark (Volcano Engine) tiene mecanismos ocultos que no estarían suficientemente divulgados. Un desarrollador informó en V2EX que la velocidad a la que se consume el cupo es mucho mayor que la de paquetes comparables en otras plataformas; después de contactar al servicio de atención al cliente, recibió la respuesta: «Si los Tokens consumidos por una sola llamada de modelo son muy superiores al consumo promedio de una llamada, entonces las veces estimadas que se pueden realizar durante el ciclo serán mucho menores que 6,000».
Como ejemplo, el plan Pro (200 yuanes/mes) indica que el cupo es de 6,000 solicitudes cada 5 horas, 45,000 por semana y 90,000 por mes. Sin embargo, el cobro real no descuenta una vez por cada llamada, sino que se calcula descontando múltiples veces en función de la cantidad de tokens consumidos en una sola llamada. La fórmula de conversión medida por los usuarios es: usage = max(round(use_token/token_limit), 1). El multiplicador oculto varía entre distintos modelos: DeepSeek-V3.2 es aproximadamente 2 veces, Doubao-Seed-2.0-Code aproximadamente 4 veces, y Doubao-Seed-2.0-Pro aproximadamente 6 veces. Es decir, una sola llamada al usar Doubao-Seed-2.0-Pro puede contarse como 6 consumos de cupo.
El usuario afirma que una de sus llamadas consume 510,000 tokens; en otras plataformas como Alibaba Bailian se contabiliza como una sola vez, pero en Volcano Engine podría convertirse aproximadamente en unas 20 veces. En agentes de programación con IA que ejecutan tareas complejas, consumir cien mil e incluso decenas de miles de tokens por llamada es habitual; este esquema de facturación haría que el cupo del paquete se agote rápidamente.
En el mercado doméstico, los planes Coding Plan suelen cobrarse actualmente por número de llamadas; plataformas como Alibaba Bailian y Xiaomi MiMo descuentan una vez por cada llamada, sin conversión por tokens. La doble facturación de Volcano Engine, que «se anuncia por número de veces pero se convierte por tokens», es relativamente poco común en la industria, y no se explica de forma destacada en una posición visible en la página del plan; los usuarios solo pueden conocer este mecanismo cuando el consumo anormal ya ocurrió y contactan con el servicio de atención al cliente. La herramienta de programación con IA Trae, de ByteDance, también fue reportada recientemente por usuarios por haber cambiado de un cobro exclusivamente por llamadas a un método similar de convertir tokens para contar veces.