Gonka нещодавно оголосила про важні коригування у своїй основній механіці консенсусу. Система PoC (Proof of Compute, тобто доведення обчислень) є ключовим методом перевірки реальної обчислювальної потужності кожного вузла в мережі. Цього разу оптимізація спрямована на підвищення ефективності активації PoC, режим роботи моделей та розрахунок ваги обчислювальної потужності, з метою більш ефективного залучення GPU-ресурсів до реальних AI-обчислень.
Уніфікація роботи PoC та інференсу, механізм активації для майже реального часу
За новим дизайном механізму, Gonka об’єднала перевірку PoC та модель роботи інференсних задач у єдине середовище. Раніше PoC використовував режим затримки перемикання, що спричиняло часті перемикання між різними задачами та багато простою GPU. Після покращень, спосіб активації перейшов з пасивної затримки до активного запуску, що дозволило зменшити весь цикл активації до менше ніж 5 секунд.
Це означає, що вузли більше не потребують довгого очікування перемикання, а GPU може швидше перейти у робочий режим. Співзасновник David зазначив, що ця оптимізація не спрямована на короткострокове максимізацію прибутку, а є еволюцією, необхідною для швидкого розширення масштабів обчислювальної потужності мережі, з основною метою — підтримувати стабільність і безпеку мережі при високому навантаженні.
Точне вирівнювання ваги обчислювальної потужності з реальними витратами
Команда Gonka переглянула співвідношення між різними GPU-апаратами та масштабами моделей у контексті реальних обчислювальних витрат. Початкова система ваг не відображала належним чином різницю у обчислювальній складності між моделями — хоча менші моделі мають менше параметрів, їх реальні витрати при однаковій кількості токенів не пропорційні. Це призводило до того, що вузли з малими моделями генерували більше токенів, що з часом могло спричинити дисбаланс у структурі обчислювальної потужності.
Нова схема розрахунку ваг дозволяє краще узгоджувати стимули з реальними витратами. За рахунок збільшення ваги великих моделей та високопродуктивного обладнання, мережа поступово накопичує більш щільні ресурси обчислювальної потужності, готуючись до обробки складніших та масштабніших AI-завдань. Це не лише покращує очікуваний прибуток окремого вузла, а й спрямовує ресурси всієї мережі у правильному напрямку.
Мультиучасть для однокарткових та середніх GPU
Щодо питання, як середні та малі GPU можуть залишатися конкурентоспроможними, Gonka пропонує конкретні шляхи участі. За допомогою механізму співпраці з майн-пулом, однокарткові та середні GPU можуть об’єднувати свої ресурси для стабільнішого заробітку. Також, механізм гнучкої участі за Epoch дозволяє вузлам динамічно приєднуватися або виходити залежно від навантаження.
Крім того, окремий канал доходу від інференсних задач забезпечує додаткову можливість для малих обчислювальних потужностей. У порівнянні з перевіркою PoC, інференсні задачі мають гнучкіші вимоги до обладнання, і вузли можуть вільно обирати між цими каналами — брати участь у консенсусі мережі або виконувати реальні AI-завдання. Gonka підкреслює, що у майбутньому не буде дискримінації за масштабом обладнання, а кожен рівень GPU знайде своє місце завдяки диференційованим стимулам.
Уніфікація моделей, майже реальний час активації, точне вирівнювання ваг — ці три рівні оптимізації спрямовані до однієї головної мети: зробити обчислювальні ресурси та прибутки більш прозорими і справедливими, щоб мережа Gonka могла зберігати безпеку та ефективність у процесі масштабування.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Gonka оптимізує механізм PoC: час активації скорочено до 5 секунд, багаторівнева GPU реалізація для постійної участі
Gonka нещодавно оголосила про важні коригування у своїй основній механіці консенсусу. Система PoC (Proof of Compute, тобто доведення обчислень) є ключовим методом перевірки реальної обчислювальної потужності кожного вузла в мережі. Цього разу оптимізація спрямована на підвищення ефективності активації PoC, режим роботи моделей та розрахунок ваги обчислювальної потужності, з метою більш ефективного залучення GPU-ресурсів до реальних AI-обчислень.
Уніфікація роботи PoC та інференсу, механізм активації для майже реального часу
За новим дизайном механізму, Gonka об’єднала перевірку PoC та модель роботи інференсних задач у єдине середовище. Раніше PoC використовував режим затримки перемикання, що спричиняло часті перемикання між різними задачами та багато простою GPU. Після покращень, спосіб активації перейшов з пасивної затримки до активного запуску, що дозволило зменшити весь цикл активації до менше ніж 5 секунд.
Це означає, що вузли більше не потребують довгого очікування перемикання, а GPU може швидше перейти у робочий режим. Співзасновник David зазначив, що ця оптимізація не спрямована на короткострокове максимізацію прибутку, а є еволюцією, необхідною для швидкого розширення масштабів обчислювальної потужності мережі, з основною метою — підтримувати стабільність і безпеку мережі при високому навантаженні.
Точне вирівнювання ваги обчислювальної потужності з реальними витратами
Команда Gonka переглянула співвідношення між різними GPU-апаратами та масштабами моделей у контексті реальних обчислювальних витрат. Початкова система ваг не відображала належним чином різницю у обчислювальній складності між моделями — хоча менші моделі мають менше параметрів, їх реальні витрати при однаковій кількості токенів не пропорційні. Це призводило до того, що вузли з малими моделями генерували більше токенів, що з часом могло спричинити дисбаланс у структурі обчислювальної потужності.
Нова схема розрахунку ваг дозволяє краще узгоджувати стимули з реальними витратами. За рахунок збільшення ваги великих моделей та високопродуктивного обладнання, мережа поступово накопичує більш щільні ресурси обчислювальної потужності, готуючись до обробки складніших та масштабніших AI-завдань. Це не лише покращує очікуваний прибуток окремого вузла, а й спрямовує ресурси всієї мережі у правильному напрямку.
Мультиучасть для однокарткових та середніх GPU
Щодо питання, як середні та малі GPU можуть залишатися конкурентоспроможними, Gonka пропонує конкретні шляхи участі. За допомогою механізму співпраці з майн-пулом, однокарткові та середні GPU можуть об’єднувати свої ресурси для стабільнішого заробітку. Також, механізм гнучкої участі за Epoch дозволяє вузлам динамічно приєднуватися або виходити залежно від навантаження.
Крім того, окремий канал доходу від інференсних задач забезпечує додаткову можливість для малих обчислювальних потужностей. У порівнянні з перевіркою PoC, інференсні задачі мають гнучкіші вимоги до обладнання, і вузли можуть вільно обирати між цими каналами — брати участь у консенсусі мережі або виконувати реальні AI-завдання. Gonka підкреслює, що у майбутньому не буде дискримінації за масштабом обладнання, а кожен рівень GPU знайде своє місце завдяки диференційованим стимулам.
Уніфікація моделей, майже реальний час активації, точне вирівнювання ваг — ці три рівні оптимізації спрямовані до однієї головної мети: зробити обчислювальні ресурси та прибутки більш прозорими і справедливими, щоб мережа Gonka могла зберігати безпеку та ефективність у процесі масштабування.