Відомий венчурний капіталіст a16z, засновник Марк Андріссен та засновник Replit Амджад Масад 25 жовтня провели бесіду, зосередившись на поточному стані розвитку ШІ. Андріссен зазначив, що ШІ досяг вражаючого прогресу в написанні програм, виконанні математичних обчислень та моделюванні фізичних явищ, але в таких сферах, як медицина та право, спостерігається стагнація. Масад відповів, що ключ не в складності, а в перевіряємості. Тобто, завдання, для яких можна об'єктивно оцінити правильність, прогресують найшвидше, а в більш розмитих сферах важче досягти прориву.
Штучний інтелект має дві швидкості: той, що може перевіряти, бігає швидше за всіх.
Спочатку Masad переглянув методи навчання моделей: ранні мовні моделі просто дивилися на текст, а потім вгадували наступну букву. Хоча вони могли говорити, але не могли справжнім чином міркувати. Лише після впровадження навчання з підкріпленням (Reinforcement Learning, RL) штучний інтелект почав навчатися у перевірених середовищах. Він пояснив:
«Якщо є помилки в програмному забезпеченні, є модульні тести або завдання, які можуть дати чіткий результат, ШІ може безпосередньо знати, чи він правий, чи ні.»
Цей метод навчання з миттєвим зворотним зв'язком дозволяє ШІ швидко покращити свої навички вирішення задач.
Чому медична та юридична сфери не можуть встигнути?
Андрессен запитав: «А як щодо медицини та права? Чому прогрес виглядає таким повільним і спостерігається стагнація?» Мазад відповів:
«Бо через них немає єдиної відповіді.»
Наприклад, медичні діагнози можуть мати кілька причин хвороби та змінюватися в процесі, а правові рішення можуть відрізнятися в залежності від суддів та справ, тобто вони є занадто гнучкими і не мають чіткої стандартної відповіді. Це ускладнює самоперевірку моделі і не дає можливості створити зміцнюючий цикл.
Хоча можна допомогти моделі за допомогою навчання з підкріпленням на основі зворотного зв'язку від людини (RLHF), це все ще є суб'єктивною оцінкою, а не настільки прямим і зрозумілим, як математика чи програми.
(Примітка: Посилене навчання на основі зворотного зв'язку від людей (RLHF) є технологією машинного навчання (ML), яка використовує зворотний зв'язок від людей для вдосконалення ML моделей, щоб підвищити ефективність самонавчання.)
Справжнім ключем є не «складність», а «перевірність»
Андресен після обробки спостережень сказав: “Отже, суть не в тому, складна чи легка проблема, а в тому, чи можемо ми підтвердити правильну відповідь?” Масад зазначив:
“Так, вибух AI в програмуванні та математиці не є наслідком того, що це простіше, а тому, що можна перевірити результати.”
Наприклад, під час написання програми, як тільки програма може компілюватися і тестування проходить, ШІ може негайно отримати відгук «правильного рішення», що дозволяє моделі щодня автоматично виконувати тисячі практик і швидко еволюціонувати.
Які ще сфери мають верифікацію?
Двоє людей перерахували кілька галузей, в яких штучний інтелект розвивається найшвидше:
Математика та фізика: є чіткі рівняння та результати моделювання.
Хімія та біологія: такі як складання білків, генетичні послідовності, можуть бути перевірені експериментально або за допомогою моделювання.
Робот: успішність або невдача місії може бути безпосередньо кількісно оцінена.
Це все належить до сфери “об'єктивно перевіряємого”, тому це є найкрутішою кривою навчання для AI на даний момент.
AI для програмування спочатку злетить, а медицина і право ще в дорозі.
Masad підсумував свої погляди, сказавши:
“Штучний інтелект, що пише програми, спочатку швидко досягне успіху, за ним слідуватимуть математика, фізика, хімія. Але такі абстрактні сфери, як медицина та право, потребуватимуть часу для розвитку.”
Андріссен також погодився:
«Це природне явище. ШІ спочатку вибухає в тих місцях, де можна виміряти, а в сферах, де людське судження є неясним, він запізнюється на один крок.»
Чому прогрес ШІ нерівномірний? a16z, засновник Replit: перевірка є ключовою відмінністю. Спочатку з'явилося в Chain News ABMedia.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Чому прогрес AI нерівномірний? Засновники a16z та Replit: перевірка є ключовою різницею
Відомий венчурний капіталіст a16z, засновник Марк Андріссен та засновник Replit Амджад Масад 25 жовтня провели бесіду, зосередившись на поточному стані розвитку ШІ. Андріссен зазначив, що ШІ досяг вражаючого прогресу в написанні програм, виконанні математичних обчислень та моделюванні фізичних явищ, але в таких сферах, як медицина та право, спостерігається стагнація. Масад відповів, що ключ не в складності, а в перевіряємості. Тобто, завдання, для яких можна об'єктивно оцінити правильність, прогресують найшвидше, а в більш розмитих сферах важче досягти прориву.
Штучний інтелект має дві швидкості: той, що може перевіряти, бігає швидше за всіх.
Спочатку Masad переглянув методи навчання моделей: ранні мовні моделі просто дивилися на текст, а потім вгадували наступну букву. Хоча вони могли говорити, але не могли справжнім чином міркувати. Лише після впровадження навчання з підкріпленням (Reinforcement Learning, RL) штучний інтелект почав навчатися у перевірених середовищах. Він пояснив:
«Якщо є помилки в програмному забезпеченні, є модульні тести або завдання, які можуть дати чіткий результат, ШІ може безпосередньо знати, чи він правий, чи ні.»
Цей метод навчання з миттєвим зворотним зв'язком дозволяє ШІ швидко покращити свої навички вирішення задач.
Чому медична та юридична сфери не можуть встигнути?
Андрессен запитав: «А як щодо медицини та права? Чому прогрес виглядає таким повільним і спостерігається стагнація?» Мазад відповів:
«Бо через них немає єдиної відповіді.»
Наприклад, медичні діагнози можуть мати кілька причин хвороби та змінюватися в процесі, а правові рішення можуть відрізнятися в залежності від суддів та справ, тобто вони є занадто гнучкими і не мають чіткої стандартної відповіді. Це ускладнює самоперевірку моделі і не дає можливості створити зміцнюючий цикл.
Хоча можна допомогти моделі за допомогою навчання з підкріпленням на основі зворотного зв'язку від людини (RLHF), це все ще є суб'єктивною оцінкою, а не настільки прямим і зрозумілим, як математика чи програми.
(Примітка: Посилене навчання на основі зворотного зв'язку від людей (RLHF) є технологією машинного навчання (ML), яка використовує зворотний зв'язок від людей для вдосконалення ML моделей, щоб підвищити ефективність самонавчання.)
Справжнім ключем є не «складність», а «перевірність»
Андресен після обробки спостережень сказав: “Отже, суть не в тому, складна чи легка проблема, а в тому, чи можемо ми підтвердити правильну відповідь?” Масад зазначив:
“Так, вибух AI в програмуванні та математиці не є наслідком того, що це простіше, а тому, що можна перевірити результати.”
Наприклад, під час написання програми, як тільки програма може компілюватися і тестування проходить, ШІ може негайно отримати відгук «правильного рішення», що дозволяє моделі щодня автоматично виконувати тисячі практик і швидко еволюціонувати.
Які ще сфери мають верифікацію?
Двоє людей перерахували кілька галузей, в яких штучний інтелект розвивається найшвидше:
Математика та фізика: є чіткі рівняння та результати моделювання.
Хімія та біологія: такі як складання білків, генетичні послідовності, можуть бути перевірені експериментально або за допомогою моделювання.
Робот: успішність або невдача місії може бути безпосередньо кількісно оцінена.
Це все належить до сфери “об'єктивно перевіряємого”, тому це є найкрутішою кривою навчання для AI на даний момент.
AI для програмування спочатку злетить, а медицина і право ще в дорозі.
Masad підсумував свої погляди, сказавши:
“Штучний інтелект, що пише програми, спочатку швидко досягне успіху, за ним слідуватимуть математика, фізика, хімія. Але такі абстрактні сфери, як медицина та право, потребуватимуть часу для розвитку.”
Андріссен також погодився:
«Це природне явище. ШІ спочатку вибухає в тих місцях, де можна виміряти, а в сферах, де людське судження є неясним, він запізнюється на один крок.»
Чому прогрес ШІ нерівномірний? a16z, засновник Replit: перевірка є ключовою відмінністю. Спочатку з'явилося в Chain News ABMedia.