Röportaj | Büyük teknoloji, AI'yi çöp verilerle eğitiyor: Sezgi

AI modelleri daha güçlü hale geliyor, ancak eğitildikleri veriler kötüleşiyor, diyor Intuition kurucusu Billy Luedtke. Özet

  • AI, beslediğimiz veriler kadar iyidir, diyor Intuition'un kurucusu Billy Luedtke.
  • AI'nin geri dönüşümlü hale geldiği bir “slop-in, slop-out” dönemindeyiz.
  • Merkeziyetsiz modeller, teknoloji ve kullanıcı deneyiminde avantajlıdır.

Yapay zeka sistemleri daha yaygın hale geldikçe, kullanıcılar düzeltmesi zor sınırlamalarla giderek daha fazla karşılaşmaktadır. Modeller geliştikçe, bu modellerin eğitildiği temel veri aynı kalmaktadır. Dahası, bir yapay zeka modelinin diğer yapay zeka tarafından üretilen verilerle eğitilmesi olan özyineleme, durumu daha da kötüleştirebilir.

Yapay zekanın geleceği hakkında konuşmak için crypto.news, verifiable attribution, reputation ve data ownership'ı yapay zekaya getirmeye odaklanan Intuition'un kurucusu Billy Luedtke ile görüştü. Luedtke, mevcut veri setlerinin neden temelde hatalı olduğunu ve bunun nasıl düzeltilebileceğini açıklıyor.

Crypto.news: Şu anda herkes AI altyapısına odaklanmış durumda — GPU'lar, enerji, veri merkezleri. İnsanlar AI'daki güven katmanının önemini mi hafife alıyor? Neden bu önemli?

Billy Luedtke: %100. İnsanlar kesinlikle bunu hafife alıyor — ve bunun birkaç nedeni var.

Öncelikle, benim “girişte kötü, çıkışta kötü” olarak adlandırdığım bir döneme giriyoruz. Yapay zeka, tükettiği veriler kadar iyidir. Ancak bu veriler — özellikle açık webden gelenler — büyük ölçüde kirlenmiştir. Temiz değil. İnsan niyetini yansıtmıyor. Bunun büyük bir kısmı çevrimiçi oyunlaştırılmış davranışlardan geliyor: beğeniler, yorumlar, etkileşim hileleri — hepsi dikkat optimize edilmiş algoritmalar aracılığıyla filtreleniyor.

Yani AI internette tarama yaptığında, gördüğü şey bizim kim olduğumuzun bütünsel bir resmi değil. Gördüğü, insanların platformda nasıl davrandığı. Ben Twitter'da gerçek hayatta olduğum gibi davranmıyorum. Hiçbirimiz öyle yapmıyoruz. Biz algoritmayı optimize ediyoruz — gerçek düşünceyi ifade etmiyoruz.

Bu da yinelemeli. Platformlar bizi eğitiyor ve biz daha fazla bozulmuş davranışı geri besliyoruz. Bu, AI'nın insanlığa dair algısını daha da çarpıtan bir geri bildirim döngüsü — bir spiral — oluşturuyor. Ona ne düşündüğümüzü öğretmiyoruz; neyin beğeni alacağını düşündüğümüzü öğretiyoruz.

Ortalama kullanıcı Google'da arama yapmıyor, kaynakları karşılaştırmıyor veya eleştirel düşünmüyor. Sadece ChatGPT veya başka bir modele soruyorlar ve yanıtı olduğu gibi alıyorlar.

Bu tehlikeli. Eğer model opaksa — bir kara kutu — ve onu kontrol eden şirket, hangi bilgilerin gösterileceğini veya gösterilmeyeceğini de kontrol ediyorsa, o zaman bu tamamen anlatı kontrolüdür. Bu merkezi, hesap verebilir olmayan ve son derece güçlüdür.

Grok'tan en iyi podcast'i sorduğunuzu hayal edin, ve cevap, Elona en çok para ödeyen. Bu zeka değil — bu sadece gizli reklam.

CN: Peki bunu nasıl düzeltiriz? Gerçekliği ve değeri, etkileşimden daha fazla önceliklendiren sistemler nasıl inşa ederiz?

BL: Teşvikleri değiştirmemiz gerekiyor. Bu sistemler insanlara hizmet etmelidir — kurumsallara, hissedarlara, reklamcılara değil. Bu, internet için yeni bir katman oluşturmak anlamına geliyor: kimlik ve itibar temelleri. Bunu Intuition'da yapıyoruz.

Doğrulanabilir atıfa ihtiyacımız var: kim ne dedi, ne zaman ve hangi bağlamda. Ayrıca, herhangi bir veri kaynağına ne kadar güvenebileceğimizi belirlemeye yardımcı olan taşınabilir, merkeziyetsiz bir üne ihtiyacımız var — bu, hisse dayanan değil, gerçek bağlamsal geçmişe dayanan bir güven.

Reddit mükemmel bir örnektir. Modeller için en büyük eğitim verisi kaynaklarından biridir. Ancak bir kullanıcı alaycı bir şekilde, “Sadece k*** kendini” derse, bu toplanabilir ve tıbbi tavsiye isteyen birine modelin önerisinde görünebilir.

Bu korkunç — ve modellerin bağlam, atıf veya itibar ağırlığı olmadığında olan budur. Bilmemiz gereken: Bu kişi tıpta güvenilir mi? Finans alanında saygınlar mı? Bu güvenilir bir kaynak mı, yoksa sadece başka bir rastgele yorum mu?

CN: Atıf ve itibar hakkında konuştuğunuzda, bu verilerin bir yerde saklanması gerekiyor. Altyapı açısından bunu nasıl düşünüyorsunuz — özellikle telif hakkı ve tazminat gibi konularla ilgili?

BL: Tam olarak bunu Intuition'da çözüyoruz. Doğrulanabilir atıf primitiflerine sahip olduğunuzda, kimin ne veriyi oluşturduğunu bilirsiniz. Bu, bilginin tokenleştirilmiş sahipliğini sağlar — ve bununla birlikte, tazminatı da.

Bu nedenle verileriniz Google'ın sunucularında veya OpenAI'nin API'lerinde yaşamak yerine, merkeziyetsiz bir bilgi grafiğinde yaşamaktadır. Herkes, katkıda bulunduğu şeyi sahiplenir. Verileriniz bir AI çıktısında kullanıldığında veya gezildiğinde, oluşturduğu değerin bir kısmını alırsınız.

Bu önemlidir çünkü şu anda dijital köleleriz. En değerli kaynaklarımızı — zaman, dikkat ve yaratıcılık — başkalarının para kazandığı verileri üretmek için harcıyoruz. YouTube, videoları barındırdığı için değerli değildir; insanlar onu düzenlediği için değerlidir. Beğeniler, yorumlar veya abonelikler olmadan, YouTube değersizdir.

Bu yüzden herkesin ürettiği değerden kazanabileceği bir dünya istiyoruz — influencer ya da dışa dönük olsanız bile. Örneğin, sürekli olarak yeni sanatçıları buluyorsanız, zevkinizin bir değeri var. Bunun etrafında bir itibar inşa edebilmelisiniz ve bunu paraya çevirebilmelisiniz.

CN: Ama şeffaflık elde etsek bile, bu modellerin yorumlanması gerçekten zor. OpenAI kendisi bile modellerinin nasıl kararlar aldığını tam olarak açıklayamıyor. O zaman ne olacak?

BL: Harika bir nokta. Model davranışını tam olarak yorumlayamayız — çok karmaşıklar. Ama kontrol edebileceğimiz şey eğitim verisi. Bu bizim kaldıraçımız.

Bir örnek vereyim: Bir AI'nın baykuşlara takıntılı olduğu ve diğerinin matematikte harika olduğu bir araştırma makalesi duydum. Sadece matematikle ilgili görevlerde birlikte eğitim aldılar. Ama sonunda, matematik AI'sı da diğerinden desenleri emerek baykuşları sevmeye başladı.

Bu kalıpların ne kadar sinsi ve ince olduğuna inanılmaz. Bu nedenle tek gerçek savunma niyet. Bu modellere hangi verileri beslediğimiz konusunda kasıtlı olmalıyız. Bir şekilde “kendimizi iyileştirmemiz” gerekiyor, çevrimiçi ortamda daha otantik ve yapıcı bir şekilde var olmak için. Çünkü yapay zeka her zaman yaratıcısının değerlerini ve çarpıtmalarını yansıtacaktır.

CN: İş konuşalım. OpenAI nakit yakıyor. Altyapıları son derece pahalı. Intuition gibi merkeziyetsiz bir sistem nasıl rekabet edebilir — finansal ve teknik olarak?

BL: Sahip olduğumuz iki temel avantaj var: bileşenler arası uyum ve koordinasyon.

Merkeziyetsiz ekosistemler — özellikle kripto dünyasında — koordinasyonda son derece iyidir. Farklı bileşenler üzerinde çalışan, küresel, dağıtılmış ekiplerimiz var. Dünyayla savaşan bir şirketin milyarlarca dolar yakması yerine, birlikte uyum içinde çalışan yüzlerce katkı sağlayıcımız var ve birlikte birlikte çalışabilir araçlar inşa ediyoruz.

Bu bir mozaik gibi. Bir ekip ajan itibarı üzerinde çalışıyor, bir diğeri merkeziyetsiz depolama üzerinde, bir diğeri kimlik primitive'leri üzerinde — ve bunları bir araya getirebiliriz.

Bu süper güç.

İkinci avantaj kullanıcı deneyimidir. OpenAI kendi surlarına sıkışmış durumda. ChatGPT'den Grok veya Anthropic'e bağlamınızı taşımanıza izin veremezler — bu, savunulabilirliklerini zayıflatır. Ama biz tedarikçi kilitlenmesini umursamıyoruz.

Sistemimizde, bağlamınızı sahiplenebilecek, yanınıza alabilecek ve istediğiniz ajana bağlayabileceksiniz. Bu, daha iyi bir deneyim sağlar. İnsanlar bunu seçecek.

****CN:Altyapı maliyetleri hakkında ne düşünüyorsunuz? Büyük modeller çalıştırmak son derece pahalı. Daha küçük modellerin yerel olarak çalıştığı bir dünya görüyor musunuz?

BL: Evet, %100. Aslında bunun gittiğimiz yer olduğunu düşünüyorum — yerel olarak çalışan birçok küçük modelin, dağınık bir sürüde nöronlar gibi bağlandığı bir yere.

Bir tane büyük monolitik veri merkezinin yerine, milyarlarca tüketici cihazı hesaplama katkısında bulunuyor. Eğer onları koordine edebilirsek — ki kripto bunun üstesinden geliyor — bu, üstün bir mimari haline gelir.

Ve bu yüzden aynı zamanda ajan itibar katmanları inşa ediyoruz. Talepler, işi yapacak doğru uzman ajana yönlendirilebilir. Her şeyi yapacak tek bir büyük modele ihtiyacınız yok. Sadece milyonlarca ajan arasında görev yönlendirmesi için akıllı bir sisteme ihtiyacınız var — tıpkı bir API katmanı gibi.

CN: Determinizm hakkında ne dersiniz? LLM'ler, kesin cevaplar istediğiniz matematik gibi görevler için pek iyi değil. Deterministik kodu AI ile birleştirebilir miyiz?

BL: İstediğim bu. Döngüye determinizmi geri getirmemiz gerekiyor.

Sembolik akıl yürütmeye başladık — tamamen belirleyici — ve ardından derin öğrenmeye, yani belirleyici olmayan bir alana hızlı bir geçiş yaptık. Bu, şu anda gördüğümüz patlamayı sağladı. Ancak gelecek, en iyi ikisini birleştiren nörosimbolik olacak.

AI'nın bulanık akıl yürütmeyi ele almasına izin verin. Ancak, kesinliğe ihtiyaç duyduğunuz yerlerde belirleyici modüllerin - betikler, fonksiyonlar, mantık motorları - tetiklenmesine de izin verin. Düşünün: “Hangi arkadaşım bu restoranı seviyor?” Bu %100 belirleyici olmalıdır.

****CN:Uzaklaşmak: Şirketlerin operasyonlarına AI entegre ettiklerini gördük. Ancak sonuçlar karışık oldu. Mevcut LLM'lerin gerçekten verimliliği artırdığını düşünüyor musunuz?

BL: Kesinlikle. Tekillik zaten burada — sadece düzensiz bir şekilde dağıtılmış.

Eğer iş akışınızda özellikle kod veya içerik için yapay zeka kullanmıyorsanız, diğerlerinin hızının çok altında çalışıyorsunuz. Teknoloji gerçek ve verimlilik kazançları muazzam. Bozulma zaten gerçekleşti. İnsanlar henüz tam olarak farkına varmadılar.

CN: Son soru. Birçok insan bunun bir balon olduğunu söylüyor. Girişim sermayesi azalmış durumda. OpenAI para yakıyor. Nvidia kendi müşterilerini finanse ediyor. Bu nasıl sona erer?

BL: Evet, bir balon var — ama teknoloji gerçek. Her balon patlar, ama geride kalanlar temel teknolojilerdir. Yapay zeka bunlardan biri olacak. Aptal para — gerçek yenilik olmadan sadece ambalaj uygulamaları — temizleniyor. Ama derin altyapı ekipleri? Onlar hayatta kalacak.

Aslında, bu iki şekilde gidebilir: Yumuşak bir düzeltme yaşar ve gerçeğe döneriz, ama ilerleme devam eder. Ya da, verimlilik artışları o kadar büyük olur ki, yapay zeka ekonomide deflasyonist bir güç haline gelir. GSYİH, çıktı kapasitesinde 10 kat veya 100 kat artabilir. Eğer bu olursa, harcama buna değdi — bir toplum olarak seviyemizi yükseltiriz.

Her şekilde, iyimserim. Evet, kaos ve iş kaybı olacak — ama aynı zamanda doğru temeli oluşturursak, bol ve kıtlık sonrası bir dünya potansiyeli de var.

ON-13%
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Repost
  • Share
Comment
0/400
No comments
  • Pin
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate App
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)