CCC, NTIA'nın Yaygın Olarak Kullanılabilen Model Ağırlıklarına Sahip Çift Kullanımlı Temel Yapay Zeka Modelleri Hakkında Bilgi Talebine Yanıt Verdi » CCC Blogu

CCC, NTIA'nın Yaygın Olarak Kullanılabilen Model Ağırlıklarına Sahip Çift Kullanımlı Temel Yapay Zeka Modelleri Hakkında Bilgi Talebine Yanıt Verdi » CCC Blogu

Geçtiğimiz hafta CCC, Ulusal Telekomünikasyon ve Bilgi İdaresi'nin çağrısına yanıt verdi. Yaygın Olarak Kullanılabilen Model Ağırlıklarına Sahip Çift Kullanımlı Temel Yapay Zeka Modelleri Hakkında Bilgi Talebi. CCC'nin kendi üyesi Daniel Lopresti (CCC Başkanı ve Lehigh Üniversitesi) ve David Danks (CCC İcra Komitesi ve Kaliforniya Üniversitesi, San Diego), bilgisayar topluluğunun diğer birkaç üyesiyle birlikte bu yanıtın yazılmasına yardımcı oldu. Bu yıl CCC sponsorluğundaki AAAS panelinde konuşan Markus Buehler (Massachusetts Teknoloji Enstitüsü) ve Duncan Watson-Parris (Kaliforniya Üniversitesi, San Diego), şu başlıkla konuştu: Bilimde Üretken Yapay Zeka: Vaatler ve TuzaklarCCC'ye katılan Casey Fiesler (Colorado Üniversitesi, Boulder) ile birlikte her ikisi de RFI yanıtına katkıda bulundu. Sosyal Teknoloji Araştırmalarının Geleceği Kasım ayında atölye.

Yanıtlarında yazarlar, RFI'den gelen birkaç özel soruya odaklandılar; bunlardan biri, model ağırlıklarının yaygın olarak kullanılabilir hale getirilmesiyle ilişkili risklerin, kamuya açık olmayan model ağırlıklarıyla ilişkili risklerle karşılaştırıldığında nasıl olduğunu sordu. Yazarlar, üretken modellerle ilişkili risklerin çoğunun, model ağırlıklarının yaygın olarak kullanılabilir hale getirilmesiyle minimum düzeyde daha da kötüleştiğini belirtti. Üretken modellerle ilgili risklerin çoğu, kullanıcı girdilerine dayalı olarak muazzam miktarda inandırıcı içeriği hızlı bir şekilde üretme kapasiteleri ve neredeyse sınırsız uygulama alanları nedeniyle bu modellerin doğasında vardır. Model ağırlıklarının kamuya açık hale getirilmesi, üretken modellerin işlevselliğini etkilemez ve bu nedenle, ağırlıkların yaygın olarak kullanılabilir hale getirilmesinin, halihazırda özel veya kapalı sistemlerle yapılabileceklerin ötesinde önemli ek riskler yarattığına dair şu anda çok az kanıt bulunmaktadır. Tescilli modellerin ağırlıkları geniş çapta kullanılabilir hale getirilirse potansiyel olarak daha da kötüleşebilecek bir risk, eğitim verilerinin açığa çıkma olasılığıdır. Model ağırlıklarının eğitim verilerini ortaya çıkarmak için tersine mühendislik yapılması pek olası değildir, ancak bunun matematiksel olarak imkansız olduğu da gösterilmemiştir. Ancak cevabımızda, üretken modellerin halk tarafından yoğun bir şekilde kullanılmaya devam etmesi muhtemel olduğundan, bizce en büyük risklerin temsili temel modellere ağırlık verilmemesinden kaynaklandığını vurguladık. Araştırmacıların ve ilgili topluluk üyelerinin özel modeller için bazı model ağırlıklarına erişimini engellemek, toplumun bu modellerin nasıl işlediğini ve daha kapsayıcı ve erişilebilir modellerin nasıl tasarlanacağını daha iyi anlamasını engelleyecektir.

Kapalı modellerin piyasaya sürülmesi uygulamasının sürdürülmesi, teknolojideki çeşitlilik eksikliğini sürdürmeye devam edecek ve büyük teknoloji şirketlerinin yürütmeye teşvik edilmediği bu modellerin önyargı denetimleri gibi belirli türdeki araştırmaların yürütülmesini engelleyecektir. Geleceğin işgücünün eğitimi bir başka inanılmaz derecede önemli husustur. Amerika Birleşik Devletleri, gelecek nesil geliştiricileri lisansüstü ve lisansüstü eğitimde bu tür modeller konusunda eğitmeden, üretken yapay zeka alanında liderliği sürdürmeyi umut edemez. Öğrencilerin, temel işlevlerini anlamak ve yeni modeller geliştirirken etik hususları nasıl dahil edeceklerini öğrenmek için eğitimleri sırasında bu modelleri keşfedebilmeleri önemlidir. Gelecek nesli eğitecek araçlara yalnızca büyük teknoloji şirketlerinin sahip olmasına izin vermek aynı zamanda silolanmış düşünceye de yol açabilir ve bu kuruluşlar, bu modellere erişimin daha verimli bir ihtiyaç duyulduğunda öğrenme çerçevesi lehine sağlayabileceği bütünsel bir eğitimi gözden kaçırabilir. Yanıtımızda, bu modellerin gelişimini çevreleyen bir açıklık kültürü oluşturmanın önemini de vurguladık ve böyle bir kültür oluşturmanın, bu teknolojileri düzenlemek kadar önemli olabileceğini vurguladık. Teknoloji şirketlerinin üretken modelleri şeffaf bir şekilde oluşturması beklentisi varsa gelecekteki düzenlemelerin yapılması çok daha kolay hale gelir.

Son olarak CCC, kamuoyunun bu modellerin gerçekte nasıl işlediği ve çıktıları sonuçlara nasıl ulaştığı konusundaki mevcut bilgi eksikliğine işaret ederek, temel modeller üzerinde ek araştırmalara ihtiyaç olduğunu vurguladı. Yanıtımızda, araştırmacıların, bilim adamlarının, akademisyenlerin ve sosyal konulardaki uzmanların, endüstrinin şu anda kullanmakta olduğu büyük temel modellerine ihtiyaç duydukları açık erişimi almaları koşuluyla yanıtlamaya hazır oldukları bir dizi yanıtlanmamış araştırma sorusunu listeledik. . Toplum olarak başarımızın devam etmesi buna bağlıdır.

CCC yanıtının tamamını buradan okuyun.

Zaman Damgası:

Den fazla CCC Blogu