Alan öncesi İnternet'i kirletmeden önce korumalı mıyız? - Haberler

2022’den bu yana AI tarafından üretilen içeriğin yükselişi, bilginin ne zaman yalnızca insanlar tarafından üretildiğini bilmeyi imkansız hale getiriyor, bu da hem gelecekteki AI hem de tarihçiler için bir sorun olabilir

Wikipedia zaten büyük AI girişi belirtileri gösteriyor

AI Chatbots’un gelişi, tarihsel bir bölme çizgisini işaret ediyor, ardından çevrimiçi materyalin insan yaratılmasına tamamen güvenilemez, ancak insanlar bu değişikliğe nasıl bakacaklar? Bazıları acilen AI-öncesi dönemden gelen “kirlenmemiş” verileri arşivlemek için çalışırken, diğerleri bunun kaydetmemiz gereken AI çıktıları olduğunu söylüyor, böylece gelecekteki tarihçiler chatbotların nasıl geliştiğini inceleyebilirler.

Rajiv Pant, her ikisinde de girişimci ve eski baş teknoloji görevlisi New York Times Ve Wall Street JournalAI’yı tarihsel kaydın bir parçasını oluşturan haber hikayeleri gibi bilgiler için bir risk olarak gördüğünü söylüyor. Pant, “Chatgpt’in başlatıldığından beri bu ‘dijital arkeoloji’ problemini düşünüyorum ve her ay daha acil hale geliyor” diyor Pant. “Şu anda, insan tarafından yazılan içeriği AI tarafından üretilen materyalden ölçeklendirmenin güvenilir bir yolu yok. Bu sadece akademik bir sorun değil, gazetecilikten yasal keşiften bilimsel araştırmaya kadar her şeyi etkiliyor.”

John Graham için siber güvenlik firması Cloudflare’de, Chatgpt’in başlatıldığı 2022’nin sonundan önce üretilen bilgiler, düşük sırt çeliğine benziyor. 16 Temmuz 1945’te Trinity nükleer bomba testinden önce eritilmiş olan bu metal, hassas bilimsel ve tıbbi araçlarda kullanılmak üzere ödüllendirilmiştir, çünkü okumalarda gürültü oluşturan atomik silah döneminden hafif radyoaktif kontaminasyon içermez.

Graham-Cumming, AI tarafından kontamine edilmemiş veri kaynaklarını arşivlemek için Lowbackgroundsteel.ai adlı bir web sitesi oluşturdu, örneğin Ağustos 2022’den itibaren Wikipedia’nın tam olarak indirilmesi. Çalışmalar, Wikipedia’nın bugün büyük AI girdisi belirtileri gösterdiğini göstermiştir.

“Her şeyi kendimiz yaptığımız bir nokta var ve sonra bir noktada bu sohbet sistemleri tarafından önemli ölçüde artırılmaya başladık” diyor. “Yani fikir söylemekti – onu kontaminasyon olarak görebilirsiniz ya da bir tür tonoz olarak görebilirsiniz – bilirsiniz, insanlar, buraya geldik. Ve sonra bu noktadan sonra ekstra yardım aldık.”

Mark Graham, 1996’dan beri halka açık internete arşivleyen bir proje olan İnternet Arşivi’nde Wayback makinesini yürütüyor, her gün 160 terabayt yeni bilgi mağazaları göz önüne alındığında, veri arşivleme çabalarının etkinliği konusunda şüpheci olduğunu söylüyor.

Graham, AI-Pre-internet’i korumak yerine, gelecekteki araştırmacılar ve tarihçiler için AI çıktısı arşivleri oluşturmaya başlamak istiyor. Günlük sohbet botları günde 1000 topikal soru sormaya ve yanıtlarını saklamaya başlama planı var. Ve bu çok büyük bir görev olduğu için, bunu yapmak için yapay zeka bile kullanacak: AI, gelecekteki insanların merakı için yapay zekanın değişen çıktısını kaydetmek.

“Buna belirli bir soru soruyorsunuz ve sonra bir cevap alıyorsunuz” diyor Graham. “Ve sonra yarın aynı soruyu soruyorsunuz ve muhtemelen biraz farklı bir cevap alacaksınız.”

Graham-cumming, Ai karşıtı olmadığını ve insan tarafından oluşturulan bilgileri korumanın aslında AI modellerine fayda sağlayabileceğini belirtmek için hızlıdır. Bunun nedeni, yeni modellerin eğitilmesine geri dönen düşük kaliteli AI çıktısının zararlı bir etkisi olabilir ve bu da “model çökmesi” olarak bilinen şeye yol açabilir. Bundan kaçınmanın değerli bir çaba olduğunu söylüyor.

Graham-Cumming, “Bir noktada, bu AI’lerden biri insanların düşünmediğimiz bir şey düşünecek. Matematiksel bir teorem kanıtlayacak, önemli ölçüde yeni bir şey yapacak. Ve bu kontaminasyon diyeceğimden emin değilim” diyor.