CEİD

Bu proje Avrupa Birliği tarafından finanse edilmektedir.

TÜRKİYE'DE KATILIMCI DEMOKRASİNİN GÜÇLENDİRİLMESİ:
TOPLUMSAL CİNSİYET EŞİTLİĞİNİN İZLENMESİ PROJESİ

Bazı gerçek dünya verilerindeki şaşırtıcı derecede kullanışlı matematiksel kalıplar

Borsa piyasası fiyatlarından ev numaralarına kadar, belirli rakam koleksiyonları düşündüğünüz kadar rastgele değil, diyor Katie Steckles

Elektronik Stok Veri Kurulu.

“Borsa fiyatlarına bakın ve paterni görebilirsiniz…”

Bir gazetenin ön sayfasına bakacak olsaydınız, muhtemelen çok fazla sayı içerdiğini görürsünüz: para miktarları, nüfus boyutları, uzunluk veya alan ölçümleri. Tüm bu numaraları çıkardıysanız ve bir listeye koyduysanız, rastgele sayılardan oluşan bir koleksiyonunuz olur.

Ancak bu sayılar düşündüğünüz kadar rastgele olmazdı. Gerçek dünya verilerinde, nakit toplamları veya binaların yükseklikleri gibi, herhangi bir sayıdaki ilk basamağın şaşırtıcı bir şekilde 1 olması muhtemeldir. Rakamlar gerçekten rastgele olsaydı, 1/9 civarında 1 ile yaklaşık 1 ile başlayacaktır, ancak pratikte daha çok üçte biri gibidir. Sakat 9’un, yaklaşık 1/20’si meydana gelen ve diğer rakamlar aralarında bir eğri takip etmesi en düşük olanı en az yönlendirir.

Benford Yasası olarak bilinen bu model, belirli veri kümelerinde – özellikle değerlerin belirtilmemiş bir geniş aralıktan çizildiği olan bazı veri kümelerinde ilk basamakların yaygın olarak gözlemlenen bir dağılımıdır. Bunun insan yükseklikleri (sayıların hepsi küçük bir aralıkta yattığı yer) veya tarihler (sayının alabileceği değerler üzerinde kısıtlamalar olduğu) gibi şeylerle olduğunu görmüyorsunuz.

Ancak bir grup insandan banka hesaplarındaki para miktarını kontrol etmesini veya ev numaralarını vermesini veya borsa fiyatlarını (resimde) arayarak, deseni görebilirsiniz – bunların hepsi birkaç büyüklük siparişini sürdürebilecek sayılardır. Bazı sokakların sadece birkaç evi vardır, bazıları ise yüzlerce vardır. Bu yüzden fenomen meydana gelir.

Dokuz özelliğe sahip bir sokak hayal edin: Her basamaktan başlayan ev numaralarının oranı dokuz yönlü bir bölünme olacaktır. Ancak 19 evi olan bir sokakta, yarısından fazlası 1 ile başlar. Bu iki uç, ev sayısını arttırdıkça ortaya çıkmaya devam ediyor: 100 ile her bir başlangıç ​​basamağının kabaca eşit sayıları vardır; Bunu 200’e yükseltin ve yine yarısı 1 ile başlar.

Gerçek dünya verilerinin her öğesi bilinmeyen bir boyuttan geldiğinden, 1 ile başlayan bir sayının ortalama olasılığı bu iki değer arasında bir yerde olur. Benzer hesaplamalar diğer basamaklar için yapılabilir ve bu bize her birinin göründüğü genel frekansı verir. Etki en çok büyük veri koleksiyonlarında görülebilir.

Bunun yararlı olmasının bir nedeni, verilerin sahte olduğunda size bir ipucu vermesidir. Bir dizi işletme hesabına bakarsanız, satış rakamlarında Benford benzeri dağıtımlar bulmayı beklersiniz. Ancak birisi rastgele sayılar seçerek veri üretmişse, ilk basamakların frekanslarını çizdiğinizde, karakteristik eğriye sahip olmaz. Bu, adli muhasebecilerin şüpheli aktiviteyi tespit etmek için kullandıkları bir hiledir.

Bir dahaki sefere hesaplarınızı kontrol ettiğinizde veya nehirlerin uzunluklarını karşılaştırdığınızda, kaç sayının 1 ile başladığına dikkat edin – Benford Yasası’nı çalışırken görmüş olabilirsiniz!

Katie Steckles, Manchester, İngiltere merkezli bir matematikçi, öğretim görevlisi, YouTuber ve yazardır. Ayrıca CEİD’in bulmaca sütunu Braintwister’ın danışmanıdır. Onu takip et @stecks

Diğer projeler için Newscientist.com/maker adresini ziyaret edin.