Konya Bilim Merkezi BilimUp

Kelimelerin Kullanım Sıklığındaki Akıl Almaz Orantı: Zipf Yasası

Dilara Güven
4 dk
1793

Gündelik yaşantımızda bazı kelimeleri çok sıklıkla tekrar eder, kullanırız. Bazılarını kelimeleri ise hiç kullanmaz hatta bilme gereği dahi duymayız. Fakat tüm kelimeleri düşündüğümüzde, kullanılan en sık kelimenin, en sık kullanılan ikinci kelimeye oranla iki kat daha fazla olduğunu biliyor muydunuz? Bu durum, "Zipf Yasası" olarak adlandırılmaktadır.

Zipf Yasası Nedir?

Harvard Üniversitesi'nde çalışmalar yapmış olan Amerikalı dilbilimci George Kingsley Zipf, kelimelerin tekrarlanma sıklığının ne düzgün ne de eşit dağıldığını, bunun yerine kelimelerin sıklık sırasıyla ters orantılı olduğunu gözlemlemiştir. 1932 yılında yayınladığı “Selected Studies of the Principle of Relative Frequency in Language” başlıklı makalesinde, hangi dilde yazılmış olursa olsun, bir metindeki kelimelerin kullanım sıklığı ile ilgili bir düzen olduğunu ortaya koymuştur. Zipf, James Joyce’un Ulysses adlı romanını incelediğinde yasanın geçerli olduğunu keşfetmiştir. Zipf, romanda en sık kullanılan birinci sözcüğün 8.000 defa, en sık kullanılan onuncu sözcüğün 800, en sık kullanılan yüzüncü sözcüğün 80, en sık kullanılan bininci sözcüğün ise 8 defa kullanıldığını tespit etmiştir. Yazmış olduğu makaleye göre; kelimelerin kullanım sıklığına bakıldığında, kelimeler sıralandığında birinci sıradaki kelimeler -yani en sık kullanılan kelimeler- ikinci sıradaki en sık kullanılan kelimelerin iki katı, üçüncü sıradaki kelimeler en sık kelimelerin üç katı, x sıradaki kelimeler en sık kullanılan kelimenin x katı olacak şeklinde sıralanmıştır. Literatüre “Zipf Yasası” olarak giren bu keşif, son derece ilginçtir.


Zipf Yasası ve Şehirlerdeki Nüfuslar

Yapılan yeni çalışmalar da göstermiştir ki; Zipf’in “Sıra Sıklık” adını verdiği bu kural, bir ülkenin şehirlerindeki nüfuslara da uygulanabilmektedir. Bir ülkedeki en kalabalık şehrin nüfusu, ikinci kalabalık sırada olan şehrin nüfusunun yaklaşık olarak iki katı kadar çıkmaktaydı. Günümüzde konuyla ilgili makalelere bakıldığı zaman da şehirlerin nüfusunun ortalama olarak bu yasaya uyduğu gözlemlenmektedir. Bu yasa elbette farklı alanlarda da karşımıza çıkmaktadır. Örneğin; depremler şiddetlerine göre, aydaki kraterler yarıçaplarına göre, makaleler aldıkları atıflara göre, şirketler gelirlerine göre sıralandıkları zaman çoğu oranlar Zipf Yasası’na uymaktadır. Tabii bu durumların tüm örneklerle kesin ve net olarak uyuştuğu anlamına gelmemektedir, her zaman istisnalar mevcuttur. Zipf Yasası, bir doğa yasası olmamakla beraber daha çok istatistiksel bir gözlemdir ve sık ​​görülebilmektedir.

Zipf Yasası Nasıl Gerçekleşir?

Zipf Yasası’nın nasıl gerçekleştiğine dair henüz net bir cevap bulunmamaktadır. Kimi araştırmacılara göre istatistiğe, kimi araştırmacılara göre ise insan zihnine dayandırılmaktadır. Hollanda, Nijmegen'deki Radboud Üniversitesi'nde dilbilimci olan Sander Lestrade’a göre, yasanın onlarca yıldır bilim insanları tarafından bilinmesine rağmen nedeninin hala çözülememiş olması Zipf Yasası’nı hesaplamalı dilbilimdeki en büyük gizem haline getirmiştir. Zipf, aslında “En az çaba ilkesi” ile bu durumu açıklamaya çalışmıştır. Çalışmasında, karar verirken en kolay görünen ya da en az çaba gerektiren yola başvurduğumuzu öne sürmüştür. Bu açıklamayı da dillerin insan kültürleri tarafından oluşturulmasına dayandırmıştır. Başka bir olası açıklama ise tercihli bağlanma kavramıdır. Örneğin; Google aramasında, bir web sitesi aylık kullanıcı veya sayfa görüntüleme açısından en üst sırada yer alırken, milyarlarca küçük web sitesi neredeyse hiç trafik almaz. Daha yüksek trafiğe sahip web sitelerinin arama motorları tarafından tavsiye edilme olasılıkları daha yüksek olduğu için daha fazla trafiğe sahip olma eğiliminde olduğunu hepimiz biliriz. Bunun sonucunda da popüler alan adları daha popüler hale gelir daha fazla okunma ve tıklanma alır. Zenginlerin daha zengin, gelir seviyesi düşük olan toplulukların ise daha da düşük seviyelere düşmesinin nedeni de aynıdır. Tercih edilene bağlanmak ve onu sık tekrar etmek, onu değiştirip yenilemekten daha kolay görünmektedir. 

Siz günlük hayatta kullandığınız kelimeler veya tüketim alışkanlıklarınızda en sık neleri tekrar ediyorsunuz? Bu tekrarları istatistik bir veri haline getirirseniz sizce Zipf Yasası'na uyar mı? 

Kaynakça

  1. Piantadosi ST. Zipf's word frequency law in natural language: a critical review and future directions. Psychon Bull Rev. 2014 Oct;21(5):1112-30. doi: 10.3758/s13423-014-0585-6. PMID: 24664880; PMCID: PMC4176592. 
  2. Mora T, Walczak AM, Bialek W, Callan CG Jr. Maximum entropy models for antibody diversity. Proc Natl Acad Sci U S A. 2010 Mar 23;107(12):5405-10. doi: 10.1073/pnas.1001705107. Epub 2010 Mar 8. PMID: 20212159; PMCID: PMC2851784. 
  3. Xavier Gabaix, Zipf's Law for Cities: An Explanation, The Quarterly Journal of Economics , Cilt 114, Sayı 3, Ağustos 1999, Sayfa 739–767, https://doi.org/10.1162/003355399556133 
  4. https://www.science.org/doi/abs/10.1126/science.1062081 
  5. Linders, G.M., Louwerse, M.M. Zipf’s law revisited: Spoken dialog, linguistic units, parameters, and the principle of least effort. Psychon Bull Rev (2022). https://doi.org/10.3758/s13423-022-02142-9 
Benzer Makaleler
Herkesten Üstün Olduğunu Zannetmek: Narsizm
Görgülü Kuşlar Neden Gördüğünü İşler?
“Öpeyim De Geçsin!” Sözü Bilimsel Bir Gerçekliğe Sahip Olabilir Mi?
“Her Şey Senin Kafanın İçinde!”: Dijital İletişimde Şiddet
Öfke Duygusu Hedefinize Ulaşmanızı Kolaylaştırır Mı?
Şarkılar Neden Aklımızda Bozuk Plak Gibi Çalıp Durur?
Nostalji Sevmeye Programlı Olabilir Misiniz?
Düzeni Sağlamak; Kırık Camlar Teorisi
Parkinson Yasası  Nedir?
Cahil Cesareti: Dunning-Kruger Sendromu
ANASAYFA
RASTGELE
KATEGORİLER
POPÜLER
EN YENİLER