Habertürk
    Takipde Kalın!
      Günlük gelişmeleri takip edebilmek için habertürk uygulamasını indirin
        Tubitak Ansiklopedi Oyun Teorisi Nedir?

        Aktörlerin tercihlerini ve etkileşimini matematiksel bir şekilde modelleyerek inceleyen bir yöntemdir. Rasyonel tercih kuramının temelini oluşturan bireysel rasyonellik anlayışı ve John Nash tarafından geliştirilmiş olan Nash dengesi prensibi üzerine kurulmuştur. Bir oyunu oluşturan öğeler oyuncular (aktörler), oyuncuların seçebilecekleri eylemler ve bütün oyunda bu eylemleri tanımlayan stratejiler, oyuncuların sahip oldukları bilgilerin yapısı ve oyuncuların mümkün olan sonuçlar hakkında sahip oldukları tercih sıralamalarıdır (tercih ya da fayda fonksiyonları). Nash dengesi prensibine göre her aktör diğer aktörün (ya da aktörlerin) seçebileceği stratejileri göz önünde bulunduracak, bir stratejinin diğer aktör (ya da aktörler) tarafından seçilmesi durumunda kendi stratejilerinden hangisinin kendi tercihleri arasında mümkün olan en iyi tercihe ulaştıracağını belirleyecek, iki (ya da her) aktörün de en iyi karşılık olarak belirleyeceği stratejiler Nash dengesini oluşturacaktır. Nash dengesi olarak ulaşılan sonuçların sosyal yaşantıda görmeyi beklediğimiz olgulara denk gelmesi beklenilmektedir. Örneğin "mahkûmlar açmazı" oyunu bireyler arasında iş birliğinin görülmediği durumları açıklamaktadır. Bu oyunda birbirleriyle iş birliği yaptıkları sonuç iki oyuncu tarafından da Nash dengesi sonucuna tercih edilmektedir ama Nash dengesi olarak ulaşılamamaktadır. İki oyuncunun da iki stratejisi bulunmaktadır: iş birliği yapmak ya da yapmamak. İki oyuncu aynı anda karar verecek, dolayısıyla diğer oyuncunun verdiği kararı gözlemleyemeyecektir. Oyunda dört farklı sonuç mümkündür: İki oyuncunun da iş birliği yapması, birinci oyuncu işbirliği yaparken ikinci oyuncunun verdiği sözden geri dönmesi (birinci oyuncu için en çok ceza), ikinci oyuncu işbirliği yaparken birinci oyuncunun verdiği sözden geri dönmesi (birinci oyuncu için en az ceza), iki oyuncunun da verdikleri sözden geri dönmeleri. Her oyuncu için tercihler şu şekilde sıralanmaktadır: yalnız kendisinin sözünden geri dönmesi, iki oyuncunun da iş birliği yapması, iki oyuncunun da işbirliği yapmaması, yalnız kendisinin işbirliği yapması. Bu durumda karşısındaki oyuncunun iş birliği yaptığını düşündüğünde işbirliği yapmamak oyuncuyu daha çok tercih edeceği sonuca ulaştıracaktır. Karşısındaki oyuncunun iş birliği yapmadığını göz önünde bulundurduğunda yine işbirliği yapmamak oyuncuyu daha çok tercih edeceği sonuca ulaştıracaktır. Her iki oyuncunun da iş birliği yapmaması oyunun tek Nash dengesini oluşturacaktır. Bir oyuncunun diğer oyuncunun kararlarını gözlemleyebildiği ya da diğer oyuncunun tercihleri hakkında belirsiziğe sahip olduğu oyunların analizinde ise Nash denge prensibini geliştiren denge kavramları kullanılmaktadır.

        Ödül, bireyin göstermesi beklenen davranışın sıklığını arttırmak için olumlu veya olumsuz pekiştireçler yoluyla ona sunulan geri bildirimler; ceza ise uygunsuz davranışın sıklığını azaltmak için üzüntü, acı veya sıkıntı verici, onaylamayan, kısıtlayıcı geri bildirimler olarak tanımlanır. Söz konusu cezalar, maddi ve fiziki olabileceği gibi manevi ve sözel de olabilir. İnsanda takdir edilme ve onaylanma duygusu, doğuştan olup insanlar yergiden değil, övgüden hoşlanır; başarılarının da başkaları tarafından fark edilmesini ve tanınmasını bekler.

        Etimolojik olarak Moğolca bir fiilden türetilmiş olan "ödül", verilen şey demektir. "Ceza" ise Arapça kökenli olup herhangi bir eylemin karşılığı olarak verilen şey anlamında Türkçedeki hem ödül hem de ceza karşılığındadır. Hemen her kurum ve meslek alanıyla ilgili olarak disiplinle ilgili olduğu kadar ödüllendirmeyle ilgili de mevzuat düzenlemeleri vardır. Eğitim kurumları için de bununla ilgili düzenlemeler ve yönetmelikler vardır. 

        Eğitimde ödül ve ceza, eğitim ve öğrenme psikolojisinde pekiştirme ve pekiştireç kavramları bağlamında tartışılır. Eğitimde olumlu pekiştirme, istenilen davranışın sıklığını arttırmak için öğrenciye hoşuna giden bir uyarıcı verilmesidir. Olumlu pekiştirme, bir tür ödüllendirmedir. Olumsuz pekiştirme ise istenilen bir davranışı gösterdiğinde kişinin hoşuna gitmeyen, rahatsız edici veya acı verici uyaranın ortadan kaldırılmasıdır.

        Olumlu veya olumsuz pekiştirmede kullanılan uyaranlara pekiştireç denir. İlgili literatürde birincil ve ikincil pekiştireçler olmak üzere iki tür pekiştireçten söz edilir. Birincil pekiştireçler, biyolojik temelli ihtiyaca karşılık gelen uyarıcılardır. Yiyecek, su, oksijen veya elektrik şoku, birincil pekiştireçlere örnek olup bunlar, klasik şartlanma yaklaşımında şartsız uyarıcı olarak adlandırılır. İkincil pekiştireçler ise birincil pekiştireçlere ulaştıran sembolik, sosyal ve etkinlik olarak üç türdür. Sosyal yakınlık, para veya oyun oynama gibi uyaranlar, ikincil pekiştireçlerdendir. 

        Ceza, istenmeyen bir davranışın gösterilme sıklığını azaltmak üzere kişiyi hoşuna gitmeyen bir uyarıcıya maruz bırakmak ya da hoşuna giden bir uyarandan mahrum etmektir. Ceza da birinci tip veya ikinci tip olmak üzere iki kısımda incelenebilir. Birinci tip ceza, biyolojik temelli olan rahatsız edici (elektrik şoku gibi) uyarıcılardır. İkinci tip ceza ise istenmeyen bir tepkiye karşılık öğrencinin hoşuna giden bir uyarandan mahrum bırakılmasıdır Hem birinci tip hem de ikinci tip cezada, birincil veya ikincil pekiştireçler kullanılabilir.

        Eğitimde ödül veya ceza ile ilgili en önemli noktalardan biri bitişiklik ilkesidir. Gerek kişide istenilen bir davranışın sıklığını arttırmak için olumlu veya olumsuz pekiştireç kullanılsın gerekse birinci veya ikinci tip ceza kullanılsın, önemli olan bunların davranışın gösterilmesinden hemen sonra bireye sunulmasıdır. Davranış ile pekiştirme veya ceza arasındaki zaman dilimi uzadıkça, bunların etkililiğinin de azalması beklenir.

        YAZAR

        Nevzat Tarhan