Bölüm 27 Öğrenme Analitiği ve Eğitsel Veri Madenciliği Üzerine Eleştirel Bir Bakış

Rita Kop1, Helene Fournier2, Guillaume Durand2

1Eğitim Fakültesi, Yorkville Üniversitesi, Birleşik Krallık

2Bilgi ve İletişim Teknolojileri, Kanada Ulusal Araştırma Konseyi, Kanada

DOI: 10.18608/hla17.027

ÖZ

Eğitsel veri madenciliği (EVM) ve öğrenme analitiği (ÖA; Fournier, Kop ve Durand, 2014) hakkındaki son yazımızda, nicel ve nitel analiz araçlarının kullanılabilirliği ile ilgili yayınların henüz mevcut olmadığı ve öğrenenlere öz-yönetimli öğrenme yolculuklarında yardımcı olabilecek daha fazla araştırmanın yararlı olacağı sonucuna varmıştık. Bahsi geçen araştırmalardan bazılarının tekrar edilmesi hayal kırıklığına yol açan sonuçlar verse de bu yayınlardan bazıları gerçekleştirilmiştir. Bu bölümde, eğitim ve öğrenim ortamlarının sonuçlarını ölçmek ve talep etmek için EVM’nin ve ÖA’nın geçerliliği konusunda eleştirel bir tutum sergiliyoruz. Ayrıca, deneysel öğrenme modellerinin yanlışlıklarını göstermek için EVM’nin nasıl kullanılabileceğini de rapor edeceğiz. Araştırılacak diğer boyutlar; öğrenmede insan faktörleri, bu faktörlerin EVM ve ÖA ile ilişkileri ve açık öğrenme ortamlarındaki araştırmalarda “Büyük Veri”yi kullanma etiğidir.

Anahtar Kelimeler: Eğitsel veri madenciliği (EVM), büyük veri, algoritmalar, rastlantı

Son on yıl içinde eğitim ve öğretim teknolojisi alanı sıra dışı bir değişim ve gelişim göstermektedir. Eğitim alanında yapılan geçmiş araştırmalar; öğrenen, öğreten ve kurs içeriklerinden oluşan bir eğitim üçgeniyle ilişkiliyken (Kansanen ve Meri, 1999; Meyer ve Land, 2006) yeni geliştirilen teknolojiler öğrenmeyi etkileyen diğer boyutlara vurgu yapmaktadır. Örneğin, öğrenme bağlamı veya öğrenme ortamı ve kullanılmakta olan teknolojiler (Bouchard, 2013). Fenwick (2015a), insanların ve kullandıkları teknolojilerin birbirinden bağımsız değerlendirilemeyeceğini şu şekilde iddia etmektedir: “Materyal ve sosyal güçler, eğitim süreçlerinin ve etkinliklerinin ortak oluşumunu nasıl değerlendirmemiz gerektiği hususunda önemli uygulamaları kapsayacak şekilde iç içedirler” (s. 14). İnsanlar ve teknoloji gibi materyaller arasında sadece bir etkileşim değil, aynı zamanda birlikte yaşayan bir ilişki vardır.

Yeni teknolojiler bizi bilgi kıtlığı çağından, bilgi bolluğu çağına taşımıştır (Weller, 2011). Artık sosyal medya, ağlar üzerinden küresel ölçekte, tuğla duvarlarla sınırlanan geleneksel sınıf dışında iletişim kurmayı mümkün kılıyor. Bu kadar küresel bir ölçekte iletişim, çok uzun zaman önce düşünülemezdi. Veri ve veri depolama, gelişen teknolojilerin etkisi altında gelişmiştir. Veri toplamak ve veritabanına kaydetmek yerine, şimdi algoritmalar ve makine öğrenimi kullanılarak temsil edilip görselleştirilebilen bulutta depolanan büyük veri akışlarıyla ilgileniyoruz. Bu veriden öğrenmek için ilginç fırsatlar sunar, bununla birlikte gizli kavrayışları ve aynı zamanda önemli zorlukları ortaya çıkarır.

Eğitim sürecindeki paydaşların -öğrenciler, eğitimciler ve yöneticiler- tüm bu bilgi seviyelerini etkili bir şekilde erişebilmelerini, yönetebilmelerini ve anlamlarını sağlayabilecekleri ile ilgili sorular sorulmuştur. Bilgisayar bilimciler, tam olarak bunu yapabilen otomatik veri filtreleme ve analizi için fırsatlar önermiştir: mevcut tüm verileri elden geçirin ve öğrenenlere bağlantılar sağlayın ve tercih ettikleri bilgiler, insanlar ve araçlar için tavsiyeler ve bunu yaparken öğrenim deneyimini kişiselleştirin ve öğrenenlerin öğrenmelerinin yönetimi ve derinleştirilmesinde öğrenenlere yardımcı olun (Siemens, Dawson ve Lynch, 2013). Ayrıca, öğrenenlerin etkinliklerinin geride bıraktığı izlerden elde edilen verilere erişilerek büyük kurumsal veri kümeleri kullanan araştırma örnekleri de ortaya çıkmaktadır. (Xu ve Smith Jaggars, 2013).

Değişimlerin tartışılmasında büyük veriler profesyonel uygulamaya zorlayabilir, örneğin Fenwick (2015b), karar verme açısından “bilginin azaltılmasını vurgulamaktadır. Veri analitiği yazılımı sorunların teknik olduğu, bilinebilir, ölçülebilir parametrelerden oluştuğunu ve teknik hesaplama yoluyla çözülebileceği basit öncülleri ile çalışır. Etik ve değerlerin karmaşıklığı, belirsizliklerin ve gerilimlerin, kültürün ve politikaların ve hatta verilerin toplandığı bağlam dikkate alınmaz ”(s. 70).

Bu önemli bir konudur. Ayrıca, verileri içeren mevcut gelişmeler uygulandığında, günlük pratiğimizi tam olarak anlaşılamayacak şekillerde değiştirebileceğini vurgulamaktadır. Örneğin, karşılaştırma ve tahminde bir bağımlılık olduğunda ortaya çıkan eşitlik sorunlarına dikkat çekmektedir (Fenwick, 2015b). Ayrıca, onun araştırması, potansiyel eğitimcilere ve eğitim araştırmacılarına öğretilen araştırma metodolojilerinin, uygulamalarını geliştirmek için mevcut büyük veri kümeleriyle başa çıkmada tamamen yetersiz olduğu sonucuna varmıştır. Ayrıca, “profesyonel eylemliliğin ve hesap verilebilirliğin seviyesini” merak etmektedir. Çok fazla veri birikimi ve hesaplaması otomatikleştirilmiştir, bu da algoritmaların özerkliği ve kötü şeyler olduğunda sorumluluğu üstlenmek hakkında yeni sorular ortaya çıkarmaktadır ”(s. 71). Bunlar dikkatle düşünülmesi gereken ciddi sorulardır. Bu bölüm, araştırmalarda büyük veri kümelerini ve öğrenene destek için kullanıcı verilerini kullanan eğitsel veri madenciliği ve analitiği ile ilgili bazı zorlukları ele alacaktır. Aynı zamanda otomasyonun etkisini ve teknolojiyle öğrenmede insan iletişiminin ve katılımının değiştirilmesiyle makineleşmenin olası etkilerini de araştıracaktır.

ÖĞRENME YÖNETİMİNDE EĞİTSEL VERİ MADENCİLİĞİ FIRSATLARI

Güvenilirlik ve Geçerlilik

Eğitsel veri madenciliği (EVM), eğitim ortamlarından gelen benzersiz veri türlerini araştırmak için yöntemler geliştirmekle ve öğrencilerin ve öğrendikleri ortamları daha iyi anlamak için bu yöntemleri kullanmakla ilgilenen bir disiplindir (Ed Tech Review, 2016). Eğitsel veri madenciliği, adından da daha geniş bir kapsamı ifade etmekte olup bilgi getirimi ve öğrenme mekanizmalarının daha iyi anlaşılması için eğitim verilerinin araştırılmasından da öte bir anlamı ifade etmektedir. Bu nedenle, EVM aynı zamanda geçerlilik, tekrar üretilebilirlik ve genelleştirilebilirlik ile ilgili bilimsel kaygılarla yönetilen istatistiksel yaklaşımları kullanarak makine öğrenmesini ve istatistiksel yaklaşımları kullanarak öğrenen davranışlarını tahmin etmek için yöntemler ve modeller geliştirmeyi amaçlamaktadır.

Öğrenme analitiği (ÖA), EVM alanıyla yakından ilgilidir ve öğrenmeyi ve gerçekleştiği ortamları anlamak ve optimize etmek amacıyla öğrenenler ve bağlamları hakkındaki verilerin ölçümü, toplanması, analizi ve raporlanması ile ilgilidir (Long ve Siemens, 2011). Öğrenme sürecini arttırmak için EVM teknikleri ve ÖA kullanılır. Bunlar etkili öğrenci desteği sağlanmasına yardımcı olma konusunda ümit verici görünmektedir ve bu yeni gelişmelerin eğitimi ve öğrenmeyi artıracağı vaadine rağmen, önemli zorluklar da tespit edilmiştir.

Bir ölçüde, EVM sadece dünyanın dört bir yanından araştırmacıların üretken katkılarından dolayı gelişen bir araştırma alanı değil aynı zamanda bir bilimdir. Son zamanlarda, İngiltere Bilim Konseyi bilimi “kanıtlara dayalı sistematik bir metodoloji izleyerek doğal ve sosyal dünyanın bilgi ve anlayışı peşinde olmak” olarak tanımlamıştır (British Science Council, 2009). Kanıt, diğer herhangi bir bilimsel alanda olduğu gibi alanda yapılan herhangi bir iddia için bir gerekliliktir; eğitsel veri madenciliği ve analitiği araştırmacıları, eğitim verilerinden alınan veya doğrulanan iddiaları ve keşifleri desteklemek veya reddetmek için kanıta ihtiyaç duyar.

Bununla birlikte, sağlam ya da zayıf kanıtın ne olduğuna dair ortak bir tanımlama, “pozitif” (Bilgisayar Bilimi) ve “sosyal” bilimlerden (Eğitim) birçok bilim insanını bir araya getiren EVM ve ÖA araştırma topluluğu için açık değildir. Burada, kendi araştırmamız sırasında rastladığımız bazı tutarsızlıklar ve yöntemsel kusurlardan örnekler sunacağız. Veri paylaşımı sayesinde, Long ve Aleven (2014) bir akıllı öğretici sisteminde oyunlaştırılmış bir yaklaşımın öğrenme iddialarıyla ters düşebildiler. Ancak bazen veri kümelerini paylaşmak yeterli değildir; bazı araştırma çalışmaları, bir araştırma belgesinde açıkça tanımlanması zor olabilecek adımlar esnasında birden çok seçim (yanlılık) yapıldığı için kapsamlı bir ön işlemeyi gerektirir. Bu yüzden aynı kuralları izleyerek veri kümesini hazırlamaya çalışan başka bir ekip bunu yapmayı başaramayabilir. Ön işleme sırasında kullanılan yazılımın niteliği de etkili olabilir. Önemli yöntemlerin uygulanması, R, SPSS, Matlab ve diğer araçları kullanırken değişiklik göstererek potansiyel olarak farklı çıkarımlara yol açabilir.

Bir başka ihtilaflı yön, istatistiksel bir modelin üzerine kurulacağı deney öncesi varsayımlar veya “temel referans değer” dir. Örneğin, insan uzmanların maddeler ve beceri eşlemelerini tanımladığı yeterlik çerçeveleri sorgulanabilirdir. (Durand, Belacel ve Goutte, 2015). Diğer birçok gizli özellik gibi becerileri nitelendirmek bazen zordur. Bu amaçla, PSLC Veri Mağazası öğrenme uzmanlarına, öğrencilerden edinilen gözlem sonuçlarının yaptıkları eşlemeleri geliştirmeye ve paylaşmaya yardımcı olduğundan yeterlilik çerçevelerini test etmeleri için inanılmaz bir ortam sunar. Ayrıca, veri kümelerini paylaşmak sorunları tanımlama konusunda değerli olduğundan, veri kümelerini paylaşmak EVM ve ÖA pratisyenleri arasında harika bir araçtır. Paylaşım olağan olmalı ve yayınlanan hiçbir sonuç diğer ekiplerin bu iddiaları doğrulama imkânı olmadan ciddi şekilde düşünülmemelidir.

Diğer bazı konular, istatistiksel çalışmaları ve özellikle doğrusal korelasyon ölçülerini göz önünde bulundurmak gibi sorular doğurabilir. EVM, neyin kanıt olarak kullanılabileceği veya kullanılamayacağı konusunda farklı uygulamaları olan ve farklı bakış açılarına sahip araştırmacıları bir araya getirir. “Pozitif bilimlerde”, r =.5’in altındaki önemli bir Pearson korelasyonunun sistematik olarak zayıf olduğu düşünülürken, “sosyal bilimlerde”, r =.3 değerlerinin güçlü olduğunu düşünmek normaldir. Psikologlar bile buna.3 eşiği, “kişilik katsayısı” diyorlar çünkü kişilik özellikleri ile davranışlar arasındaki ilişkilerin çoğu, yetkinlik ve performans arasındaki ilişki de dâhil olmak üzere, bu değer etrafında olma eğilimindedir (Mischel, 1968, s. 78). EVM’de duygu analizi ile ilgili yapılan çalışmalar (Wen, Yang ve Rose, 2014), KAÇD’lerde okulu bırakma oranları konusunda anlamlı olan “sosyal” bilim araştırma sonuçlarından bilgi işlemsel sonuçlar elde etmenin zor olduğu bir örnek sunmaktadır. Ayrıca, incelenmekte olan konunun nitel tekniklerle daha iyi araştırılması önerilebilir. Bununla birlikte, amaç çıkarımlarda bulunmak olduğunda nicel EVM formundaki ilişkiler zayıf kalmaktadır. Özellikle, tanım gereği kriterdeki varyansın %9’unu açıklayan bir a., 3. korelasyonu, duygu analizi alanındaki tahminlerde sınırlı bir değere sahip olabilir.

Birkaç istatistik testi de anlamlı olabilir ancak sonuçların kesinliği konusunda tam olarak gerçeğe uygun olmayabilir. El Emam (1998), bir Ki-Kare testinin bir sınıflandırıcının öngörücü geçerliliğini değerlendirmede nasıl yanıltıcı olabileceğini değerlendirmiştir. Daha yakın zamanlarda, Gonzalez-Brenes ve Huang (2015), Leopard ölçümünü uyarlanabilir özel ders sistemlerini değerlendirmenin ve onların faydalılıklarını değerlendirerek sistemin öngörücü doğruluğunu değerlendirme sonuçlarını artırmanın standart bir yolu olarak önermiştir. Onlar bu sistemlerdeki öğrenme çıktılarına erişmek için öğrenenlerden istenecek çaba miktarını değerlendirmeyi teklif ettiler. Sonuçta, fayda ölçüleri, sistemleri kullanan kişilerin en çok ilgilendikleri şey olabilir.

Bu amaçla, EVM topluluğunun önde gelen araştırmacılarından Ryan Baker, KAÇD’de “Eğitimde Büyük Veri” başlıklı araştırmasında, araştırmacıların modellerinin geçerliliğini anlamalarına ve daha akılcı bir şekilde kontrol etmelerine yardımcı olacak örnekler ve iyi uygulama önerileri sunmaktadır (genelleştirilebilirlik, ekolojik, yapı ve tahmine dayalı, esas ve içerik geçerliliği). Baker bu dersinde, kesinlik, ROC (eğrilik yarıçapı), keskinlik ve hassasiyet veya Ki-Kare gibi sınıflandırıcılara ilişkin diğer ölçülerin kusurlarını bertaraf etmede nasıl “duyarganın şanstan daha iyi olduğunu” ve belli bir özelliği “duyarganın doğru bir şekilde tespit etme olasılığını” ölçmek için sırasıyla Kappa’yı ve hatta daha iyi olan A’yı kullandığını vurguladı. (Ocumpaugh, Baker, Gowda, Heffernan ve Heffernan, 2014, s. 492). Ancak EVM yayınlarında A’ ve Kappa kullanımı şu ana kadar sınırlı görünmektedir.

Araştırma bütünlüğünün son derece önemli olduğunu vurgulamak istiyoruz. EVM ve ÖA’da “uydurulmuş” sonuçlar vermek çekici olabilir. Kendi çalışmamız, somut sonuçların elde edilmesinin genellikle birçok çaba gerektirdiğini, birçok çalışmanın başarı garantisi olmadan yapıldığını ve doğrulama sürecinin sorunlu göründüğünü göstermiştir. Bugüne kadar gerçeği çarpıtacak önemli durumlar ortaya çıkmamıştır ancak diğer bilimsel alanlarda gözlemlendiği gibi gelecekteki olası sahtekârlık ve suistimal davalarından kaçınmak için şeffaflığa ilişkin yönergeler sunma konusu daha fazla dikkate alınmalıdır (Gupta, 2013).

ÖA ve EVM’nin gelişmekte olan alanlarında, bilimsel hedefin iddialı olduğunu ve araştırmacıların iddialarının bilimsel sağlamlığını dikkatlice kontrol etmelerini gerektirdiğini savunuyoruz. Araştırmalar yakın gelecekte insan öğrenmesini etkileyecekleri sözüne dair verilen bağışlar ile desteklense de ÖA ve EVM alanlarının bilimsel dürüstlüğü korumak için zaman ayırmaları önemlidir. Bu kullanılan yöntemlerin ve elde edilen sonuçların tarafımızca dikkatle değerlendirilmesini gerektirir.

Nitel Veri Analizinin Zorlukları

Eğitim araştırmalarının son on yıldaki gelişimine bakacak olursak, nicelden nitel araştırmalara doğru belirgin bir kayış vardır (Gergen, Josselson ve Freeman, 2015). Psikologlar, öğrenme ve bilmenin karmaşıklığın, bireylerin davranışlarını tek başına test ederek belirleyemedikleri fikrini giderek daha fazla desteklemektedir. Öğrenenlerin içinde yaşadıkları topluma dair eylemlerinin ve düşüncelerinin zenginliği ve bilgi ağlarında yer alan kişilerle iletişim kurma çalışmaları, insanların bilgi geliştirme ve öğrenmeleri hakkında daha derin, daha kapsayıcı ve son derece kültürel bir anlayış sağlar (Christopher, Wendt, Marecek ve Goodman, 2014; Denzin ve Lincoln, 2011; Gergen vd., 2015).

Mevcut teknoloji yönünden zengin öğrenme ortamı, sadece duvarlı bir sınıf değildir, aynı zamanda küresel ağ iletişimini de içerir; bunlar, araştırmacılara araştırma metodolojilerini yeniden icat etmeleri konusunda zorlayan, dönüşlü hikâyeleme ve zengin imgeleri kapsar. Tüm bunların ötesine geçmek -öğrencilerin memnuniyetini ortaya çıkarmak için yapılan ders sonu anketler, öğrenenler tarafından üretilen verileri araştırılması, çevrimiçi öğrenme deneyimi sırasında üretilen anlatılar, görüntüler ve görselleştirmeleri analiz etmek- öğrenme etkileşimlerinin zengin dokusunu anlamak için seçenekler sunar. Artık öğrenme ortamının bir parçasını oluşturan sosyal medya da değişen kelime ve resim gruplarındaki temel boyutları analiz etmek, öğrenme sürecinin kalbine resmî ders değerlendirmelerinden çok daha fazla girebilir.

İki kitlesel açık çevrimiçi dersi (KAÇD), PLENK2010 ve CLOM REL 2014 araştırması, bu araştırmanın içerdiği zorlukların altını çizmektedir (Fournier ve Kop, 2015; Kop, Fournier ve Durand, 2014). Önceki KAÇD araştırması, verilerdeki kalıpları görselleştirmek için güçlü araçları, özellikle de dijital sosyal ağlarda her zamankinden daha büyük ve daha zengin veri kümeleri sağladı. Bununla birlikte, bu tür kalıpları açığa çıkarma çalışmaları, verilerin üretildiği pedagojik ve teknik bağlamdaki cevaplardan daha fazla soru sağlamıştır. KAÇD katılımcılarının neden yaptıkları verileri ürettiklerini anlamaya çalışırken nitel bir yaklaşıma doğru ilerlemek, büyük veri, EVM ve ÖA’nın bize karmaşık öğrenme süreçleri ve deneyimleri hakkında neler söyleyebileceği ve söyleyemediği üzerine eleştirel bir derin düşünmeye neden oldu.

Boyd (2010) bunu şöyle ifade etmiştir:

Büyük Veri’yi çevreleyen coşkunun çoğu, bir parmağınızı tıklatarak büyük miktarda veriye kolayca erişebilmekten kaynaklanıyor. Ya da Vint Cerf in ifadesiyle, “İnsanlık tarihinde hiçbir zaman, bu kadar çabuk ve bu kadar kolay bilgiye ulaşamadık” Ne yazık ki, bu heyecanda kaybolan şey, bu verilerin ne olduğunun ve ne anlama geldiğinin eleştirel bir analizidir. (s. 2).

Bu kadar çok veri ve bilgi ile çok hızlı bir şekilde uğraşırken, araştırmacıların verileri, hedef kitle tarafından faydalı ve erişilebilir bir biçimde sindirebilecekleri anlaşılabilir, tüketilebilir veya işlem yapılabilir sunum biçimlerine dönüştürmek için en uygun süreçleri ve teknikleri tasarlamaları gerekir. Karmaşık fikirleri etkili bir şekilde ulaştırma yeteneği, araştırma bulgularını pratiğe dönüştüren değerli bir şey üretmede kritik öneme sahiptir. Eğitim sürecindeki paydaşların (ör. Öğrenciler, eğitimciler ve yöneticiler) tüm bu bilgi seviyelerine nasıl etkili bir şekilde erişebilecekleri, yönetebilecekleri ve anlam çıkaracakları ile ilgili sorular sorulmuştur; EVM ve ÖA yöntemleri, tam olarak otomatik veri filtreleme ve analizin bunu nasıl yapabileceğine işaret etmektedir. Bu öğrenme ve öğrenenler hakkında potansiyel olarak zengin çıkarımlara yol açabilir ancak aynı zamanda süreçte birçok yeni ilginç araştırma sorusu ve zorluğu da beraberinde getirebilir. Bunu yaparken, araştırmacılar verinin ne kadar anlamlı olduğunu göstermenin yanı sıra, duyarlı araştırma tasarımları ve uygulamaları ile sorumlu inovasyon ile meşgul olarak eğitim sürecinde çeşitli paydaşlara hitap etmek için çaba göstermelidirler (Berland, Baker ve Blikstein, 2014).

Algoritmalar, Mutlu Tesadüf ve Öğrenmede “İnsan”: Öğrenme Analitiğine Eleştirel Bir Bakış

EVM ve ÖA’da yavaş yavaş bir alan yazın gelişmektedir. Temel olarak, öğrenmeyi analiz etmek için teknolojiyi kullanmak ya da öğrenmeyi ilerletmek için yordayıcı analitiği kullanmak kolay değildir. Eğitimde algoritmaların ve diğer veri güdümlü sistemlerin geliştirilmesine ilişkin konular, bu sistemlerin gerçekte neleri değiştirdiği ve bu değişimin olumlu mu olumsuz mu olduğu ile ilgili sorulara yol açar. İkincisi, veri güdümlü sistemlerin içeriğini kim etkiliyor ve eğitim sürecine ne gibi katkılar sağlayabilir?

Çevrimiçi eğitimde ancak aynı zamanda bağdaştırıcı bir ağ ortamında (Jones, Dirckinck – Holmfeld ve Lindstrom, 2006), öğrenme uğraşındaki katılımcılar arasındaki iletişim ve diyalog kaliteli bir öğrenme deneyiminin merkezinde olmuştur. Bu insan dokunuşu öğrenme sistemleri ve ortamlarını geliştirmede gerekli bir bileşendir (Bates, 2014). Bilgili diğer kişilerin mevcudiyeti ve katılımı, katılımcıların resmî öğrenme ortamlarında ancak aynı zamanda çevrimiçi ilgili ağlarda da fikirlerini, yaratıcılıklarını ve düşüncelerini genişletmek için her zaman hayati olarak görülmüştür (Jones vd., 2006).

Öğrenme için veri güdümlü teknolojiler geliştirirken, bu insan unsurunu bir şekilde öğrenme sürecinin yararı için kullanmak önemlidir. Bu bilginin filtrelenmesinde veya Sokratik soruların sorulmasında, bilginin toplanmasına insan aracılığıyla aracılık edilmesi gerektiği anlamına gelir (Kop, 2012). Kaynaklar hakkında bilgi ve bağlantılar sağlayan “takipçiler”in kullanıcı tarafından seçildiği, değerli ve güvenilir olarak görüldüğü Twitter gibi sosyal mikroblog sitelerinin bunu başarılı bir şekilde yaptıkları gösterilmiştir (Bista, 2014; Kop, 2012; Stewart, 2015). Algoritmalarda, bu kararların elde edilmesi zordur ancak belki de verilere dayanan öneri sistemleri ile, iletişimi temel alan bilişsel destek ve öğrenme desteği uygulamalarının bir kombinasyonu bunu kolaylaştırabilir.

Veri odaklı sistemlerin içeriğini kimin etkilediğini ve eğitim sürecine ne gibi bir değer katabileceklerini düşünmek önemlidir. Ayrıca, sadece yeni teknolojilerin sunduğu fırsatlar ve verimliliği dikkate alınmakla kalmayıp, aynı zamanda, insan iletişimi ile betimlenen bir öğrenme ortamından, üzerinde öğrenenin kontrolünün az olduğu veya hiç kontrolünün olmadığı teknik unsurları içeren bir ortama geçmeye ilişkin etik unsurlar da düşünülmelidir.

Algoritmaların geliştirilmesinde öne sürülen sorunlardan biri, öneri veya arama sonucunun niteliğini etkileyebilecek olan araştırmacının araca dair yanlılığının tanıtılmasıdır. (Hardt, 2014). Verilerle çalışan kişilerin doğru şekilde eğitilmesi, her şeyi değiştirebilir (Fenwick, 2015b; Boyd ve Crawford, 2012). Halen uygulamaları sosyal bilimlerde bir geçmişe sahip olmayan bilgisayar bilimcileri ve matematikçiler üretmektedir. Boyd ve Crawford’un (2012) ikna edici bir şekilde ileri sürdüğü gibi:

Bilgi işlemsel beceriler en değerli olarak konumlandırıldığında, kimlerin avantajlı olduğu ve böyle bir bağlamda kimin dezavantajlı olduğu konusunda sorular ortaya çıkar. Bu, bilgisayar bilimcilerinin ve sosyal bilimcilerin ikisinin de önerecekleri değerli bakış açılarına sahip olduklarını kabul etmek yerine “sayıları okuyabilen”ler etrafında kendince yeni hiyerarşiler oluşturur. Bu önemli ölçüde, aynı zamanda cinsiyetlendirilmiş bir bölünmedir. Şu anda bilgi işlemsel beceriye sahip araştırmacıların çoğu erkektir ve feminist tarihçiler ve bilim felsefecilerinin gösterdiği gibi, soruları kimlerin sorduğu hangi soruların sorulacağını belirler (s.674).

Boyd ve Crawford (2012) bilgisayar bilimcileri ve sosyal bilimcilerin önyargısız, yüksek nitelikli analiz araçları geliştirmek için birlikte çalışması gerektiğini ve farklı alanlardaki insanlarla ekip çalışmasının büyük veri madenciliği ve analizinde de verimli olabileceğini öne sürüyor. Tabii ki, verilerin büyümesi ve kullanılabilirliği de bunlardan faydalanmayı çekici kılmıştır ancak yine de bazı zorluklar vardır. Çoğu zaman insanlar bilgileri güvendikleri kaynaklardan alırlar ancak Fenwick’in (2015b) önerdiği gibi, yeni usullerin kullanımı “günlük uygulama ve sorumlulukları tam olarak tanınamayacak şekillerde” değiştirebilir (s. 71). Örneğin o, karşılaştırma ve öngörmeye güvenmenin büyük veriler dikkatle kullanılmadığında özellikle algoritmaları üreten insanlar kalıplaşmış kanıların pekiştirildiğinin farkında değillerse, “kendi kendini pekiştirebileceği ve üretebileceği, süreç bağımlılığını arttırabileceği ve mevcut eşitsizlikleri hapsedebileceğini” vurguluyor.

Ayrıca, hâlihazırda kullanılmakta olan algoritmaların çoğunun daha derin öğrenme seviyelerini arttırmak veya topluma değer katmak için değil ekonomik kazanım için üretildiğini hafife almamalıyız. Kitchin (2015) tarafından iddia edildiği gibi, “Yazılım yalnızca bir dizi talimatı yerine getiren bir kod satırı değildir, birçok akılın farklı sosyal, politik ve ekonomik ilişkiler içerisine konumlanmış sonucu, koşullu, ilişkisel ve bağlamsal olarak ortaya çıkan bir sosyal ürünü olarak anlaşılmalıdır. ”(s. 5). Açıkçası otomatikleştirilmiş algoritma sistemlerinin geliştirilmesinin, bir şeyler ters gittiğinde kimin sorumlu olduğunu işaret etmenin zor olabileceği başka bir doğal problemi bulunmaktadır.

Bazı Etik Hususlar

Açık öğrenme ortamları, güçlü veri analizi araçları ve yöntemleri ile bir araya getirildiğinde, yeni ilişkiler ve öğrenmeye destek sağlamanın yanı sıra, öğrenenleri insan iletişimi ile nitelendirilen bir ortamdan, öğreneni üzerinde çok az ya da hiç kontrolü olmadığı teknik unsurlar içeren bir ortama taşıyan önemli etik sorunları ve zorlukları da vurgulamaktadır. Genel ağ geliştirme konusundaki ticari çabanın çoğu büyük veriden beslenmektedir ve herhangi bir yenilikçi eğitim anlayışından yoksundur (Atkinson, 2015). Biz “Teknoloji çözümlerinin, eğitime kayda değer ve sürdürülebilir faydalar getirmesini sağlayacak anlamlı pedagojik ve yetişkin öğrenme teorilerine dayanan, uzmanlık ve araştırmalar tarafından bilgilendirilmiş öğrenme tasarımının kendisi olduğunu” kabul ediyoruz (Atkinson, 2015, s. 7).

EVM ve ÖA da dâhil olmak üzere teknolojik yeniliğin dinamik hızı aynı zamanda gizliliğin değişime sebep olabilecek bir eyleme geçme biçimiyle korunmasını gerektirir. Bu amaca ulaşmak için, EVM ve ileri analitik alanındaki araştırmacılar ve sistem tasarımcıları, mahremiyet güçlendirici teknolojileri doğrudan ürün ve süreçlerine entegre eden sorumlu yenilikleri uygulamak zorundadır (Cavoukian ve Jonas, 2012). Oblinger (2012)’e göre, “Analitik kültür meselesidir, bir sorgulama kültürüdür: soru sormak, veri aramak, verilerin açığa vurduğu güçlü ve zayıf yönlere karşı dürüst olmak, bu çabaların sonuçları meyvesini verirken uyum sağlamaktır.”(s. 98).

Bunu akılda tutarak, yeni nesil analitikleri tasarlayan ve geliştirenlerin Tasarım yoluyla Mahremiyet konusunda bilgilendirilmelerini sağlamanızı şiddetle tavsiye ederiz. Bu hesap verebilirlik, araştırma doğruluğu, veri koruma, mahremiyet ve rızayı içeren farkındalık ve sorumlu uygulamayı gerektirir (Cavoukian ve Jonas, 2012; Cormack, 2015). Özel ve halka açık veriler arasındaki çizgi, daha fazla açık öğrenme ortamlarına katılım fırsatı yaratıldığından ve katılımcılar, onların etkinlikleri ve onların davranışları Facebook, Twitter, Google gibi sosyal medya ve diğer çevrim içi kullanılabilir potansiyel sosyal medya araçları yoluyla erişilebilir olduğundan giderek bulanıklaşmaktadır. Büyük veri bağlamında biz, “İnsanlar algoritmaların kendileri ile ilgili nasıl ilişkiler ve varsayımlar yaratabileceklerini ve birleştirilmiş kişisel bilginin onların davranışları ile ilgili izinsiz ve müdahaleci hükümlere nasıl dönebileceğini anlamak istiyor” (s.10) şeklinde görüş belirten Avrupa Veri Koruma Denetçisine (2015) katılıyoruz.

SONUÇ

Büyük veri çalışmalarında doğruluk, kontrol, şeffaflık ve güç ile ilgili önemli soruların da ele alınması gerekir. Pardo ve Siemens (2014), çok uzun süre çok fazla veri saklamanın (öğrenci dijital verileri, mahremiyete duyarlı veriler dâhil) zarar verebileceğini ve kişisel verileri korumak için emanet edilen sisteme veya kuruma güvensizliğine yol açabileceğini belirtmektedir. Büyük veri etiği konusundaki tartışmalar, veri temizliği, veri seçimi ve yorumlanması (Boyd ve Crawford, 2012), veri analitiğinin istilacılık olasılığı ve insan iletişiminin ve otomatik makine öğrenme algoritmaları ve geri bildirimleri le ilişkisinin olası makineleştirme etkilerine ilişkin metodolojik kaygılara vurgu yapmıştır. Araştırmacılar ve geliştiricilerin (Fenwick, 2015b) yararlı gelecek adımları inşa etmek için (veri madenciliği ve akıllı öğrenme analitikleri dâhil olmak üzere) büyük verinin sunduğu imkân ve sınırlılıklar konusunda dikkatli olmaları gerekir. Araştırmacılar, çalışmalarında doğabilecek yanlış ve yanlılıkların bir kısmından kaçınmak ve eğitim sürecine değer katmak için büyük veri ve veri güdümlü sistemlerdeki önemli sorunları ve zorlukları ele almak için ekipler halinde birlikte çalışmalıdır.

KAYNAKÇA

Atkinson, S. P. (2015). Adaptive learning and learning analytics: A new learning design paradigm. BPP Working paper. https://spatkinson.files.wordpress.com/2015/05/atkinson-adaptive-learning-and-learning-analytics.pdf

Bates, T. (2014). Two design models for online collaborative learning: Same or different? http://www.tonybates.ca/2014/11/28/two-design-models-for-online-collaborative-learning-same-or-different/

Berland, M., Baker, R. S., & Blikstein, P. (2014). Educational data mining and learning analytics: Applications to constructionist research. Technology, Knowledge and Learning, 19, 206–220.

Bista, K. (2014). Is Twitter an effective pedagogical tool in higher education? Perspectives of education graduate students. Journal of the Scholarship of Teaching and Learning, 15(2), 83–102. http://files.eric.ed.gov/ fulltext/EJ1059422.pdf

Bouchard, P. (2013). Education without a distance: Networked learning. In T. Nesbit, S. M. Brigham, & N. Taber (Eds.), Building on critical traditions: Adult education and learning in Canada. Toronto: Thompson Educational Publishing.

Boyd, D. (2010). Privacy and publicity in the context of big data. Paper presented at the 19th International Conference on World Wide Web (WWW2010), 29 April 2010, Raleigh, North Carolina, USA. http://www.danah.org/papers/talks/2010/WWW2010.html

Boyd, D., & Crawford, K. (2012). Critical equations for Big Data. Information, Communication & Society, 15(5), 662–679. doi:10.1080/1369118X.2012.678878

British Science Council. (2009). What is science? http://www.sciencecouncil.org/definition

Cavoukian, A., & Jonas, J. (2012). Privacy by design in the age of big data. https://privacybydesign.ca/content/ uploads/2012/06/pbd-big_data.pdf

Cormack, A. (2015). A data protection framework for learning analytics. Community.jisc.ac.uk. http://bit.ly/1OdIIKZ

Christopher, J. C., Wendt, D. C., Marecek, J., & Goodman, D. M. (2014) Critical cultural awareness: Contributions to a globalizing psychology. American Psychologist, 69, 645–655. http://dx.doi.org/10.1037/a0036851

Denzin, N., & Lincoln, Y. (Eds.) (2011). The Sage handbook of qualitative research (4th ed.). Thousand Oaks, CA: Sage.

Durand, G., Belacel, N., & Goutte, C. (2015) Evaluation of expert-based Q-matrices predictive quality in matrix factorization models. Proceedings of the 10th European Conference on Technology Enhanced Learning (EC-TEL’15), 15–17 September 2015, Toledo, Spain (pp. 56–69). Springer. doi:10.1007%2F978-3-319-24258-3_5

Ed Tech Review (2016). Educational Data Mining (EDM). http://edtechreview.in/dictionary/394-what-is-educational-data-mining

El Emam, K. (1998). The predictive validity criterion for evaluating binary classifiers. Proceedings of the 5th International Software Metrics Symposium (Metrics 1998), 20–21 November 1998, Bethesda, MD, USA (pp. 235–244). IEEE Computer Society. http://ieeexplore.ieee.org/document/731250/

European Data Protection Supervisor. (2015). Leading by example: The EDPS strategy 2015–2019. https://secure.edps.europa.eu/EDPSWEB/edps/site/mySite/Strategy2015

Fenwick, T. (2015a). Things that matter in education. In B. Williamson (Ed.), Coding/learning, software and digital data in education. University of Stirling, UK. http://bit.ly/1NdHVbw

Fenwick, T. (2015b). Professional responsibility in a future of data analytics. In B. Williamson (Ed.) Coding/ learning, software and digital data in education. University of Stirling, UK. http://bit.ly/1NdHVbw

Fournier, H., & Kop, R. (2015). MOOC learning experience design: Issues and challenges. International Journal on E-Learning, 14(3), 289–304.

Gergen, J. K., Josselson, R., & Freeman, M. (2015). The promise of qualitative inquiry. American Psychologist, 70(1), 1–9.

Gonzalez-Brenes, J., & Huang, Y. (2015). Your model is predictive — but is it useful? Theoretical and empirical considerations of a new paradigm for adaptive tutoring evaluation. In O. C. Santos, J. G. Boticario, C. Romero, M. Pechenizkiy, A. Merceron, P. Mitros, J. M. Luna, C. Mihaescu, P. Moreno, A. Hershkovitz, S. Ventura, & M. Desmarais (Eds.), Proceedings of the 8th International Conference on Education Data Mining (EDM2015), 26–29 June 2015, Madrid, Spain (pp. 187–194). International Educational Data Mining Society.

Gupta, A. (2013). Fraud and misconduct in clinical research: A concern. Perspectives in Clinical Research. 4(2), 144–147. doi:10.4103/2229-3485.111800.

Hardt, M. (2014). How big data is unfair: Understanding sources of unfairness in data driven decision making. https://medium.com/@mrtz/how-big-data-is-unfair-9aa544d739de

Jones, C., Dirckinck-Holmfeld, L., & Lindström, B. (2006). A relational, indirect, meso-level approach to CSCL design in the next decade. International Journal of Computer Supported Collaborative Learning, 1(1), 35–56.

Kansanen, P., & Meri, M. (1999). The didactic relation in the teaching–studying–learning process. TNTEE Publications, 2, 107–116. http://www.helsinki.fi/~pkansane/Kansanen_Meri.pdf

Kitchin, R. (2015). Foreword: Education in code/space. In B. Williamson (Ed.), Coding/learning, software and digital data in education. University of Stirling, UK. http://bit.ly/1NdHVbw

Kop, R. (2012). The unexpected connection: Serendipity and human mediation in networked learning. Educational Technology & Society, 15(2), 2–11.

Kop, R., Fournier, H., & Durand, G. (2014). Challenges to research in massive open online courses. Merlot Journal of Online Learning and Teaching, 10(1). http://jolt.merlot.org/vol10no1/fournier_0314.pdf

Long, Y., & Aleven, V. (2014). Gamification of joint student/system control over problem selection in a linear equation tutor. In S. Trausan-Matu, K. E. Boyer, M. Crosby, & K. Panourgia (Eds.), Proceedings of the 12th International Conference on Intelligent Tutoring Systems (ITS 2014), 5–9 June 2014, Honolulu, HI, USA (pp. 378–387). New York: Springer. doi:10.1007/978-3-319-07221-0_47

Long, C., & Siemens, G. (2011, September 12). Penetrating the fog: Analytics in learning and education. EDUCAUSE Review, 46(5). http://er.educause.edu/articles/2011/9/penetrating-the-fog-analytics-in-learning-and-education

Meyer, J. H. F., & Land, R. (2006). Overcoming barriers to student understanding: Threshold concepts and troublesome knowledge. London: Routledge.

Mischel, W. (1968). Personality and assessment. Londra: Wiley.

Oblinger, D. G. (2012, November 1). Analytics: What we’re hearing. EDUCAUSE Review. http://er.educause.edu/ articles/2012/11/analytics-what-were-hearingOcumpaugh, J., Baker, R., Gowda, S., Heffernan, N., & Heffernan, C. (2014). Population validity for educational data mining models: A case study in affect detection. British Journal of Educational Technology, 45(3), 487–501.

Pardo, A., & Siemens, G. (2014). Ethical and privacy principles for learning analytics. British Journal of Educational Technology, 45(3), 438–450.

Siemens, G., Dawson, D., & Lynch, L. (2013). Improving the quality and productivity of the higher education sector: Policy and strategy for systems-level deployment of learning analytics. SoLAR. https://www.itl.usyd.edu.au/projects/SoLAR_Report_2014.pdf

Stewart, B. (2015). Open to influence: What counts as academic influence in scholarly networked Twitter participation. Learning, Media and Technology, 40(3), 287–309. doi:10.1080/17439884.2015.1015547

Weller, M. (2011). A pedagogy of abundance. Spanish Journal of Pedagogy, 249, 223–236.

Wen, M., Yang, D., & Rosé, C. (2014). Sentiment analysis in MOOC discussion forums: What does it tell us? In J. Stamper, Z. Pardos, M. Mavrikis, & B. M. McLaren (Eds.), Proceedings of the 7th International Conference on Educational Data Mining (EDM2014), 4–7 July, London, UK (pp. 130–137). International Educational Data Mining Society.

Xu, D., & Smith Jaggars, S. (2013). Adaptability to online learning: Differences across types of students and academic subject areas. CCRC Working Paper No. 54. Community College Research Center, Teachers College, Columbia University. http://anitacrawley.net/Reports/adaptability-to-online-learning.pdf

License

Share This Book