Bölüm 30 Öğrenme Analitiğinde Bağlı Veriler: Olasılıklar ve Zorluklar

Amal Zouaq1, Jelena Jovanović2, Srećko Joksimović3, Dragan Gašević4

1Elektrik Mühendisliği ve Bilgisayar Bilimleri Fakültesi, Ottawa Üniversitesi, Kanada

2 Yazılım Mühendisliği Bölümü, Belgrad Üniversitesi, Sırbistan

3Moray House Eğitim Okulu, Edinburgh Üniversitesi, Birleşik Krallık

4 Enformatik Okulu, Edinburgh Üniversitesi, Birleşik Krallık

DOI: 10.18608/hla17.030

ÖZ

Öğrenme analitiği (ÖA); öğrenme ortamlarının çeşitliliği ve farklılığı, kitlesel açık çevrimiçi dersler (KAÇD) gibi ölçeklenebilir öğrenme modellerinin ortaya çıkması ve sosyal medya platformlarının öğrenme süreçleriyle bütünleştirilmesi nedeniyle veri üretiminde artışa tanıklık eder. Bu çeşitlilik, öğrenme platformlarının birlikte çalışabilirliğini, çoklu bilgi kaynaklarından gelen heterojen verilerin bütünleştirilmesini ve öğrenme kaynakları ile öğrenme izlerinin içerik analizini ilgilendiren birçok sorunu oluşturur. Bu bölüm, veri bütünleştirme ve analizinin olası bir çerçevesi olan bağlı veri (BV) kullanımını ele alır. ÖA’daki BV girişimlerinin ve eğitsel veri madenciliğinin (EVM) literatür taramasını sağlar ve bu alanlarda BV’nin kullanımıyla ilgili imkân ve zorluklardan bazılarını ele alır.

Anahtar Kelimeler: Bağlı veri (BV), veri bütünleştirme, içerik analizi, eğitsel veri madenciliği (EVM)

Kitlesel açık çevrimiçi derslerin (KAÇD) ortaya çıkışı ve açık veri girişimi, üniversite merkezli bir modelden, çok platformlu ve çok kaynaklı bir modele geçerek eğitimde yeni fırsatların ortaya çıkmasını sağlamıştır. Aslında, günümüzün öğrenme ortamları yalnızca çeşitli çevrimiçi öğrenme platformlarını değil, aynı zamanda öğrenenlerin bağlandığı, iletişim kurduğu, veri ve kaynakları değiş tokuş ettikleri sosyal medya uygulamalarını da (ör. SlideShare, YouTube, Facebook, Twitter veya Linkedin) kapsar. Hem formal (üniversite dersleri) hem de informal (sosyal medya, KAÇD) düzeylerde olan öğrenme artık çeşitli biçimlerde ve ortamlarda gerçekleşmektedir. Bu öğrenen verilerinin çeşitli platform ve araçlarda dağılmasını sağlamıştır ve öğrenen verilerini öğrenme ortamına kapsamlı bir bakış açısı için çeşitli ortamlarda bağlamak için etkili araçlara ihtiyaç duyulmasına neden olmuştur. Platformlar arasında veri alışverişi ihtiyacının belirgin bir örneği, bağlantıcı1 bKAÇD’dir. bKAÇD’lerde öğrenme, tanım gereği, tek bir platformda gerçekleşmez ancak öğrenenler arasında bilgi ve kaynak paylaşımı için bir dizi özel çevrimiçi öğrenme uygulamasına ve sosyal medya ve ağ oluşturma uygulamalarına dayanır (Siemens, 2005). Bu gelişmeler yeni ihtiyaçlara yol açarak hem veri toplamada hem de verinin kullanımında yeni zorlukları beraberinde getirmiştir.

Veri toplama açısından bakıldığında, bulut hizmetlerinin ortaya çıkışı ve ölçeklenebilir web mimarilerinin hızlı gelişimi, çeşitli çevrimiçi uygulamalardan veri çekilmesine ve kullanılmasına izin verir. Bu Facebook, Linkedin veya Twitter gibi büyük web paydaşları ve Coursera ve Udacity gibi KAÇD sağlayıcıları tarafından büyük ölçekli arayüzlerin (API) geliştirilmesiyle desteklenmektedir. Veri kullanımı açısından bakıldığında, eğitim platformlarında ortaya çıkan kaynakların ve etkileşimlerin çokluğu, farklı türde verilerin ele alınmasını da kapsayan analitik yetenekleri gerektirir. Üretilen çeşitli veri türlerinden bazıları öğrenenlerin öğrenme etkileşimleri ve sosyal platformlarda gerçekleştirdikleri etkileşimlerini (öğrenenlerin günlükleri/izleri) tutarken diğer veri türleri ders içeriklerinden, öğrenenlerin bloglarından ve tartışma forumlarına kadar uzanan yapılandırılmamış içerik biçimlerini de tutar. Bu çok çeşitli tür ve veri kaynakları, öğrenenleri ve öğrenme sürecini daha iyi anlamak, zamanında, bilgilendirici ve uyarlamalı geri bildirim sağlamak ve hayat boyu öğrenmeyi teşvik etmek için öğrenme analitiği alanı ve genel hedefleri için verimli bir zemin sağlar (Gaesvic, Dawson ve Siemens, 2015).

Heterojen kaynaklardan gelen verilerin toplanması, entegrasyonu ve kullanımıyla ilgili zorluklar, genellikle eğitim topluluğunda, heterojen verilerin geliştirilmesine ve onlardan yararlanılmasına izin veren standart bir veri modeli geliştirilerek ele alınmaktadır (Dietze vd., 2013). Bu bölüm hem formal hem de informal çevrimiçi öğrenme ortamlarında böyle bir veri modelinin geliştirilmesine ve kullanılmasına yönelik potansiyel bir yaklaşım olan bağlı veriye (BV) odaklanmaktadır. Özellikle, BV ilkelerinin kullanılması (Bizer, Heath ve Berners – Lee, 2009), öğrenme ortamlarında küresel olarak kullanılabilir bir bilgi ağı kurulmasına izin vererek (d’Aquin, Adamou ve Dietze, 2013), küresel bir eğitim grafiğine öncülük eder. Her bir öğrenen için, öğrenme etkinlikleriyle ilgili tüm veri ve kaynakları birbirine bağlayan, bireysel düzeyde benzer grafikler oluşturulabilir. Bu tür grafiklerin eğitim potansiyelleri ve yararları önceden incelenmiş ve ele alınmıştır. Örneğin, Heath ve Bizer (2011), İngiliz üniversitelerinde, öğrenme kaynaklarının içeriklerinden elde edilen bilgileri kapsayan bir eğitim grafiği önerirler. Bilgi çizgelerinin2, Google, Microsoft ve Facebook gibi artan sayıda önemli firmalar tarafından geliştirilmesi ve kullanılması dikkate alındığında bu tür çizgelerin öğrenmeye sağladığı potansiyel ve imkânlar incelenmelidir. (Zablith, 2015).

Bu bölüm, öncelikle öğrenme analitiği (ÖA) / eğitsel veri madenciliği (EVM) alanındaki mevcut ve potansiyel uygulamalara odaklanarak eğitimde BV kullanımının mevcut durumunu incelemektedir. Bir sonraki bölümde BV ilkelerine kısa bir girişten sonra, BV potansiyeli iki özel boyutta analiz edilir: 1) veri birleştirmenin boyutu ve 2) veri analizi ve yorumlama boyutu. Son olarak, ÖA / EVM’de BV kullanımı ile ilgili bazı olasılıkları ve zorlukları ele almaktayız.

EĞİTİMDE BAĞLI VERİLER

Bağlı veri, internet üzerinde kaynakları paylaşmak için fiilî bir standart olma potansiyeline sahiptir (Kessler, d’Aquin ve Dietze, 2013). Bağlı veri, varlıkların kendine özgü tanımlamalarını yapmak için GBT’leri ve varlıkları tanımlamak için KTÇ veri modeli1 kullanarak bu tanımlamaları bağlantılar (links) aracılığıyla açık bir şekilde tanımlanmış anlamlarla ilişkilendirir. Esasen, BV dört ilkeye dayanmaktadır:

  1. GBT’leri durum isimleri gibi örneğin “Paris” adlı bir tarihi romanın kendine özgü tanımlamasını ISBN (bir tür GBT) kullanarak yapalım: 0385535309

  2. HTTP GBT’leri aracılığıyla adları arama yeteneği sağlar; bir ISBN benzersiz bir kitabı tanımlarken, web üzerinde doğrudan erişim sağlamak için kullanılamaz, bu yüzden bunun yerine HTTP GBT’leri kullanılmalıdır; Örneğimizde yer alan kitabımıza şu HTTP GBT’sinden bakılabilir: <http://www.worldcat.org/oclc/827951628>

  3. GBT’ye baktıktan sonra, KTÇ ve SPARQL3 standartlarını kullanarak faydalı bilgiler döndürün; örneğin, <http://www.worldcat.org/oclc/827951628> GBT’si tarafından tanımlanan kaynağın kitap türünde olduğunu ve tarihsel kurgu kategorisinde ait olduğunu makineyle işlenebilir bir şekilde ifade edebiliriz: <http://www.worldcat.org/oclc/827951628> rdf:tür şema:Kitap; şema:tür “Tarihsel kurgu”.

  4. Varlıkların GBT’leri aracılığıyla kendine özgü tanımlanan diğer varlıklara ilişkin bağlantıları (linkler) dâhil edin; örnek olarak aldığımız kitabımızın yazarıyla bağlantı kurabiliriz: <http: // www.worldcat.org/oclc/827951628> şema: yazar <http://viaf.org/viaf/34666> buradaki GBT yazar Edward Rutherfurd’ı benzersiz olarak tanımlar.

Bu ilkelerin sadeliği sayesinde, BV mükemmel bir modelleme çerçevesini ve küresel boyutta veri sorgulamayı sunar. Çeşitli uygulamalarda ve alanlarda kullanılabilir ve eğitim topluluğuyla uzun süredir karşılaşılan birlikte çalışabilirlik ve veri yönetimi zorluklarına bir cevap oluşturabilir (Dietze vd., 2013).

]Web üzerinde bağlı veri olarak yayınlanan milyarlarca veri ögesi; devlete ait veri, bilimsel bilgi ve çeşitli çevrimiçi toplulukları içeren veriler gibi birkaç alan adından gelen bir açık bağlı veri bulutunun (BAV)4 yer aldığı küresel bir açık veri uzayını oluşturur. DBpedia5, Yago6 ve Wikidata7 gibi BAV’lerde büyük etki alanları arası bilgi tabanları da ortaya çıkmıştır. Bu nedenle BV, web sağlayıcıları ve web API’leri de dâhil olmak üzere binbir çeşit veri erişim noktaları aracılığıyla veriye nasıl ulaşılacağı ve kullanılacağı konusunda küresel bir değişimi mümkün kılan potansiyele sahip olup dinamik veri birleştirmelerinin sorunsuz bir şekilde oluşturulmasını sağlar. (Bizer vd., 2009). Aslında, BV’nin göze çarpan bir özelliği, farklı veri kaynaklarından gelen ögeler arasında anlam bakımından zengin bağlantılar kurması ve böylece daha sorunsuz veri entegrasyonu ve yeniden kullanımı için veri siloları (ör. geleneksel veritabanları) açmasıdır.

Tüm bu potansiyel faydalara rağmen, BV biçimciliği ve teknolojileri, teknoloji destekli öğrenme alanında yavaş yavaş benimsenmekte olup; BV teknolojilerini kullanan girişimler son zamanlarda ortaya çıkmaktadır (Dietze vd., 2013). ÖA / EVM alanında, 1) kaynak keşfi (ör. Ayrıntılı arama) ve içerik zenginleştirme (ör. BAV veri kümelerindeki verilerle içeriği artırma), (Maturana, Alvarado, Lopez –Sola, Ibanez ve Elosegui, 2013); 2) anlamsal açıklamalara dayalı içerik analizi (Joksimovi vd., 2015); 3) kaynak ve hizmet entegrasyonu (Dietze vd., 2012); 4) kişiselleştirme (Dietze, Drachsler ve Giordano, 2014) ve 5) EVM sonuçlarının yorumlanması (d’Aquin vd., 2013) dâhil olmak üzere BAV’den fayda sağlayacak çeşitli uygulama senaryoları belirleyebiliriz.

BAĞLI VERİLERİ KULLANARAK VERİ ENTEGRASYONU

BV’nin en belirgin faydalarından biri, veri bütünleştirme potansiyelinde yatmaktadır. Bu ÖA / EVM alanı için özellikle önemlidir, çünkü informal ve hayat boyu öğrenmede kullanılan çeşitli kaynaklardan (uygulamalar ve servisler) öğrenen ve içerik verilerinin toplanmasını ve yönetilmesini gerektirir (Santos vd., 2015). Özellikle, kapsamlı bir öğrenen modeli oluşturmak için, öğrenenin etkileşime girdiği farklı öğrenme platformlarına / araçlarına kaydedilen öğrenen verilerini birleştirmesi gerekir (Desmarais ve Baker, 2012). Bu nedenle, çoklu veri formatlarının ele alınması ve genel olarak birlikte çalışabilirlik eksikliği ile ilgili zorluklar kilit bir sorun haline gelmektedir (Chatti, Dyckhoff, Schroeder ve Thus, 2012; Duval, 2011). Daha genel olarak, öğrenme platformları arasında anlam kaybı olmadan veri aktarımı, ön işleme, kullanım, birleştirme ve analiz kolaylığı ÖA / EVM’nin etkinliği için önemli faktörler haline gelmektedir (Cooper, 2013).

Biyomedikal (Belleau, Nolin, Tourigny, Rigault ve Morissette, 2008), farmakoloji (Groth vd., 2014) ve çevre bilimleri (Lausch, Schmidt ve Tischendorf, 2015) gibi birçok alan veri bütünleştirme sorunlarını BV’ den faydalanarak çözümlemiştir. Tüm bunlar, BV teknolojilerinin ÖA / EVM’nin gerektirdiği sağlam veri bütünleştirme katmanına imkân verebileceğini ortaya koymaktadır.

Eğitsel Topluluklarda Veri Bütünleştirmenin Önceki Girişimleri

Teknoloji destekli öğrenme araştırma topluluğu uzun zamandır çoklu standartlaştırma çabalarıyla sonuçlanan veri entegrasyonunun önemini kabul etmiştir. Cooper (2013), öğrenmeyle ilgili çeşitli standartlara değerli bir genel bakış açısı sunar. Temel olarak bu standartlar, eğitim içeriklerinin ve sağlayıcılarının yanı sıra öğrenenlerin ve onların etkinliklerini içeren verilerin temsili ile ilgilidir.

Öğrenci düzeyinde, standartlar bireyler ve geçmişleri ile ilgili gerçeklere, bunların diğer insanlarla olan bağlantılarına ve etkileşimlerine ve öğrenme ortamları tarafından sunulan kaynaklarla etkileşime odaklanır (kişi ve öğrenme etkinlikleri boyutları). Model öğrenenler (ör. FOAF8) ve öğrenenlerin etkinlikleri ve etkileşimleri için çeşitli belirtimler mevcuttur (ör. Bağlamsallaştırılmış İlgi Üst Verisi [Schmitz, Wolpers, Kirschenmann ve Niemann, 2011], Etkinlik Akışları9 veya ADL xAPI10).

İçerik düzeyinde, IEEE Öğrenme Nesnesi Üst Verisi (LOÜV11) ve ADL SCORM12 gibi önceki girişimler, çevrimiçi eğitim kaynaklarının tanımını veya bilgisayar destekli değerlendirmenin belirtimini (ör. IMS QTI13) birleştiren kelimeler ve standartlar oluşturmaya çalıştı. Diğer çabalar, sosyal ve etkileşim verileri kümelerini bir araya getirmeyi amaçlayan Niemann, Wolpers, Stoitsis, Chinis ve Manouselis (2013) çalışmaları gibi çeşitli veri modelleri arasındaki haritalamayı hedeflemiştir. Son olarak, bu standartlarla tutarlı olan hizmetlerin uygulanmasına yönelik kılavuz sağlamak için çeşitli arayüzler önerilmiştir (Dietze vd., 2013).

Farklı bakış açılarına dayanan bu çabalar birbirleriyle rekabet eden birçok proje ortaya çıkarmıştır ve dolayısıyla aralarında pek birlikte çalışabilirlik olmayan çeşitli teknolojilere, dillere ve modellere yönelik alt topluluklar oluşturmuştur. BV felsefesi, birlikte çalışabilirlik sorunlarına webde çok sayıda modelin izin vermesi ve bu modellerin webde erişilebilir semantik bağlantılar kullanarak köprülenmesi yoluyla bir çözüm sağlar. Bu nedenle, farklı olarak temsil edilen anlamsal olarak benzer modeller, farklı modellerden kaynaklanan kavramlar arasında anlamlı bağlantılar kuran yazılı linkler kullanılarak aynı hizada olabilir; örneğin, eşitlik bağlantıları (owl:benzerOlan) veya hiyerarşik bağlantılar (rdfs:ninAltgrubu veya skos:broader).

Bağlı Veri Kullanarak Mevcut Veri Bütünleştirme Girişimleri

BV’ye dayalı entegrasyon, belirli konu alanlarındaki varlık türlerini, varlıkların özniteliklerini ve varlıklar arasındaki bağlantı türlerini tanımlayan web erişimli sözlüklerinin kullanılabilirliğini gerektirir. Ayrıca, belirli bir görev için birden fazla veri kümesinden yararlanılmasına izin veren hizmetlerin kullanılabilirliğinin yanı sıra verileri BV olarak açığa çıkaran hizmetlere de bağlıdır. Bu bölüm, eğitim alanındaki mevcut bazı söz varlığını ve eğitsel verileri öğrenme verisi olarak gösterme çabalarını tanıtmaktadır. Eğitimle ilgili kelimelerin daha kapsamlı bir incelemesi Dietze vd. (2014). Bu bölümde ayrıca birden fazla BV veri kümesinin entegrasyonunu kullanan hizmetlere örnekler verilmiştir.

Gittikçe artan sayıda eğitim kurumu, Birleşik Krallık’taki Açık Üniversitedeki gibi BV ilkelerini izleyerek verilerini yayımlamaktadır ve BV’yi, dersleri ayrıntılı ve yeniden kullanılabilir bir şekilde birbirine bağlamak için yükseköğrenim programları etrafında kavramsal bir katman olarak kullanmayı önermiştir. Başka bir çalışma da ABYNM14 tabanlı becerileri zenginleştirilmiş öz geçmişler oluşturmak için KAÇD kurs açıklamalarına bağlamaktadır (Zotou, Papantoniou, Kremer, Peristeras ve Tambouris, 2014). İlginç bir şekilde, yazarlar Coursera ve Udacity KAÇD platformlarında öğretilen benzer becerileri tanımlayabiliyorlar, böylece iki farklı KAÇD platformunun kursları arasında örtülü bağlantılar sağlıyorlar. Birisi, platformlar arası bir KAÇD kurs öneri servisine dayanan hayat boyu öğrenme için heyecan verici fırsatlar öngörebilir.

Genel olarak eğitim alanında BV’nin ve özellikle de ÖA / EVM’nin artan öneminin bir başka göstergesi, BV kavramlarının ve teknolojilerinin xAPI belirtimine15 uyarlanmasıdır. XAPI ile, geliştiriciler önceden tanımlanmış bir arabirim ve bir dizi depolama ve alma kuralları aracılığıyla bir öğrenme deneyimi izleme hizmeti oluşturabilir. De Nies, Salliau, Verborgh, Mannens ve Van de Walle (2015), xAPI belirtimini BV olarak kullanarak oluşturulan veri modellerini göstermeyi önermektedir. Bu öneri, birlikte çalışabilir bir öğrenme izleri verisi modeli sağlar ve öğrenenlerin izlerinin semantik olarak birlikte çalışabilir BV olarak kusursuz bir şekilde ortaya çıkmasını sağlar. Benzer şekilde, Softic vd. (2014), Semantik Web teknolojilerinin (KTÇ, SPARQL) kişisel öğrenme ortamlarındaki öğrenen günlüklerini modellemek için kullanımını rapor etmektedir.

Temel altyapı olarak webin ölçeklenebilirliğine ve W3C standartları KTÇ ve SPARQL’in birlikte çalışabilirliğine dayanarak, benzer girişimlerin ademi merkeziyetçi ve uyarlanabilir öğrenme hizmetlerinin geliştirilmesine daha fazla katkıda bulunabileceğine inanıyoruz.

BAĞLI VERİ KULLANARAK VERİLERİN ANALİZ EDİLMESİ VE ANLAMLANDIRILMASI

KAÇD’lerde giderek artan miktardaki öğrenme içeriklerinin yanı sıra çeşitli çevrimiçi sosyal medya ve iletişim kanallarında yer alan yapılandırılmamış içeriklerin hızlı artışı da dikkate alınmalıdır. Birkaç isim vermek gerekirse başlıklar (konular), eğilimler (trendler) ve düşünceler gibi uzaktan öğrenimle ilgili ögelerin ortaya çıkarılmasının otomatikleştirilmesine ihtiyaç duyulmaktadır. Eğer düzenli girdi verileri (ör. öğrenenlerin günlükleri), BAV veri kümelerinden gelen (ör. kursla ilişkilendirilen konularla ilgili veriler) gerekli bilgilerle zenginleştirilirse analitik için ihtiyaç duyulan ilgili ögelerin ortaya çıkarılması ve / veya önerilmesi iyileştirilebilir (d’Aquin ve Jay, 2013). DBpedia ve Yago gibi BAV etki alanları arası bilgi tabanlarının tek veya geleneksel içerik analizi teknikleriyle (ör. sosyal ağ analizi, metin madenciliği, örtük anlamsal dizinleme) ile birlikte kullanılması halinde, çekilen konuların daha kolay yorumlanmasına imkân veren içerik analizi bilgi tabanlarının (ör. DBpedia) geliştirilmesi için umut verici bir yol sunar.

ÖA / EVM Alanındaki Bilimsel Yayınların Analizi

BV tarafından desteklenen ve eğitim bağlamıyla ilgili bir diğer uygulama alanı, semantik yayınlama (ör. kitap kataloglarını BV olarak yayınlama) ve bilimsel yayınların üst analizidir. Aslında, BV teknolojilerinin temel başarılarından biri, BNF16 gibi çeşitli içerik yayıncıları ve DBLP17 gibi bilimsel tabanlı yayıncılık girişimleri tarafından erken benimsenmiş olmasıdır. Bu bilimsel yayınlarla ilgili BAV kelimelerinin ve veri kümelerinin çokluğuna yol açmıştır. Bu veri kümeleri; belirli bir alana ait konuları belirleyen, araştırmacıları etkileyen ve araştırma topluluğunu ayrıntılı olarak tanımlayan çeşitli bilimetrik hesaplamalar için temel oluşturur (Mirriahi, Gašević, Dawson ve Long, 2014; Ochoa, Suthers, Verbert ve Duval, 2014). Ayrıca, ilgili bilgileri bulmak için eğitim sektöründen gelen uzmanlara (araştırmacılar, öğrenciler, kütüphaneciler, kurs üreticileri) anında yardımcı olurlar.

ÖA / EVM alanında, Öğrenme Analitiği ve Bilgi (ÖAB) Veri Kümesi (Taibi ve Dietze, 2013), ÖA / EVM topluluklarından bir yayın derlemi temsil eder. ÖAB Veri Kümesi hem yayınların içeriğini hem de üst verilerini (ör. anahtar kelimeler, yazarlar, konferans) içerir. ÖAB Veri Kümesi, var olan çeşitli BAV kelime bilgilerine dayandığı ve BV teknolojilerinin başarılı bir uygulamasını kapsadığından veri bütünleştirme girişimini ifade eder. ÖAB Veri Kümesinin analizi, 2013’ten bu yana, ÖA / EVM yayınlarıyla ilgili araştırma ve analitik çalışmaları teşvik eden yıllık ÖAB Veri Mücadelesi ile teşvik edilmiştir. Bu veri kümesi, veri analitiği ve içerik analizi uygulamalarının geliştirilmesi için daha fazla kullanılmıştır. Özellikle, konuların ve veri kümesindeki konular arasındaki ilişkilerin yıllık olarak, topluluk başına (ÖA-EVM), yayın başına ve ayrıntılı olarak saptanması değerli bir uygulamadır. Örneğin, Zouaq, Joksimovic ve Gašević’in (2013) çalışması, göze çarpan konuları ve aralarındaki ilişkileri belirlemek için ÖAB Veri Kümesinde ontoloji öğrenme tekniklerini kullanmıştır. Konuları keşfetmek için uygulanan diğer teknikler arasında gizli Dirichlet tahsisi (GDT; Sharkey ve Ansari, 2014) ve kümelemesi (Scheffel, Niemann, Leon Rojas, Drachsler ve Specht, 2014) sayılabilir. Bu yaklaşımlar metne dayalı bir içerik analizi sunarken, diğer konular da veri entegrasyon çabalarında BAV bilgi tabanlarına (ör. DBpedia) ve ilgi alanlarını tanımlamak için semantik açıklamalara dayanarak daha da ileri gitmiştir. Örneğin; Milikić, Krcadinac, Jovanović, Brankov, ve Keca (2013) ve Nunes, Fetahu ve Casanova (2013), yayınlarda konu başlıklarını ve adlandırılmış varlıkları tanımlamak için sırasıyla TagMe ve DBpedia Spotlight hizmetlerine güvendi. Bu durumda BV’nin yararı 1) veri kümesini BAV kavramları, anahtar kelimeler ve temalarla zenginleştirme kabiliyeti ve 2) potansiyel işbirlikli tespiti (Hu vd., 2014), veri kümesi önerileri veya daha genel anlamsal aramalar gibi gelişmiş hizmetler geliştirme kabiliyeti tarafından vurgulanmıştır (Nunes vd., 2013).

Veri Madenciliği Sonuçlarının Yorumlanması

Birçok araştırma, öğrenenlerin etkileşimlerini ve görüşme verilerini (ör. öğrenenlerin konuşmaları, fikirleri ve akademik performansları arasındaki bağlantıyı belirleyerek (Dowell vd., 2015) veya kurs kayıt verilerini (d’Aquin ve Jay, 2013) analiz ederek anlaşılmasını, bağlantıları ve kestirimci modelleri sunmuştur. Bununla birlikte, bu analizlerin çoğu kapalı ya da silo veri kümesiyle sınırlı kalmaktadır ve büyük veri kümelerinde yorumlanmaları genellikle zordur.

Genel olarak, ÖA / EVM’deki model keşfi, sonuçların birkaç boyuta (ör. konular, öğrenci özellikleri, öğrenme ortamları, vb.) göre anlamlı bir şekilde yorumlanması için bir model ve insan analisti gerektirir (d’Aquin ve Jay, 2013). D’Aquin ve Jay (2013) tarafından yapılan çalışma, veri madenciliği sürecinde keşfedilen kalıpları zenginleştirmek ve bağlamlaştırmak için BV’nin faydası hakkında yeni bilgiler sunmaktadır. Özellikle, keşfedilen örüntüleri BV GBT’leri ile birlikte açıklamayı teklif ederler, böylece bu örüntülerin yorumlamayı kolaylaştırmak için mevcut veri kümeleriyle daha da zenginleştirilebilir. Yazarlar, fikri zamanla ders modüllerine öğrenci kaydıyla ilgili bir örnek olay incelemesi ile göstermektedir. Sık sık kurs dizilimlerini çıkarırlar ve bunları kurs GBT’leri vasıtasıyla kurs açıklamalarıyla, yani kursu tanımlayan bir dizi özellikle ilişkilendirerek zenginleştirirler. (Zincir) özellikleri, çapraz temelli bir sınıflandırmada (ör. kurs sıralarının sıklıkla tercih edilen ortak konuları) ve navigasyon tabanlı bir yapı olarak kullanılan analitik boyutları sağlar. Bu vaka çalışmasında gösterildiği gibi, BV keşfedilen kalıpları dış bilgi tabanlarına bağlayarak ve yeni bilgiyi ortaya çıkarmak için BAV anlamsal bağlantılarını kullanarak yeni analitik boyutları keşfetmeye yardımcı olabilir. Bu özellikle çeşitli faktörlerin bir kalıba veya olguya katkıda bulunabileceği çok disiplinli araştırmalarda önemlidir. Öğrenme davranışlarının karmaşıklığı göz önüne alındığında, bu desteğin ÖA / EVM sonuçlarının yorumlanmasında faydası olduğu düşünülebilir.

TARTIŞMA ve BAKIŞ AÇISI

Öğrenme deneyimine yönelik genel analitik yaklaşım, öğrenme verilerinin toplanması, yönetimi, sorgulanması, birleştirilmesi ve zenginleştirilmesi için son teknoloji veri yönetimi teknikleri gerektirir. BV kavramı ve teknolojisi, W3C standartlarına (KTÇ, SPARQL) dayanmaktadır ve veri yönetiminin tüm bu yönlerine katkıda bulunma potansiyeline sahiptir. İlk olarak, BV teknolojilerinin ardındaki temel amaçlardan biri, verilerin anlam bilimini koruyarak ve kaldırarak, çeşitli amaçlar için verileri kolayca işlenebilir ve tekrar kullanılabilir hale getirmektir. İkincisi, BV, çeşitli veri kümelerinin sorunsuz bir şekilde birleştirilmesini ve sorgulanmasını sağlayarak veri yönetimine merkezi olmayan bir yaklaşım sağlar. Üçüncüsü, web üzerindeki bağlantılı açık veriler olarak mevcut büyük ölçekli bilgi tabanları, analitik süreçle ilgili çeşitli hizmetler için zemin sağlar; örneğin, içerik analizi ve zenginleştirme için semantik ek açıklamalar. Dördüncüsü, webde BV olarak açığa çıkarılan veriler, analitik sürecin farklı aşamalarında gerekli olan talep üzerine (tam zamanında) veri / bilgi girişi sağlayabilir, çünkü bu bilgi daima önceden tam olarak tahmin edilemez. Potansiyel faydalar ayrıca sonuç analizini anlamsal açıdan zengin bir formatta temsil etmeyi de içerir, böylece sonuçlar uygulamalar arasında paylaşılabilir ve ilgili taraflara (öğretmenler, öğrenciler) ihtiyaç ve tercihlere bağlı olarak (ör. farklı görsel veya anlatım biçimlerine bağlı olarak) farklı şekillerde iletilebilir. Diğer taraftan, veri maddelerinin anlamsal olarak zengin temsilinden ve karşılıklı ilişkilerinden kaynaklanan çoklu veri kaynakları üzerindeki çıkarım yetenekleri sayesinde, BV tabanlı yöntemler, metin içeriğindeki temaları ve konuları keşfetmek için mevcut analitik yöntemlere amaca uygun bir katkı olabilir. Ayrıca, çoklu veri kaynakları üzerindeki çıkarım yetenekleri sayesinde, veri ögelerinin anlamsal olarak zengin temsilinden ve karşılıklı ilişkilerinden kaynaklanan BV tabanlı yöntemler, metin içeriğindeki temaları ve konuları keşfetmek için mevcut analitik yöntemlere alakalı bir ek olabilir. Daha genel olarak, ÖA / EVM topluluğunda istatistiksel ve makine öğrenme yöntemleri yaygın olmakla birlikte, verilerin açıkça tanımlanmış anlam bilimine ve açık bilgi kaynaklarına (özellikle açık, web tabanlı bilgiye dayalı) dayanan diğer veri analiz yöntemleri ve teknikleri geleneksel analitik yaklaşımları daha da güçlü kılar.

Son olarak, BV teknolojileri öğrenme ortamlarının ve sosyal medya platformlarının heterojenliği ile başa çıkmada yararlı olabilir. Özellikle, ortak bir şema paylaşmayan çeşitli veri kümelerini sorgulayabilir ve birleştirebilirsiniz. Bu yönün kendisi, ortak bir modele / şemaya uyumu gerektiren önceki yaklaşımlardan daha esnek ve pratik bir yaklaşımı temsil etmektedir.

Ancak BV Kullanımı ile ilgili olarak aşağıda zikrettiğimiz bazı zorluklardan bahsetmek mümkündür:

  1. Kalite: BAV veri kümelerinin kalitesi bir endişe kaynağıdır (Kontokostas vd., 2014) ve öğrenme kaynaklarını ve izlerini dış veri kümelerine ve bilgi tabanlarına bağlamak karmaşık veriye yol açabilir. Veri temizliği için bazı girişimler olmasına rağmen, bu sorun hala tam olarak çözülememiştir.

  2. Hizalama: Şemalar arasında ortak web GBT’lerinin kullanımının yanı sıra, zorlu bir görev olan kelime ve modelleri anlamsal olarak hizalamaya ihtiyaç duyulur. Mevcut uyum yaklaşımları genellikle belirsizlikler ile başa çıkmayan sözdizimsel eşleşmeye dayanmaktadır. Uyum sorununu hafifletmenin bir yolu, mümkün olduğunda ana BV kelimelerinin18 farkında olmak ve yeniden kullanmaktır (ör. foaf:isim, FOAF belirtimindeki bir kişinin adını gösteren ve yeni bir özellik oluşturmak yerine kullanılabilir) ;

  3. Gizlilik: KAÇD’lerdeki ve öğrenme platformlarındaki veriler çoğu zaman gizlilik nedeniyle depolanmaktadır. Bilgiyi öğrenme ile sosyal platformlar arasında birleştirmek, öğrenenlere verilere erişim izni ve öğrenmede kullandıkları farklı hizmetler için giriş bilgileri vermelerini gerektirir.

Yukarıda belirtilen ve BAV veri kümelerinin ve bilgi tabanlarının Google bilgi çizgesi19 veya Facebook bilgi çizgesi araması gibi bazı büyük firmaların kullanılması ve bunların eğitim kurumlarında benimsenmesi artan BV’de kullanılmasına rağmen, bugünün öğrenme platformları için umut verici bir teknolojik belkemiğidir. Ayrıca, ham veri toplama ve depolanmasından veri kullanımına ve zenginleştirmeye, analitik sonuçların yorumlanmasına kadar genel öğrenme analitiği sürecini kolaylaştırmak için yararlı bir biçimcilik sağlar.

KAYNAKÇA

Belleau, F., Nolin, M.-A., Tourigny, N., Rigault, P., & Morissette, J. (2008). Bio2RDF: Towards a mashup to build bioinformatics knowledge systems. Journal of Biomedical Informatics, 41(5), 706–716.

Bizer, C., Heath, T., & Berners-Lee, T. (2009). Linked data – the story so far. International Journal on Semantic Web and Information Systems, 5(3), 1–22. Preprint retrieved from http://tomheath.com/papers/bizer-heath-berners-lee-ijswis-linked-data.pdf

Chatti, M. A., Dyckhoff, A. L., Schroeder, U., & Thüs, H. (2012). A reference model for learning analytics. International Journal of Technology Enhanced Learning, 4(5–6), 318–331.

Cooper, A. R. (2013). Learning analytics interoperability: A survey of current literature and candidate standards. http://blogs.cetis.ac.uk/adam/2013/05/03/learning-analytics-interoperability

d’Aquin, M., & Jay, N. (2013). Interpreting data mining results with linked data for learning analytics: Motivation, case study and directions. Proceedings of the 3rd International Conference on Learning Analytics and Knowledge (LAK’13), 8–12 April 2013, Leuven, Belgium (pp. 155–164). New York: ACM.

d’Aquin, M., Adamou, A., & Dietze, S. (2013, May). Assessing the educational linked data landscape. Proceedings of the 5th Annual ACM Web Science Conference (WebSci’13), 2–4 May 2013, Paris, France (pp. 43–46). New York: ACM.

De Nies, T., Salliau, F., Verborgh, R., Mannens, E., & Van de Walle, R. (2015, May). TinCan2PROV: Exposing interoperable provenance of learning processes through experience API logs. Proceedings of the 24th International Conference on World Wide Web (WWW’15), 18–22 May 2015, Florence, Italy (pp. 689–694). New York: ACM.

Desmarais, M. C., & Baker, R. S. (2012). A review of recent advances in learner and skill modeling in intelligent learning environments. User Modeling and User-Adapted Interaction, 22(1–2), 9–38.

Dietze, S., Drachsler, H., & Giordano, D. (2014). A survey on linked data and the social web as facilitators for TEL recommender systems. In N. Manouselis, K. Verbert, H. Drachsler, & O. C. Santos (Eds.), Recommender Systems for Technology Enhanced Learning (pp. 47–75). New York: Springer.

Dietze, S., Sanchez-Alonso, S., Ebner, H., Qing Yu, H., Giordano, D., Marenzi, I., & Nunes, B. P. (2013). Interlinking educational resources and the web of data: A survey of challenges and approaches. Program, 47(1), 60–91.

Dietze, S., Yu, H. Q., Giordano, D., Kaldoudi, E., Dovrolis, N., & Taibi, D. (2012). Linked education: Interlinking educational resources and the web of data. Proceedings of the 27th Annual ACM Symposium on Applied Computing (SAC 2012), 26–30 March 2012, Riva (Trento), Italy (pp. 366–371). New York: ACM. Dowell, N. M., Skrypnyk, O., Joksimović, S., Graesser, A. C., Dawson, S., Gašević, D., Hennis, T. A., de Vries, P., & Kovanović, V. (2015). Modeling learners’ social centrality and performance through language and discourse. In O. C. Santos, J. G. Boticario, C. Romero, M. Pechenizkiy, A. Merceron, P. Mitros, J. M. Luna, C. Mihaescu, P. Moreno, A. Hershkovitz, S. Ventura, & M. Desmarais (Eds.), Proceedings of the 8th International Conference on Education Data Mining (EDM2015), 26–29 June 2015, Madrid, Spain (pp. 250–257). International Educational Data Mining Society. http://files.eric.ed.gov/fulltext/ED560532.pdf

Duval, E. (2011). Attention please! Learning analytics for visualization and recommendation. Proceedings of the 1st International Conference on Learning Analytics and Knowledge (LAK’11), 27 February–1 March 2011, Banff, AB, Canada (pp. 9–17). New York: ACM.

Gašević, D., Dawson, S., & Siemens, G. (2015). Let’s not forget: Learning analytics are about learning. TechTrends, 59(1), 64–71.

Groth, P., Loizou, A., Gray, A. J., Goble, C., Harland, L., & Pettifer, S. (2014). API-centric linked data integration: The open PHACTS discovery platform case study. Web Semantics: Science, Services and Agents on the World Wide Web, 29, 12–18.

Heath, T., & Bizer, C. (2011). Linked data: Evolving the web into a global data space. Synthesis lectures on the semantic web: Theory and technology, 1(1), 1–136. Morgan & Claypool.

Hu, Y., McKenzie, G., Yang, J. A., Gao, S., Abdalla, A., & Janowicz, K. (2014). A linked-data-driven web portal for learning analytics: Data enrichment, interactive visualization, and knowledge discovery. In LAK Workshops. http://geog.ucsb.edu/~jano/LAK2014.pdf

Joksimović, S., Kovanović, V., Jovanović, J., Zouaq, A., Gašević, D., & Hatala, M. (2015). What do cMOOC participants talk about in social media? A topic analysis of discourse in a cMOOC. Proceedings of the 5th International Conference on Learning Analytics and Knowledge (LAK’15), 16–20 March, Poughkeepsie, NY, USA (pp. 156–165). New York: ACM.

Jovanović, J., Bagheri, E., Cuzzola, J., Gašević, D., Jeremic, Z., & Bashash, R. (2014). Automated semantic annotation of textual content. IEEE IT Professional, 16(6), 38–46.

Kagemann, S., & Bansal, S. (2015). MOOCLink: Building and utilizing linked data from massive open online courses. Proceedings of the 9th IEEE International Conference on Semantic Computing (IEEE ICSC 2015), 7–9 February 2015, Anaheim, California, USA (pp. 373–380). IEEE.

Kessler, C., d’Aquin, M., & Dietze, S. (2013). Linked data for science and education. Journal of Semantic Web, 4(1), 1–2.

Kontokostas, D., Westphal, P., Auer, S., Hellmann, S., Lehmann, J., Cornelissen, R., & Zaveri, A. (2014). Test-driven evaluation of linked data quality. Proceedings of the 23rd International Conference on World Wide Web (WWW’14), 7–11 April 2014, Seoul, Republic of Korea (pp. 747–758). New York: ACM.

Lausch, A., Schmidt, A., & Tischendorf, L. (2015). Data mining and linked open data: New perspectives for data analysis in environmental research. Ecological Modelling, 295, 5–17.

Maturana, R. A., Alvarado, M. E., López-Sola, S., Ibáñez, M. J., & Elósegui, L. R. (2013). Linked data based applications for learning analytics research: Faceted searches, enriched contexts, graph browsing and dynamic graphic visualisation of data. LAK Data Challenge. http://ceur-ws.org/Vol-974/lakdatachallenge2013_03.pdf

Milikić, N., Krcadinac, U., Jovanović, J., Brankov, B., & Keca, S. (2013). Paperista: Visual exploration of semantically annotated research papers. LAK Data Challenge. http://ceur-ws.org/Vol-974/lakdatachallenge2013_04.pdf

Mirriahi, N., Gašević, D., Dawson, S., & Long, P. D. (2014). Scientometrics as an important tool for the growth of the field of learning analytics. Journal of Learning Analytics, 1(2), 1–4.

Muñoz-Merino, P. J., Pardo, A., Kloos, C. D., Muñoz-Organero, M., Wolpers, M., Katja, K., & Friedrich, M. (2010). CAM in the semantic web world. In A. Paschke, N. Henze, & T. Pellegrini (Eds.), Proceedings of the 6th International Conference on Semantic Systems (I-Semantics’10), 1–3 September 2010, Graz, Austria. New York: ACM. doi:10.1145/1839707.1839737Newman, M. E. (2006). Modularity and community structure in networks, Proceedings of the National Academy of Sciences, 103(23), 8577–8582.

Niemann, K., Wolpers, M., Stoitsis, G., Chinis, G., & Manouselis, N. (2013). Aggregating social and usage datasets for learning analytics: Data-oriented challenges. Proceedings of the 3rd International Conference on Learning Analytics and Knowledge (LAK’13), 8–12 April 2013, Leuven, Belgium (pp. 245–249). New York: ACM.

Nunes, B. P., Fetahu, B., & Casanova, M. A. (2013). Cite4Me: Semantic retrieval and analysis of scientific publications. LAK Data Challenge, 974. http://ceur-ws.org/Vol-974/lakdatachallenge2013_06.pdf

Ochoa, X., Suthers, D., Verbert, K., & Duval, E. (2014). Analysis and reflections on the third learning analytics and knowledge conference (LAK 2013). Journal of Learning Analytics, 1(2), 5–22.

Piedra, N., Chicaiza, J. A., López, J., & Tovar, E. (2014). An architecture based on linked data technologies for the integration and reuse of OER in MOOCs context. Open Praxis, 6(2), 171–187.

Santos, J. L., Verbert, K., Klerkx, J., Duval, E., Charleer, S., & Ternier, S. (2015). Tracking data in open learning environments. Journal of Universal Computer Science, 21(7), 976–996.

Scheffel, M., Niemann, K., Leon Rojas, S., Drachsler, H., & Specht, M. (2014). Spiral me to the core: Getting a visual grasp on text corpora through clusters and keywords. LAK Data Challenge. http://ceur-ws.org/Vol- 1137/lakdatachallenge2014_submission_3.pdf

Schmitz, H. C., Wolpers, M., Kirschenmann, U., & Niemann, K. (2011). Contextualized attention metadata. In C. Roda (Ed.), Human attention in digital environments (pp. 186–209). New York: Cambridge University Press.

Sharkey, M., & Ansari, M. (2014). Deconstruct and reconstruct: Using topic modeling on an analytics corpus. LAK Data Challenge. http://ceur-ws.org/Vol-1137/lakdatachallenge2014_submission_1.pdf

Siemens, G. (2005). Connectivism: A learning theory for the digital age. International Journal of Instructional Technology and Distance Learning, 2(1), 3–10. http://itdl.org/Journal/Jan_05/article01.htm

Softic, S., De Vocht, L., Taraghi, B., Ebner, M., Mannens, E., & De Walle, R. V. (2014). Leveraging learning analytics in a personal learning environment using linked data. Bulletin of the IEEE Technical Committee on Learning Technology, 16(4), 10–13.

Taibi, D., & Dietze, S. (2013), Fostering analytics on learning analytics research: The LAK dataset. LAK Data Challenge, 974. http://ceur-ws.org/Vol-974/lakdatachallenge2013_preface.pdf

Zablith, F. (2015). Interconnecting and enriching higher education programs using linked data. Proceedings of the 24th International Conference on World Wide Web (WWW’15), 18–22 May 2015, Florence, Italy (pp. 711–716). New York: ACM.

Zotou, M., Papantoniou, A., Kremer, K., Peristeras, V., & Tambouris, E. (2014). Implementing “rethinking education”: Matching skills profiles with open courses through linked open data technologies. Bulletin of the IEEE Technical Committee on Learning Technology, 16(4), 18–21.

Zouaq, A., Joksimović, S., & Gašević, D. (2013). Ontology learning to analyze research trends in learning analytics publications. LAK Data Challenge. http://ceur-ws.org/Vol-974/lakdatachallenge2013_08.pdf


1 connectivist

2 knowledge graph

3 https://www.w3.org/TR/sparql11–query/

4 http://lod-cloud.net/

5 http://lod-cloud.net/

6 http://bit.ly/yago-naga

7 http://bit.ly/wikidata-main

8 http://www.foaf-project.org/

9 http://activitystrea.ms/

10 http://www.adlnet.gov/tla/experience-api

11 http://ieeeltsc.org/wg12LOM/

12 http://www.adlnet.org/

13 http://www.imsglobal.org/question/

14 Avrupa Komisyonu, “ABYNM: Avrupa Beceriler, Yeterlilikler, Nitelikler ve Meslekler”, https://ec.europa.eu/esco

15 https://github.com/adlnet/xAPI–Spec

16 http://www.bnf.fr/en/tools/a.welcome_to_the_bnf.html

17 http://datahub.io/dataset/l3s-dblp

18 http://lov.okfn.org/dataset/lov/

19 Çevirenin notu: Google’un arama esnasında sağ tarafta konu ile ilgili ayrı bir kutu içerisinde getirdiği bilgi paneli

License

Share This Book