Bölüm 29 Öğrenme Analitiği İçin Bağlı Veri: ÖAB Veri Kümesi

Davide Taibi1, Stefan Dietze2

1 Eğitim Teknolojileri Enstitüsü, Ulusal Araştırma Konseyi, İtalya

ÖZ

Öğrenme analitiklerinin (ÖA) fırsatları uygun verilerin mevcudiyeti ve kalitesi ile sınırlıdır. Verilerin yorumlanması, onu analiz etmek için anahtar ihtiyaçlardan biri olsa da verilerin paylaşılması ve yeniden kullanılması, aynı zamanda, istenilen ölçekte ve çeşitli bağlamlarda ÖA tekniklerinin ve yöntemlerinin doğrulanması için çok önemli faktörlerdir. Belirlenmiş W3C standartlarına (ör. KTÇ1, SPARQL2) dayanan bağlı veri (BV) ilke ve teknikleri hem web ve benzeri ortamlardaki verilerin yorumlanabilirliğini hem de yeniden kullanılabilirliğini kolaylaştırmak için bir yaklaşım sunar ve ÖA’nın endüstri ve akademik alanlarda yaygın olarak benimsenmesinde temel bir bileşendir. Bu bölümde, ÖA’daki BV ve eğitsel veri madenciliği (EVM) fırsatlarına genel bir bakış ve Öğrenme Analitiği ve Bilgi (ÖAB) Veri Kümesine uygulanan özel BV örneğini tanıtıyoruz. ÖAB veri kümesi, titizlikle uygulanan BV ilkelerinin uygulanmasıyla ÖA alanında mevcut bilimsel çalışmalar derleminin neredeyse tamamına yakınına erişimi mümkün kılar. Bu nedenle, ÖAB veri kümesi ÖA topluluğunun merkezi sonuçlarının, yöntemlerinin, araçlarının ve teorilerinin ve zaman içindeki gelişimlerinin incelenmesi için bir odak noktası sağlar.

Anahtar Kelimeler: Bağlı veri, ÖAB veri kümesi

Öğrenme Analitiği (ÖA1) ve eğitsel veri madenciliği (EVM2) son yıllarda artan bir ilgi görmektedir. Bununla birlikte, eğitim uygulamalarında büyük ölçekli katılım ve ayrıca ÖA araştırmalarındaki önemli ilerleme büyük ölçüde mevcut verilerin miktarına ve kalitesine bağlıdır. Öğrenme alanı, konular veya beceriler hakkındaki bilgiler dâhil öğrenme etkinlikleriyle ilgili verileri yorumlayabilmek ve anlayabilmek üst düzey analitik yapmak için ön koşuldur. Ancak öğrenme ortamları aracılığıyla üretilen veriler, bir senaryo içindeki ve hatta organizasyon ve uygulama sınırları çapındaki öğrenme ile ilişkili verileri anlamak ve yorumlamak için genellikle özel terminolojileri veya tanımlayıcıları kullanarak belirli bir öğrenme senaryosuna ve kullanım durumuna ilişkin belirsiz ve oldukça özgüldür.

BV ilkeleri (Bizer, Heath ve Bernes-Lee, 2009), Web’deki verileri göstermek için fiilî bir standart olarak ortaya çıkmıştır ve ÖA verilerinin miktarını ve kalitesini büyük ölçüde 1) verilerin yorumlanmasını mümkün kılması 2) senaryolar ve kurumsal sınırlar boyunca veri kümelerinin web çapında paylaşılması ile arttırma potansiyeline sahiptir. KTÇ ve SPARQL gibi yerleşik W3C standartları sayesinde kolaylaştırılan BV, son zamanlarda Bağlantılı Açık Veri Taramasında3 1000’den fazla veri kümesini aşmakla birlikte son on yıl boyunca önemli bir popülerlik kazanmıştır. BV ve ürünleri, örneğin Google veya Bing gibi büyük arama motorlarında yaygın bir uygulama olarak web araştırmasını kolaylaştırmak için bilgi çizgelerinin kullanılması veya yapılandırılmış gerçekleri ile birlikte web sayfalarına derkenar yazma için Mikro-veri ve KTÇ4’nın artan benimsenmesi gibi her tür varlık-merkezli yaklaşımlar aracılığıyla yaygın bir benimsenme görmektedir. Bu aynı zamanda, veriyi zenginleştiren ve belirginleştiren DBpedia5 veya Freebase6 gibi bilgi grafiklerinin ve eğitim amaçlı paylaşılan sözcük varlıklarının hazır bulunurluğunun büyük ölçüde kolaylaştırmasıyla giderek büyüyen bir eğitsel veri Web’inin (d’Aquin, Adamou ve Dietze, 2013) ortaya çıkmasına neden oldu.

BV ilkelerinin; 1) öğrenme verilerinin apaçık yorumlanmasının (d’Aquin ve Jay, 2013) ve 2) araştırma ve eğitim uygulamalarında ÖA yöntem ve araçlarını ölçmek ve değerlendirmek için kullanılan verilerin yaygın olarak paylaşılmasının sağlanmasıyla ÖA araştırmalarını genişletmeye yönelik temel bir kolaylaştırıcı olarak hareket edilebileceğiyle (d’Aquin, Dietze, Herder, Hendrik ve Taibi, 2014) birlikte ÖA araç ve yöntemlerinin performansının artırılmasını sağlayacağını iddia ediyoruz. Eğitimde BV kullanımının kısa bir özetinden sonra, BV ilkelerinin ÖAB veri kümesi içinde ÖA bağlamında başarılı bir şekilde uygulanmasını sunacağız7. ÖAB veri seti, bir yandan, ÖA’da araştırmayı kolaylaştırmak için BV prensiplerinin başarıyla uygulanmasının tipik bir örneğini temsil ederken diğer taraftan, ÖA ve EVM araştırmalarının neredeyse tamamlanmış bir derlemine erişim sağlayarak kendi başına önemli bir kaynak oluşturur. Bunu, böyle bir derlemden yeni içgörülerin nasıl ortaya çıkabileceğini göstererek BV ilkelerini uygulamanın faydalarını gösteren ve aynı zamanda ÖA ve EVM’deki gözlemlenebilir eğilimler ve konularla ilgili içgörü sağlayan bir dizi örnek izler.

ÖĞRENME VE EĞİTİMDE BAĞLI VERİLER

Uzaktan eğitim ve web üzerinde açık bir şekilde mevcut olan eğitsel veri, kamuya ait yükseköğretim kurumlarının yanı sıra çevrimiçi kaynakların yararlarını kavrayan özel eğitim kurumlarında da yaygın uygulamalar haline geliyor. Bu 1) özel eğitim kaynaklarından, daha gayriresmî bilgi kaynaklarına ve içeriğine kadar değişen öğrenme kaynakları hakkında ve 2) öğrenme etkinlikleri hakkında veri içerir.

BV ilkeleri (Heath ve Bizer, 2011) öğrenme senaryolarındaki hem kaynaklar hem de etkinliklerle ilgili verileri paylaşmak, yorumlamak veya zenginleştirmek için önemli fırsatlar sunar. Temel olarak, BV ilkeleri Kaynak Tanım Çerçevesi (KTÇ) olarak adlandırılan8 ortak bir grafik tabanlı gösterim biçimine, ortak bir sorgulama diline (SPAR9) ve en önemlisi şeyleri (yani varlıkları) adlandırmak için tanımlanabilen/ilişkilendirilebilen GBT’lerin kullanılmasına dayanır. Bu son özellik, web üzerindeki herhangi bir veri kümesindeki herhangi bir varlığın benzersiz tanımlanmasını sağladığı ve dolayısıyla veriyi farklı veri kümeleri arasında birbirine bağladığı için BV için önemli bir kolaylaştırıcıdır. Bu örneğin, DBpedia10 veri kümesindeki11 ÖA’yı temsil eden bir varlığın,İngilizce olmayan DBpedia12‘lardaki eş referanslarla veya Freebase gibi diğer veri kümelerindeki eş referanslarla bağlantılı olmasını kolaylaştırır.13

Bu ilkeler, örneğin DBpedia, WordNet KTÇ14 veya data.gov.uk girişimi gibi etki alanları arası veriyle birlikte örneğin kültürel mirasa ilişkin veri (ör. Europeana veri kümesi15) gibi etki alanına özgü uzman sözcük dağarcıkları da dâhil Web’de global bir BV çizgesinin ortaya çıkmasını sağlamıştır. Bu aynı zamanda Açık Üniversite (İngiltere)16 veya Ulusal Araştırma Konseyi (İtalya17) gibi kurumlardan ve ayrıca mEducator Bağlantılı Eğitim Kaynakları (Dietze, Taibi, Yu ve Dovrolis, 2015) gibi kamuya açık eğitim kaynaklarından gelen veriler de kapsayan embriyonik bir “Eğitim Verileri Ağı” oluşturulmasına yol açmıştır (genel bakış için bk. D’Aquin vd., 2013; Taibi, Fetahu ve Dietze, 2013 ve Dietze vd., 2013). LinkedEducation.org,18 LinkedUniversities.org19 ve LinkedUp20 gibi girişimler, bu alandaki insanları ve çalışmaları bir araya getirmek için ilk çabaları sağlamıştır. Linkedin Katalog21, bu bağlamda, Açık Kurs Yazılımları (AKY) veya mEducator veri kümeleri, bibliyografik kaynaklar veya diğer bilgi kaynakları hakkında üst veri gibi özel açık eğitim kaynakları (AEK) hakkında veriler içeren eğitim senaryoları ile ilgili halka açık BV’nin eşsiz bir koleksiyonudur.

Öğrenme etkinlikleriyle ilgili veri sıkça bulunmamakta ve veri paylaşımları ise çok daha az olsa da BV sosyal ve etkinlik ya da ilgi verilerinin (Dietze, Drachsler ve Giordano, 2014) temsilini kolaylaştırmak amacıyla benimsenmesi ile ilgili Ben Ellefi, Bellahsen, Dietze ve Todorov (2016) kapsamlı bir genel bakış sunmaktadır. ÖA alanında, BV ilkeleri büyük ölçüde verinin belirginliğini, yorumlanmasını ve kavranmasını iyileştirebilir (d’Aquin ve Jay, 2013; d’Aquin vd., 2014). Alana özgü veya alanlar arası olan referans bilgi çizgeleri, yakalanan öğrenme analitiği verisinin (ör. konular veya yeterlilikler vb. hakkındaki veri) yorumlanmasını ve analitik olarak işlenmesini verinin belirsizliklerini gidererek ve veriyi zenginleştirerek önemli ölçüde geliştirebilir. Bu belirli senaryolar içinde öğrenme analitiği yöntemlerinin ve araçlarının performansını iyileştirebilir (d’Aquin ve Jay, 2013).

Bununla birlikte, Anlamsal Ağ teknolojileri gibi muhakeme temelli yaklaşımlarla uğraşırken bazı sınırlamalar belirgindir. Bilgi temsili konusundaki yorumlama ve muhakemenin bilgi işlemsel talepleri göz önüne alındığında, BV tabanlı yaklaşımların geleneksel İVYS tabanlı22 yöntemlerden daha az ölçeklenebilir olduğu bilinmektedir. Bununla birlikte, mevcut KTÇ depolama ve muhakeme motorlarının olgunluğu göz önüne alındığında, bu özellikle ÖA ve EVM ortamlarında daha az sıklıkta olan çok büyük ölçekli veri kümeleri için geçerlidir. Diğer sorunlar arasında bağlantıların eksikliği, şema terimlerinin yanlış kullanılması veya ortaya çıkan verilerin anlamsal ve sözdizimsel nitelik açısından yetersizliği sayılabilir. Bununla birlikte, bu konular hiçbir şekilde BV tabanlı veri kümelerine özel veya özgün değildir, aksine her türlü veri yönetimi teknolojilerinde geçerlidir.

Tablo 29.1. EAA Formatında Kodlanan Söylem Verilerinin Düzenlenmiş Alıntıları

Yayın Yeri

# Makaleler

Tür

Adlandırılmış Çizge GBT’si

BİMK Uluslararası Öğrenme Analitiği ve Bilgisi Konferansı Bildirileri (LAK) (2011–2014) 166 BİMK http://lak.linkededucation.org/-acm

http://lak.linkededucation.org/-acm/body

Uluslararası Eğitsel Veri Madenciliği (EVM) Konferansı Bildirileri (20082014) 463 Açık Erişim http://lak.linkededucation.org/-openaccess

http://lak.linkededucation.org/-open-access/body

George Siemens ve Dragan Gašević’in 2012’de hazırladığı: Eğitim Teknolojisi ve Toplum, 15(3), 1-163. “Öğrenme ve Bilgi Analitiği” özel sayısı.

10

Açık Erişim

Eğitsel Veri Madenciliği Dergisi (20092014)

29

Açık Erişim

Öğrenme Analitiği Dergisi (2014) 16 Açık Erişim
ÖAB veri savaşımı bildirileri (2013-2014) 13 Açık Erişim

Bu nedenle, ÖA verilerinin BV ilkelerine göre paylaşılması, bir dizi gerçek dünya veri kümeleri ve senaryolarında değerlendirmelerini sağlayarak, ÖA araçlarının ve yöntemlerinin benimsenmesini ve iyileştirilmesini önemli ölçüde arttırma potansiyeline sahiptir.

ÖAB VERİ KÜMESİ: ÖĞRENME ANALİTİĞİ TOPLULUĞU İÇİN BİR BAĞLI VERİ DERLEMİ

ÖA verilerinin paylaşılması amacıyla BV ilkelerinin benimsenmesine dair en iyi uygulama örneğini sağlamak için, Öğrenme Analitiği Araştırmaları Derneği (SoLAR), BİMK, LinkedUp projesi ve İtalya Ulusal Araştırma Konseyi Eğitim Teknolojileri Enstitüsünden (İUAK-ETE) oluşan uluslararası bir konsorsiyumun ortak bir çabası olan ÖAB veri kümesini sunuyoruz. ÖAB veri kümesi, 2011 yılından bu yana hem üst verileri hem de makalelerin tam metinlerini ortaya çıkarmak için BV ilkeleri uygulandığı (Dietze, Taibi ve d’Aquin, 2017) ÖA ve EVM alanlarında toplanan araştırma çalışmalarının neredeyse tamamlanmış bir derlemidir. Bu nedenle, derlem, ÖA topluluğunun kapsamı ve evrimi hakkında eşi görülmemiş bir araştırma yapmayı mümkün kılmaktadır. Burada, Tablo 29.1’de, ÖAB veri kümesinde yer alan yayınlara genel bir bakış sunulmaktadır. Kaynakların çeşitliliği göz önüne alındığında, veriler dört alt çizgeye ayrılmıştır (farklı lisans modellerinin uygulandığı Tablo 29.1’in son sütunu).23

Verinin geniş ölçüde birlikte çalışabilirliğini sağlamak için en iyi BV uygulamalarını24 uyarladık ve bilimsel yayınların temsili için yaygın olarak kullanılan kelime dağarcıklarını araştırdık. Veri modelimizin kapsamı yalnızca tek bir kelime dağarcığı kapsamında değildir. Bu sebeple, tüm temsil edilen terimler için BIBO, FOAF25, SWRC ve Schema.org gibi yerleşmiş kelime dağarcıklarını kullanmayı seçtik ve seçilen kelime dağarcıkları ve onlarla örtüşen diğerlerini de dâhil ettik26. Kelime dağarcığı terimlerinin seçimi, kullanılan şemaların web genelinde benimsenmesi ve olgunlaşmasından ve bunların veri modelimizle örtüşmesinden etkilenmiştir. Tablo 29.2, ÖAB veri kümesinde temsil edilen kavramları ve bunların popülasyonunu bildirirken, Tablo 29.3 en sık doldurulmuş özellikleri özetlemektedir.

Tablo 29.2. ÖAB Veri Kümesindeki Varlık Evreni

Kavram

Tür

#

Kaynakça schema:YaratıcıÇalışma 7885
Yazar swrc:Kişi 1214
Konferans Makalesi swrc:Bildirilerde 697
Kuruluş swrc:Kuruluş 365
Dergi Makalesi swrc:Makale 45
Konferans Bildirileri swrc:Bildiriler 15
Dergi Sayısı bibo:Sayı 9
Dergi bibo:Dergi 2

Örneğin yazar ve yayın yeri eş referanslarına ve tamamlayıcı bilgilere bağlantılar sağlamak gibi amaçlar için BV’nin dâhili özellikleri kullanarak ÖAB veri kümesi diğer veri kümelerine yapılan varlık bağlantıları ile zenginleştirilir. Özellikle, Semantic Web Dog Food (SWDF)27 veri kümesi ve DBLP ile olan bağlantılar ÖAB veri kümesindeki yazarlar ve mekânlar hakkında örneğin daha geniş bilimsel etkinlikleri ve etkileri gibi ek bilgiler sağlar. Bu örneğin, tanımı gereği dar bir kapsamı olan (ÖA ve EVM) olan ÖAB veri kümesinin yüksek odaklanmış yapısını tamamlamak için yararlıdır ve aksi takdirde bu topluluktaki faaliyetlerle ilgili araştırmaları sınırlar. Öte yandan, bu tür kurulan bağlantılar, mevcut derlemleri ÖAB veri kümesinde yer alan verileri kullanarak 1) sınırlı üst verileri ek özelliklerle zenginleştirmek, 2) DBLP’ye veya Semantic Web Dog Food’a yansıtılmamış ek yayınlar içermek yoluyla bir bütün olarak Bilgisayar Bilimleri alan yazınının daha kapsamlı bir bilgi çizgesini oluşturarak zenginleştirmektedir.

Tablo 29.3. ÖAB Veri Kümesindeki Varlık Evreni

Alan

Özellik

Aralık

#

schema:Makale schema:alıntı schema:YaratıcıÇalışma 10828
swrc:Bildirilerde dc:konu literal 3392
foaf:Aracı foaf:yapılmış swrc:Bildirilerde 2199
foaf:Kişi rdfs:etiket literal 1583
foaf:Aracı foaf:sha1özet literal 134′
swrc:Kişi swrc:üyelik swrc:Kuruluş 1293
foaf:Kişi foaf:konum_yakın geo:UzamsalNesne 1243
schema:Makale schema:makaleGövdesi literal 698
bibo:Makale bibo:soyut literal 697
bibo:Sayı bibo:sahipParça bibo:Makale 45
swrc:Bildiriler swc: olayİleİlgili swc:KonferansOlayı 14
bibo:Dergi bibo:sahipParça bibo:Sayı 9

DBpedia’ya referans kelime dağarcığı olarak dış bağlantılar oluşturulmuştur. Yayınların konuya benzerliklerine göre daha yapılandırılmış bir şekilde alınmasına ve kümelenmesine izin vermek amacıyla DBpedia’yı makale konu açıklama notları için referans kelime dağarcığı olarak kullanarak yazarlar tarafından sağlanan Anahtar Kelimeleri DBpedia’daki ilgili varlıklara bağladık. Şekil 29.1, çözülmüş veya zenginleştirilmiş ÖAB varlıklarının bağlantılarını göstermektedir.

Şekil 29.1. ÖAB veri kümesini birbirine bağlamak.

BV’nin niteliği göz önüne alındığında, bu tür bağlantıların kurulması yalnızca ÖAB veri kümesi varlıklarının aranması ve DBLP, SW Dog Food ve DBpedia’daki karşılıklı atıfta bulunan varlıkların IRI’larını belirten owl:benzerOlan ifadelerinin eklenmesi ile ilgili olmuştur. Dolayısıyla bu süreç BV’nin temel prensipleri tarafından etkin kılınır ve örneğin işleri tanımlamak için GBT’leri kullanmak ve temel motivasyonu göstermek için SPARQL sorgularını kullanmak: izole edilmiş veri kümelerinden ziyade global bir veri grafiğinin oluşturulması bu duruma bir örnektir.

ÖAB DERLEMİNE YÖNELİK VERİ-ETKİNLEŞTİRİLMİŞ BAĞLI İÇGÖRÜLER: ÖĞRENME ANALİTİĞİ ARAŞTIRMASININ KAPSAMI VE EĞİLİMLERİ

ÖAB veri kümesinde uygulanan BV ilkelerinin kullanımını göstermek için, yukarıda açıklandığı gibi veri kümesindeki dâhili bağlantılar yoluyla etkinleştirilmiş bazı basit analizler sunuyoruz. ÖAB Veri Meydan28 Okuması başvuruları ve yayınlarında çok çeşitli ek araştırmalar bulunabilirken, burada çok basit araştırmalar ve araştırma soruları üzerine odaklanıyoruz. Bunlar ÖAB veri kümesi ve birbirine bağlı veri kümeleri üzerindeki SPARQL sorgularını birleştirerek ve önceki bölümde açıklanan eş referanslar arasındaki bağlantılardan yararlanarak basitçe cevaplanabilir. Bu analizler öncelikle, farklı kaynaklardan gelen verileri birleştirerek karmaşık araştırma sorularını cevaplamanın kolaylığını göstermeyi amaçlamaktadır. Özellikle aşağıdakilerle ilgili soruları inceliyoruz:

Tablo 29.4. ÖAB 2011 Konferansının Önceden Yayınlanan En Önemli 20 Konferansı ve Dergileri

Konferans veya Dergi

DBLP kaynağı

%

Akıllı Öğretici Sistemler Konferansı http://dblp.l3s.de/d2r/resource/conferences/its 24.49
Eğitsel Veri Madenciliği Konferansı http://dblp.l3s.de/d2r/resource/conferences/edm 12.05
Eğitimde Yapay Zekâ Konferansı http://dblp.l3s.de/d2r/resource/conferences/aied 11.15
Avrupa Teknoloji Destekli Öğrenme Konferansı http://dblp.l3s.de/d2r/resource/conferences/ectel 7.31
İleri Öğrenme Teknolojileri Uluslararası Konferansı http://dblp.l3s.de/d2r/resource/conferences/icalt 5.51
Yapay Zekâ üzerine YZGK Konferansı http://dblp.l3s.de/d2r/resource/conferences/aaai 4.36
UM Konferansı http://dblp.l3s.de/d2r/resource/conferences/um 4.36
Uluslararası Eğitsel Veri Madenciliği Konferansı http://dblp.l3s.de/d2r/resource/conferences/icdm 3.72
Bilgi Keşfi Süreci ve Veri Madenciliği Konferansı http://dblp.l3s.de/d2r/resource/conferences/kdd 3.59
Uluslararası Eğitimde Yapay Zekâ Dergisi http://dblp.l3s.de/d2r/beceri̇/journals/aiedu

2.56

ETS dergisi http://dblp.l3s.de/d2r/resource/journals/ets 2.31
Bilgisayar Destekli İşbirlikli Öğrenme Konferansı http://dblp.l3s.de/d2r/resource/conferences/cscl 2.31
Uluslararası Makine Öğrenimi Konferansı http://dblp.l3s.de/d2r/resource/conferences/icml 2.31
Bilgisayar Bilimi Dergisi http://dblp.l3s.de/d2r/resource/journals/jucs 2.18
Uluslararası Öğrenme Bilimleri Konferansı http://dblp.l3s.de/d2r/resource/conferences/icls 2.18
BİMK BİE Konferansı http://dblp.l3s.de/d2r/resource/conferences/chi 2.18
İnternet Sunucuları Ağı Konferansı http://dblp.l3s.de/d2r/resource/conferences/www 2.18
UHO Konferansı http://dblp.l3s.de/d2r/resource/conferences/ah 1.92
Uluslararası Yapay Zekâ Konferansı http://dblp.l3s.de/d2r/resource/conferences/ijcai 1.67
Makine Öğrenmesi Dergisi http://dblp.l3s.de/d2r/resource/journals/ml 1.67
  1. Bu kısmen yeni araştırma alanının disiplinlerinin ve alt alanlarının şekillenmesi için ÖA topluluğundaki araştırmacıların odak noktaları ve araştırmalarındaki arka plan: Bu araştırma DBLP verilerini kullanarak ÖA araştırmacılarının diğer alanlardaki yayın faaliyetleri ile ilgili bilgilerden yararlanmaktadır.

  2. ÖA alanındaki kilit konuların önemi ve zaman içindeki değişimleri: Bu araştırma, DBpedia’daki ÖA anahtar kelimelerinin (veya varlıklarının) konu (veya kategori) eşlemesini ve ilişkilerini değerlendirir.

  3. Verilerden elde edilebilen ÖA ve BV toplulukları arasındaki göze çarpan bağlantılar.

Her iki durumda da, incelemelerimiz, ÖA araştırmalarının yıllar içinde gelişimini incelemek için, ÖAB veri kümesinde bulunan 2011-2014 yılları arasındaki ÖAB konferanslarının tüm yayınlarını dikkate alarak yapılmıştır.

Öğrenme Analitiği Topluluğunu Kim İnşa eder? ÖA Araştırmacılarının Yayın Faaliyetleri

ÖA’nın gelişimi, makine öğrenmesi, yapay zekâ, eğitim teknolojisi ve pedagoji gibi sayısız akademik disiplinlerin kesişmesinden etkilenmiştir (Dawson, Gašević, Siemens, & Joksimović, 2014). Bu sebeple, ÖAB konferansı ilk yılından bu yana, araştırmacıların her birinin tanımlarına, terminolojilerine ve araştırma yöntemlerine katkıda bulunan ve böylece ÖA’nın tanımını şekillendiren farklı bilimsel alanların dikkatini çekmiştir. ÖAB veri kümesinin temel verileri, yalnızca ÖA ile ilgili yayın faaliyetleriyle sınırlıdır, katkıda bulunan araştırmacıların kökeni ve araştırma geçmişi hakkında herhangi bir analiz yapılmasını mümkün kılmaz. Bununla birlikte, derlemin BV doğası, bu tür yeni bilgileri ortaya çıkarmak için kullanılabilecek anlamlı bağlantılar sağlar. Aslında, ÖAB veri kümesindeki yazarları temsil eden kaynakları DBLP veri kümesindeki yazarlarla ilişkilendirerek, yazarların ilgilendiği alanlar hakkında daha fazla bilgi birkaç SPARQL sorgusuyla gerçekleştirilebilir.29

2011’den 2014’e kadar her yıl tüm ÖAB yazarları için, önceki konferanslarda ve dergilerdeki yayın sayısını ilk önce analiz ettik. 1) ÖAB veri kümesinde ilgili yılın tüm yazarlarını alarak ve 2) önceki yayın alanlarını (dergiler, konferanslar) DBLP’den aldık. 2011 yılına ait en iyi 20 konferans ve dergi Tablo 29.4’te verilmiştir. Bu tablo, ilk baskıda, ÖAB Konferansının esas olarak Akıllı Öğretici Sistemleri, Eğitsel Veri Madenciliği, Yapay Zekâ ve Teknoloji Geliştirilmiş Öğrenme konferansları ile ilgili önceki yayınlarla ilgili yazarları içerdiğini vurgulamaktadır. Teknik bir bakış açısından, ÖAB ve DBLP veri kümeleri arasındaki bağlantılar aşağıdaki gibi oluşturulmuştur: ÖAB yazarları, owl:sameAs özelliği aracılığıyla DBLP veri kümesindeki ortak başvuruları ile bağlantılıdır. DBLP yazarları, sırasıyla swrc: series ve swrc: journal özellikleri aracılığıyla önceki konferanslarda ve dergilerdeki yayınlarıyla bağlantılıdır. İki veri kümesini içeren bir birleştirilmiş sorgunun yürütülmesi, önceki konferanslarda ve dergilerde ÖAB yazarlarının yayın sayısı hakkında bilgi edinmemize izin verir.

Şekil 29.2. ÖAB veri kümesini birbirine bağlamak.

Şekil 29.2’de, ÖAB yazarlarının 2011’den 2014’e kadar ilk 10 konferans ve yazılarının yayınlandığı derginin sırasını sunuyoruz. En üstteki üç pozisyon, AÖS (Akıllı Öğretici Sistemler), EVM (Eğitsel Veri Madenciliği) ve EYZ (Eğitimde Yapay Zekâ) konferansları / dergileri tarafından paylaşılmıştır. 2013 yılından başlayarak ÖAB konferansı ilk 10 da yer almaya başlamış 2014’te önemini arttırmış kendi başına önemli bir topluluğun oluşumunu sağlamıştır. Aynı yıl, FYZAD (Florida Yapay Zekâ Araştırmaları Derneği) konferansında yayınlanan bildiri sayılarında da artış olmuştur. TDÖAK (Teknoloji Destekli Öğrenme Avrupa Konferansı) ve İÖTUK (İleri Öğrenme Teknolojileri Uluslararası Konferansı) konferanslarındaki yayınlar da geçen yıl küçük bir sapma ile listenin başında yer almaktadır.

ÖA Alanını Hangi Konular Oluşturuyor? Konu Dağılımı Zaman İçinde Nasıl Değişir?

Önceki araştırmaların aksine, ÖAB konferans yayınlarının ilgili DBpedia varlıklarıyla birleştirilmesi, DBpedia bilgi grafiğini ve varlıkların ve kategorilerin doğal bağlarını analiz ederek ele alınan konuların anlamını araştırmamıza izin verir. Bu örneğin, ÖAB makalelerinin örtüşmesini Bilgisayar Bilimi, İstatistik, Teknoloji Destekli Öğrenme veya Veri Analizi gibi diğer disiplinlerle tanımlamamızı sağlar.

Önceki bölümde açıklandığı gibi ÖAB veri kümeleriyle ve DBpedia varlıkları arasındaki bağlantılar gelişmiş VİT (Varlık İsmi Tanıma) yöntemleri (DBpedia Spotlight) aracılığıyla terimlerin (anahtar kelimeler) netleştirilmesiyle yapıldı. Bu örneğin “bilgisayar destekli test” ve “biçimlendirici değerlendirme” gibi anahtar kelimeleri sırasıyla ilgili DBpedia varlıklarına, http://dbpedia.org/resource/E-assessment ve http://dbpedia.org/resource/Formative_assessation (bk. Şekil 29.3)30. Her DBpedia ögesi sırayla, dc:konu özelliği ile ilgili DBpedia kategorilerine bağlanır; örneğin, Eğitsel_ölçme_ve_değerlendirme kategorisi dc: DBpedia kaynaklarının konusudur: Biçimlendirici değerlendirme, E-değerlendirme, Akran değerlendirme ve Eğitim değerlendirme, sadece birkaçı. Bu şekilde, makaleler DBpedia grafiğindeki yapısal benzerliklerine göre gruplanabilir. ÖAB veri kümesinde en yüksek frekans değerine sahip ilk 10 DBpedia kategorisinin listesi Şekil 29.4’te gösterilmiştir.31

Şekil 29.3. Bağlantılı yayınlar ve DBPedia.

Bu örneğin, ÖAB makalelerinin örtüşmesini Bilgisayar Bilimi, İstatistik, Teknoloji Destekli Öğrenme veya Veri Analizi gibi diğer disiplinlerle tanımlamamızı sağlar.

Şekil 29.4. ÖAB veri kümesi için en iyi 10 DBPedia kategorisi (2011-2014 yılları arasını içeren yayınlar).

2011’den 2014’e kadarki en sık kullanılan 10 kategori kümesinden başlayarak, her konferans yılı için çıkarılan tüm DBpedia kategorileri ile bu “temel kategoriler” kümesinde bulunan kategoriler arasındaki mesafeleri değerlendirdik. DBpedia tarafından kullanılan BBÖSÖ1 özellikleri bu mesafeyi hesaplamak için kategoriler arasındaki ilişkileri temsil eden kategori grafiği kullanılmıştır. Örneğin, Uzaktan_eğitim Eğitim_teknolojisi için “skos:broader” olduğundan ve sırasıyla da E-öğrenme de Uzaktan_eğitim için skos:broader olduğundan E-Öğrenme ve Eğitim-teknolojisi arasındaki mesafe 2′dir.

DBpedia kategorileri ve ÖAB konferans raporları arasındaki ilişki, ÖAB yayınlarının yıllar içinde kapsadığı konuların eğilimini izlemeyi de kolaylaştırır. Şekil 29.5’teki radar şeması, her konferans yılı için çıkarılan tüm kategoriler ve “temel kategori” setine dâhil edilen her kategori arasındaki hesaplanan ortalama mesafeye genel bir bakış sunar. Şekil analizinden, aşağıdaki hususlar ortaya çıkar:

  • Eğitim_teknolojileri 2012’de kilit bir rol oynadı ancak diğer yıllarda daha özel kategoriler önem kazandı

  • Öğrenme ve Değerlendirme oldukça kapsamlı olan kategorileri ile tüm yıllarda en fazla ilgi düzeyine sahip olmuştur

  • Değerlendirme için ilgi düzeyi 2011’den 2012’ye kadar hassas olmak üzere yıllar içinde artış eğilimindedir.

  • İstatistiksel_modeller 2011’de zirve yapmış ve takip eden yıllarda azalmıştır.

Şekil 29.5. İlk 10 kategorinin zaman içindeki evrimi.

Seçilen kategorilere yönelik eğilimleri daha iyi anlamak için Şekil 29.6, belirli bir kategorinin gerçekleşme sayısı eksi tüm frekansların ortalamasının standart sapmaya bölümü olarak rastgele seçilen üç kategori için hesaplanan normalleştirilmiş frekansı açıklar. Semantik_Web kategorisi 2013 yılında ÖAB yayınlarında görünmüş ve 2013-2014 arasında hafif bir artış gözlenmiştir. Söylem_analizi kategorisine yönelik eğilimin analizi, geçen yıl kaydedilen olağanüstü bir artışla yıllar içinde olumlu bir artış yaşandığını ortaya koymaktadır. Tüm bunlar aksine, Sosyal_ağlar kategorisi için olumsuz bir eğilim gözlemliyoruz. Aslında bu kategorinin ilgi düzeyi 2011 -2013’de hafif bir artış göstererek 2014’den önemli ölçüde azalmıştır.

Şekil 29.6. Seçilen kategorilerin evrimi, 2011-2014.

BV ve ÖA Toplulukları Arasında Bir Bağlantı Var mı?

Yukarıda belirtildiği gibi, ÖAB topluluğuna katkıda bulunan yazarların analizi ve ÖAB yayınlarının konu kapsamı, bu makalenin kapsamı ile ilgili bir soru olan, Semantik Web’in ÖAB topluluğundaki araştırmacılar üzerindeki etkisi hakkında ipuçları sunar. Şekil 29.7, DBLP veya Semantic Web Dog Food veri kümesi ile bağlantılı yazarların yüzdesini gösterir ve yazarların Semantic Web topluluğundan artmasıyla ilgili olumlu bir eğilim gösterir. Bu ÖA topluluğunda daha güçlü yayın yapan SW araştırmacılarına ya da ÖA araştırmacılarının SW ile ilgili yerlerde yayınlamaya başlamasına bağlanabilir.

Şekil 29.7. DBLP ve Semantic Web Dog Food içerisinde temsil edilen ÖAB yazarlarının yüzdesi.

Bunu daha fazla araştırmak için, ÖA yazarlarının Semantik Web ile ilgili yayınlarının sayısını belirlemek için ÖAB veri kümesinin yazarları ile Semantic Web Dog Food arasındaki bağlantılardan yararlanılmıştır. Şekil 29.2’den de bildiğimiz gibi, SW konferansları ÖAB yazarları için önceki 10 yayın listesinde yer almıyor ancak ÖA yazarları tarafından SW konferanslarında yayınlanan makalelerin yüzdesi, toplam sayı 2014 yılında azalmış olsa bile yıllar boyunca olumlu bir eğilim gösteriyor Şekil 29.8’de görülebileceği gibi.

Şekil 29.8. ÖAB yazarlarının SW konferanslarında daha önceki yayınlara olan eğilimleri.

Bu içgörülerin bazıları şaşırtıcı olmasa da üretilebilmelerindeki kolaylık vurgulanmaya değer: Her durumda, farklı veri kümelerindeki (ÖAB, DBpedia, DBLP, SWDF) ortak referanslar arasında daha önceden kurulmuş bağlantıların çok daha karmaşık soruları cevaplamak için bu farklı kaynaklardan gelen verilerin korelasyonunu sağladığı yerlerde veriler birkaç SPARQL sorgusuyla getirilmiştir.

SONUÇLAR VE ÖĞRENİLEN DERSLER

ÖA verileri veya herhangi bir veri türü ile çalışırken BV ilkelerinin uygulanması, özellikle verileri anlamak ve yorumlamak için faydalıdır. BV ilkelerinin temel bir bileşeni olarak, etkinleştiren yapı taşlarından biri, temelde küresel bir bilgi grafiği oluşturmak için çapraz veri kümesi bağlantısı ve sorgulaması için temeller sağlayan web üzerindeki varlıkları ve şema terimlerini tanımlamak için küresel GBT’lerin kullanılmasıdır.

ÖA’da BV ilkelerinin benimsenmesinden doğan fırsatları göstermek ve ÖA topluluğunun ve disiplininin durumuna ve evrimine bazı görüşler sunmak için bir dizi örnek soru ve görüş ile birlikte ÖAB veri kümesini başlattık. Bunlar arasında ÖA topluluğunun kompozisyonunun yanı sıra, DBLP veya DBpedia gibi diğer BV kaynaklarını arka plan bilgisi olarak değerlendirirken ÖAB veri kümesinden elde edilebilecek önemli konular ve eğilimler araştırılmaktadır.

Bu öngörüler, ÖA alanının durumunu ayrıntılı bir şekilde incelemek için yapılmamasına karşın BV ilkelerine uymaktan ve verileri yorumlamak için harici veri kaynaklarından yararlanmaktan ve daha karmaşık araştırma sorularının araştırılmasından kaynaklanan fırsatlara, tekil veri kaynaklarına bakarak mümkün olmayacak bir bakış açısı sağlarlar.

Bu bağlamda, webdeki verileri paylaşırken ve yeniden kullanırken, 1) veri yayınlama tarafı ve 2) veri analiz tarafı ile ilgili olarak en iyi uygulamalar ortaya çıkar. Birincisi ile ilgili olarak, önceki çalışma (Dietze, Taibi ve d’Aquin, 2017), ÖAB veri kümesini oluştururken ve yayınlarken uygulanan uygulamaları ve tasarım seçimlerini açıklar. Burada, genel BV ilkelerinin yanında, yerleşmiş ve iyi kullanılan söz varlığı terimlerinden bir şema tasarlamaya özellikle dikkat ettik. Kullanılan kelime terimlerinin geniş bir şekilde benimsenmesi, bunların kapsamı ve ÖAB veri kümesinin veri modeliyle eşleşmesi ve bunların doğal uyumlulukları gibi bir dizi kriteri dikkate aldık. ÖA topluluğunun ve bunun bilimsel çıktısının daha anlamlı analizini sağlamak için DBLP veya DBpedia gibi adayları seçerken benzer kriterleri uyguladık. Bağlama görevi için aday veri kümelerini bulmak doğası gereği zor bir sorun olsa da veri kümesi sağlayıcılarına yardımcı olmak için modern yaklaşımlar (Ben Ellefi vd., 2016) uygulanabilir.

ÖAB veri kümesine ilişkin ilk analizimiz, ÖAB topluluğunun ve evriminin belirli yönlerine sınırlı bir bakış açısı sunarken, geleneksel bir veritabanının aksine, iyi tanımlanmış ve birbirine bağlı bir veri kümesi kullanılarak belirli araştırma sorularının araştırılmasının kolaylığını göstermektedir. ÖA topluluğunun daha kapsamlı çalışmaları, ÖAB veri kümesinde yer alan verilerin yenilikçi bir şekilde keşfedilmesini sağlamaya yönelik uygulamalar geliştirmek üzere araştırmacıların davet edildiği ÖAB Veri Mücadelesinin bir parçası olarak yapılmıştır.

 

KAYNAKÇA

d’Aquin, M., Adamou, A., & Dietze, S., (2013). Assessing the educational linked data landscape. Proceedings of the 5th Annual ACM Web Science Conference (WebSci’13), 2–4 May 2013, Paris, France (pp. 43–46). New York: ACM.

d’Aquin, M., & Jay, N. (2013). Interpreting data mining results with linked data for learning analytics: Motivation, case study and direction. Proceedings of the 3rd International Conference on Learning Analytics and Knowledge (LAK’13), 8–12 April 2013, Leuven, Belgium (pp. 155–164). New York: ACM.

d’Aquin, M., Dietze, S., Herder, E., Drachsler, H., & Taibi, D. (2014). Using linked data in learning analytics. eLearning Papers, 36. http://hdl.handle.net/1820/5814

Ben Ellefi, M., Bellahsene, Z., Dietze, S., & Todorov, K. (2016). Intension-based dataset recommendation for data linking. In H. Sack, E. Blomqvist, M. d’Aquin, C. Ghidini, S. P. Ponzetto, & C. Lange (Eds.), The Semantic Web: Latest Advances and New Domains (pp. 36–51; Lecture Notes in Computer Science, Vol. 9678). Springer.

Bizer, C., Heath, T., & Bernes-Lee, T. (2009). Linked data: The story so far. https://wtlab.um.ac.ir/images/e-library/linked_data/Linked%20Data%20-%20The%20Story%20So%20Far.pdf

Dawson, S., Gašević, D., Siemens, G., & Joksimović, S. (2014). Current state and future trends: A citation network analysis of the learning analytics field. Proceedings of the 4th International Conference on Learning Analytics & Knowledge(LAK’14), 24–28 March 2014, Indianapolis, IN, USA (pp. 231–240). New York: ACM.

Dietze, S., Sanchez-Alonso, S., Ebner, H., Yu, H., Giordano, D., Marenzi, I., & Pereira Nunes, B. (2013). Interlinking educational resources and the web of data: A survey of challenges and approaches. Program: Electronic Library and Information Systems, 47(1), 60–91.

Dietze, S., Taibi, D., Yu, H. Q., & Dovrolis, N. (2015). A linked dataset of medical educational resources. British Journal of Educational Technology, 46(5), 1123–1129.

Dietze, S., Taibi, D., & d’Aquin, M. (2017). Facilitating scientometrics in learning analytics and educational data mining: The LAK dataset. Semantic Web Journal, 8(3), 395–403.

Dietze, S., Drachsler, H., & Giordano, D. (2014). A survey on linked data and the social web as facilitators for TEL recommender systems. In N. Manouselis, K. Verbert, H. Drachsler, & O. C. Santos (Eds.), Recommender systems for technology enhanced learning: Research trends and applications (pp. 47-77). Springer.

Heath, T., & Bizer, C. (2011). Linked data: Evolving the web into a global data space. San Rafael, CA: Morgan & Claypool Publishers.

Taibi, D., Fetahu, B., & Dietze, S. (2013). Towards integration of web data into a coherent educational data graph. Proceedings of the 22nd International Conference on World Wide Web (WWW’13), 13–17 May 2013, Rio de Janeiro, Brazil (pp. 419–424). New York: ACM. doi:10.1145/2487788.2487956.


1 http://solaresearch.org

2 http://www.educationaldatamining.org

3 http://linkeddatacatalog.dws.informatik.uni-mannheim.de/state/

4 https://www.w3.org/TR/xhtml–rdfa-primer/

5 http://dbpedia.org

6 http://freebase.org

7 http://lak.linkededucation.org

8 http://www.w3.org/TR/2014/NOTE-rdf11-primer-20140624/

9 http://www.w3.org/TR/rdf-sparql-query/

10 DBpedia (“veritabanı” için “DB” den) Wikipedia projesinde oluşturulan bilgilerden yapılandırılmış içerik çıkarmayı amaçlayan bir projedir. Bu yapılandırılmış bilgi World Wide Web’de yayınlanmaktadır. DBpedia kullanıcılar Wikipedia kaynakların sorgu ilişkiler ve özellikler, diğer ilgili veri bağlantıları da dâhil olmak üzere anlamsal sağlar. Tim Berners-Lee, DBpedia’yı merkezileştirilmiş Bağlı veri çabasının en ünlü bölümlerinden biri olarak nitelendirdi.

11 http://dbpedia.org/page/Learning_analytics

12 http://fr.dbpedia.org/resource/Analyse_de_rapprentissage

13 http://rdf.freebase.com/ns/rn.0crfzwn

14 http:/www.w3.org/TR/2006/WD-wordnet-rdf-20060619/

15 http://ckan.net/package/europeana-lod

16 http://data.open.ac.uk

17 http://data.cnr.it

18 http://linkededucation.org

19 http://linkeduniversities.org

20 http://linkedup-project.eu

21 http://data.linkededucation.org/linkedup/catalog/

22 İlişkisel veritabanı yönetim sistemi.

23 Grafik verileri http://lak.linkededucation.org/openaccess/ den alınmıştır, CC-BY ile lisanslanmıştır. Grafikteki veriler için http://lak.linkededucation.org/acm/*, BİMK ile verilerin araştırma amacıyla yayınlanması, paylaşılması ve yeniden kullanılması için resmî bir anlaşma imzaladık. https://creativecommons.org/licenses///2.0

24 http://www.w3.org/TR/ld-bp/#VOCABULARIES

25 http://xmlns.com/foaf/spec/

26 Şu anda uygulanan şemaya http://lak.linkededucation.org/schema/lak.rdf adresinden ulaşılabilir. Bu URL her zaman şemanın en son sürümüne atıfta bulunurken, mevcut ve önceki sürümlere http://lak.linkededucation.org/ schema/ lak-v0.2.rdf adresinden ulaşılabilir.

27 http://data.semanticweb.org/

28 Http://lak.linkede–ducation.org adresindeki başvuru ve yayın bölümlerine bakın.

29 AVBK veri kümesindeki 1214 yazarın %36’sı DBLP’deki (%86) ve SWDF veri kümelerindeki (%14) karşılık gelen kaynakla bağlantılıdır.

30 Şu gazetelere bakın: http://data.linkededucation.org/resource/lak/conference/lak2011/paper/54 and http://data.linkede–ducation.org/resource/lak/conference/lak2014/paper/616

31 DBpedia kategorilerine yapılan başvurular şu şekildedir: http://dbpedia.org/page/Category:Educational_psychology , http://dbpedia.org/ Sayfa/ Kategori : Eğitim teknolojisi ve benzeri.

33 DBpedia kategorilerine yapılan başvurular şu şekildedir: http://dbpedia.org/page/Category:Educational_psychology , http://dbpedia.org/ Sayfa/ Kategori : Eğitim teknolojisi ve benzeri.

34 http://www.w3.org/TR/2008/WD–skos-reference–20080829/skos.html

License

Share This Book