GML² im Nachgang: Datenschutz und Learning Analytics

Vor gut einer Woche besuchte ich die GML² an der Freien Universität Berlin. Im AV-Workshop vor der Tagung sprach ich über die Entwicklung und Nutzerverhaltensanalyse von IWRM education. Jenseits der vielen gedanklichen Mitbringsel möchte auf das Spannungsfeld von Datenschutz und Learning Analytics (LA) eingehen. Mein Eindruck ist, dass LA überall gehypet wird, aber eigentlich nur wenige schon einmal damit in Berührung gekommen sind. Die ethischen Probleme eines gläsernen Studierenden ahnen jedoch viele (NSA sei Dank). Exemplarische Bedenken habe ich in drei Thesen gebündelt, für die ich nach weitere belege suche:

These 1: Studierende und Lehrende beharren bei elektronischen Lernangeboten von Hochschulen auf strenge Datenschutzrichtlinien, während sie diese bei externen Anbietern ignorieren. Beispielsweise dürften Lehrende beim Angebot von Vorlesungsaufzeichnungen nicht protokollieren welche Videos und Videoszenen von wem und wann betrachtet werden. Bei YouTube veröffentlichte Videos würden jedoch ganz natürlich durch die Google Analytics Instrumente ausgewertet. In letzteren Fall ist nicht einmal sicher, welche Daten zusätzlich erhoben werden (z.B. Google-Benutzername). Mit der Preisgabe persönlichen Daten bezahlen Lehrende dafür, die Infrastruktur von YouTube nutzen können.

These 2: Unter welchen Bedingungen ist es gerechtfertigt die Nutzung von Open Educational Resources (OER) zu tracen? Bezahlen Lernenden durch die Protokollierung ihres Lernverhaltens die kostenfrei zur Verfügung gestellten Lernangebote? Macht es einen Unterschied, ob die Daten zur Forschungszwecken oder zur Ökonomisierung erhoben werden? Beleg dafür sind die Analytics-Instrumente bei Khan Academy oder die umfangreichen Auswertungen der MOOC-Anbieter, die nicht nur die Gründe für Kursabbrüche zu ergründen versuchen, sondern die Lernergebnisse und Nutzerprofile an Head Huntern verkaufen. Freilich, das machen nicht alle.

These 3: Eingebaute Tracingfunktionen in Lernumgebungen nutzen Lehrende, oft jedoch ohne die Lernenden darüber in Kenntnis zu setzen. Beispielsweise erlaubt die Videoplattform MediaSite die Beobachtung einzelner Studierender! Für eine  Hamburger Hochschule thematisierte ein Referent bei der GML² keine ethischen Gewissensbisse. Ich sehe das anders. Den Empfehlungen von der APA folgend, so meine These, müssten Studierende jeder Zeit einem Tracing ihres Benutzerverhalten zustimmen oder sich verweigern können. Betrachtet werden könnten dann nur jene Studierende, die zuvor einwilligten. Falls Sie sich das jedoch bis zum nächsten Veranstaltungstermin anderes überlegen, so darf der Lehrende keinen Zugriff auf die früher erhobenen Daten mehr bekommen. Die Crux ist dabei die Ablage der Daten, die erst mit vorhandener Zustimmung zur Auswertung herangezogen werden darf. Um hier Missbrauch zu verhindern, müssten die Datensätze verschlüsselt sein, und zwar mit einem Schlüssel, der weder im System, noch bei dem Lehrenden, sondern einzig beim Studierenden gespeichert/memoriert ist.

 

An der eigenen Nase gefasst, habe ich mir hier einige Hausaufgaben definiert. In IWRM education erhebe ich Daten zur Verbesserung des Lernangebots. In meinen Studien zu CSCL-Scripts protokollierte ich ebenso Nutzerinteraktionen, zuletzt jedoch im Opt-Out Modus für Studierende.

 

VVO Fahrplan abgreifen

Der Verkehrsverbund Oberelbe nutzt zur Fahrplanabfrage eine System namens EFA der Firma mentzDV. Um Fahrplandaten in maschinenlesbarer Form nutzen zu können, gibt es eine XML-Schnittstelle. Im Datenportal der Stadt Linz findet sich ein Dokument, in dem die Schnittstelle dokumentiert ist. Ein passendes, jedoch unkommentiertes Servlet plus Beispielanwendungen gibt es anderenorts.

Für den VVO sieht das dann z.B. so aus. Die Parameter für die URL http://efa.vvo-online.de:8080/dvb/static/XML_TRIP_REQUEST2 sind gar nicht schwer verstehen:

sessionID=0
requestID=0
language=de // Sprache, auch "en" möglich
itdDateDay=11 // Tag
itdDateMonth=03 // Monat
itdDateYear=14 // Jahr
itdTripDateTimeDepArr=dep // Ankunftszeit oder Abfahrtszeit
itdTimeHour=23 // Stunden
itdTimeMinute=51 // Minuten
place_origin=dresden // Ausgangsort
type_origin=stop // Art des Ausgangspunkts, hier eine Haltestelle
name_origin=tannenstr // Ausgangshaltestelle
place_destination=dresden // Zielort
type_destination=address // Art des Ziels, hier eine Adresse
name_destination=bautznerstr+33 // Zieladresse
limit=1 // Anzahl der Ergebnisse

Auch wenn die Daten nicht frei verwendet werden können, hilft es zumindest den Zugang zu haben. Weitere Tests stehen natürlich noch aus. Interessant wären Angaben zu Geo- und Echtzeitdaten. Vielleicht finden wir zum hands on session von OpenDataDresden am 14. März 2014 etwas Zeit zur genaueren Lektüre.

Nachtrag 1:
Die Dokumentation aus Linz ist leider nicht ganz vollständig. Beim Versuch die Geo-Koordinaten zu entschlüsseln bin ich auf ebensolche Dokumente der Städte Wien und Dublin gestoßen. Möchte man beispielsweise die nächstgelegenen Haltestelle von seinem aktuellen Standpunkt aus ermitteln, dann hilft folgende Anfrage:
http://efa.vvo-online.de:8080/dvb/static/XML_TRIP_REQUEST2?type_origin=coord&name_origin=13.751929:51.074259:WGS84
Entscheidend ist dabei nicht nur die Longitude und Latitude, sondern die Projektion (hier die von OSM und Google Maps präferierte: WGS84). Per default scheint die Dresdner EFA-Variante mit der Projektion NAV4 bzw. EPSG 32632 zu arbeiten. Die entsprechenden Koordinaten gibt auch die obige Fahrplanabfrage (TRIP_REQUEST) aus. Jetzt muss man nur noch herausfinden, wie man die Projektionen geschmeidig konvertiert.