8 Tipps um ein Paper zu schreiben, was Leser via Google Scholar & Co finden können

Elektronische Publikationen gelangen zumeist durch Suchanfragen an ihre Leser. Die Suchmaschinen von Literaturdatenbanken wie auch Google Scholar folgen bestimmten Algorithmen, die anhand Parametern und Metriken die Suchtreffer in eine Rangfolge bringen. Diese Mechanismen als Autor zu ignorieren hieße, anderen den Zugang zu seinen Forschungsergebnissen zu erschweren und sich von der Community zu distanzieren. Andererseits sollte man sich in Bezug auf den Inhalt einer Forschungsarbeit nicht dem Diktat der Suchalgorithmen unterwerfen oder versuchen illegitimen Nutzen daraus zu ziehen. Academic search engine optimization (ASEO) zielt daher auf die Beachtung technischer Rahmenbedingung und die Entscheidungsfindung bei der Publikation elektronischen Forschungsarbeiten. In diesem Beitrag habe ich drei wissenschaftliche Artikel zum Thema ASEO  in acht Handlungsempfehlungen zusammengefasst:

#1: Kurzer Titel
Google Scholar bevorzugt kurze Titel, wobei diese auch Keywords enthalten sollte.

#2: Keywords
Wähle die richtigen Keywords durch Suchanfragen in Literaturdatenbanken oder unter Zuhilfenahme folgender Werkzeuge:

Die verwendeten Schlüsselworte sollten zwar gebräuchlich und verbreitet sein, nicht jedoch zu übermäßig vielen konkurrierenden Treffern führen. Neben dem Titel integriert man die Schlüsselworte insbesondere in den Abstract und fernen in den Text.

#3: Text
Alle Schlüsselworte solltest du einschließlich der relevanten Synonyme in den Textkorpus integrieren. Die Struktur des Textes sollte sich am bekannten Muster introduction, related work, method, result, discussion anlehnen, damit die Artikel auch als wissenschaftliche Papiere erkannt werden können.

#4: Zitationen
Datenbanken wie Scopus oder Web of Science ordnen Treffer einer Suchanfrage allein anhand der eingehenden Referenzen. Je öfter ein Artikel in anderen Papieren zitiert wurde, desto höher rangiert er im Suchergebnis. Google Scholar scheint dabei nicht zwischen Fremd- und Eigenzitaten zu unterscheiden. Der Pange Rank Algorithmus von Google berücksichtigt jedoch auch andere Quellen im WWW, die auf ein Papier verweisen. Insbesondere die Reputation von Autoren und Verlagen / Journals wird miteinbezogen (siehe #6).

In Bezug auf Literaturangaben ist Sorgfalt bei der Schreibweise von Namen, insbesondere unter Berücksichtigung anderer Alphabete, angebracht. Es ist zudem wichtig Verweise auf die Bezugsquellen der referenzierten Quellen anzugeben. Eine URL, ISSN, ISBN oder DOI erfüllt diesen Zweck.

#5: Grafiken und Tabellen
Im Gegensatz zu Text in Tabellen und Bitmap-Grafiken (BMP, JPEG, PNG, GIF, TIFF, etc.), werden lediglich Texte in vektorbasierte Grafiken (z.B. SVG nach PDF exportiert) durch Google Scholar indiziert.

#6: Wahl des Journals bzw. Publikationskanals
Artikel rangieren auch dann weit oben in der Trefferliste, wenn lediglich nach einem Namen oder einem Publikationsnamen (z.B. Titel des Journals oder der Buchreihe) gesucht wird. Dabei spielt es keine Rolle, ob der Suchbegriff im Titel oder Text des Papiers vorkommt. Die Wahl der Zeitschrift hat also einen Einfluss auf das Ranking. Insbesondere Beiträge in Open Access Journals lassen sich im Gegensatz zu kostenpflichtigen Angeboten leichter zitieren und abrufen. Alternativ kann man einen pre-print (Green Open Access) ins Netz stellen oder im dem Verlag eine Recht auf eine spätere Veröffentlichung auf einem eigenen Server vereinbaren. ISI-Journals genießen auch bei Google Scholar einen besseren Ruf und werden höher eingeordnet.

#7: Metadaten
Neben den Schlüsselwort, die sich auf den Inhalt einer Arbeit beziehen, sind auch die mit dem Dokument also solches verbundenen Metadaten von Relevanz. Wenngleich Verlage diese Metadaten vor der Veröffentlichung im Netz vereinheitlichen, muss man als Autor bei der Veröffentlichung auf einer eigenen Webpräsenz allein dafür Sorge tragen. Ob PDF oder Textdokument, ein nachvollziehbarer Dateinamen sowie die korrekte und vollständige Angabe der Metadaten (Titel, Autor, Subjekt) machen das Dokument maschinenlesbar und somit für Suchmaschinen besser indizierbar. (In Tex leistet das Paket hyperref mit dem Kommando hypersetup gute Dienste.)

Will man ein Papier auf einer Webseite präsentieren ist die Angabe von HTML-Metatags notwendig. Bei Arlitsch et al. (2012) findet man genaue Angaben, wie sich Bepress Metadaten auf Dublin Core Sets abbilden lassen, um bei Google Scholar überhaupt erst einmal gelistet zu werden. Hier nur ein HTML-Code-Schnipsel als Beispiel:

<meta name=“bepress_citation_author“ content=“Max Müller“ />
<meta name=“bepress_citation_author“ content=“Maxi Müllerin“ />
<meta name=“bepress_citation_title“ content=“ASEO at its best“ />
<meta name=“bepress_citation_pdf_url“ content=“http://www.nise81.com/archives/1046″ />

#8: Dateiquellen
Wenn ein Artikel nicht nur in einer Zeitschriftendatenbank, sondern auch auf einer privaten oder institutionellen Webseite abrufbar ist, gruppiert Google Scholar die Quellen in der Rangliste. Alternativ können Artikel auch bei Web-Diensten wie Mendeley oder ResearchGate eingestellt werden. Oder, in einem Satz gesagt: Je mehr (vertrauenswürdige) Quellen es für eine Dokument gibt, desto größer ist die Wahrscheinlichkeit, dass eine Suchmaschine darauf stößt.

 

Literatur:

#SOOC13 Hilfe, mein Prof blogt! Texten ist Neunziger.

Im SOOC13 läuft gerade eine Blogparade bei der Professoren und Wissenschaftlichen Mitarbeiter gefragt werden, warum sie bloggen.

Aber warum? Blogposts werden auf keiner Publikationsliste erwähnt. Blogposts werden bei Anträgen um Drittmittel nicht berücksichtigt. Blogposts werden vielleicht noch nicht einmal von den eigenen Mitarbeitern oder Studenten gelesen. Oder doch?

Für mich hat das Bloggen nur teilweise mit dem Job an der Uni zu tun. Zum einen habe ich bereits während meines Studiums (2007) bzw. während der Schulzeit (1999) mit dem Bloggen bzw. „Homepage füllen“ begonnen und zum anderen gehen die in meinem Blog dargestellten Themen weit über die Spezialisierung meiner Forschung und Lehre hinaus. Ein Blog ist für mich zunächst nur ein Weg, Inhalte ins WWW zu stellen und dabei die Kontrolle über die Daten zu behalten. Hier eine Reihe von Gründen, die mich bislang trotz oder aufgrund von 33 Feed-Abonnenten und täglich >100 Besuchern (~600 page views) dazu bewogen haben 262 Beiträge schreiben:

  • Media Richness: Auf einer Webseite lassen sich Dinge darstellen, die eine Paper/Konferenzbeitrag (noch?) nicht vermitteln kann (z.B. interaktive Software). Aber auch beim bloggen gerate ich zunehmend an die Grenzen des darstellbaren. Die Ausdruckskraft der gegenwärtigen Systeme hält mit den gestalterischen Asudrucksformen (DataViz/D3, Layered Video, Infografiken, Motion Graphics, SVG, …) nicht mehr mit. Wer „heute digitale Avantgarde sein will“, so sagte Markus Hündgen auf der re:publica, „braucht einen Kanal bei YouTube“ und einiges mehr, so meine ich. Texten ist Neunziger.
  • Flüchtigkeit vs. Transparenz: Im Vergleich zu Vorträgen, Demos usw. manifestieren sich Inhalte in Blogposts viel besser über längere Zeit hinweg. Die Manifestation schafft eine Transparenz der eigenen Aktivität.
  • Denken durch Schreiben: Einen Beitrag für eine  Zielgruppe zu schreiben und dabei eine bestimmte Absichten zu verfolgen kann man als komplexes Problemlösen oder gar problemlösendes Lernen bezeichnen. Wenn ich einen kurzen Blogpost schreibe, ordne ich meine Gedanken zu einem Thema. Das hilft mir, falls ich später einen umfassenderen Text verfassen möchte. Es hilft auch, um Fragestellungen und Argumentationslinien während des Schreibens zu finden.
  • Speicher voll Wissen: Die Funktionen von Social Bookmarking Diensten hat mir noch nie ausgereicht, um Zusammenhänge und Einordnungen von Ressourcen festzuhalten. Ich nutze die Kombination aus Kategorien, Tags, Blogpost und die Verweise auf ähnliche Beiträge als _eine_ Form des persönlichen Wissensmanagement.
  • Medaille²: Neben diesem öffentlichen Teil meines Logbuchs gibt es seit nunmehr drei Jahren einen privaten Teil, der als lokales, persönliches Forschungstagebuch ([1]) fungiert. Zusammen bilden die Blogs zwei Seiten einer Medaille. Inhalte wechseln dabei des öfteren die Seiten und sind gegenseitig inspiriert.
  • Wirkung: In bestimmten Themenbereichen kann ich mit einem Blogpost Vertreter von Verwaltung und Presse erreichen und mit ihnen in Dialog treten. Das kann soweit führen, dass ein Blogpost öffentliche Debatten im Reallife auslöst und dadurch Handlungsdruck erzeugt (z.B. [1], [2], [3]). Mit wissenschaftlichen Beiträgen auf Tagungen und in Journalen wäre (mir) dies nicht möglich, weil sich ja kaum ein Journalist oder Kommunalpolitiker die Zeit oder das Geld nimmt, um an der Wissenschaft teilzuhaben.
  • Tiefe in der Breite: Wie bereits oben erwähnt, gönne ich mir die Freiheit über Dinge zu schreiben, die mich als Privatmensch bewegen, ohne auf Gutachten, Deadlines oder Autorenrichtlinien angewiesen zu sein. Über die Jahre haben sich dabei Themenstränge entwickelt, deren Inhalte ich wie ein Kurator zusammenstelle und kommentiere, oder die ich neu beitrage. Über die Zeit entsteht eine thematische Tiefe aus der ich und andere schöpfen können.
  • Prokrastination: Es kommt gelegentlich vor, dass ich hier und da [1, 2] Beiträge schreibe und dadurch die wirklich wichtigen Arbeiten aufschiebe. Bloggen ist wie Bleistiftspitzen oder Teekochen.

[diy] Blog als Personal Learning Environment

Seit fünf Monaten experimentiere ich mit einem Tagebuch-Blog als Bestandteil meiner persönlichen Lernumgebung. Im Gegensatz zu öffentlichen Blogs wie diesem hier, ist ein persönliches Blog weder online, noch für eine Zielgruppe bestimmt. Doch welche Vorzüge hat ein digitales Tagebuch? Wie profitiere ich als Lernender davon? Und wie kann ich ein Blog-System als effektives Werkzeug zum Schreiben einsetzen?

(mehr …)