Information Retrieval
Information Retrieval (aus dem Englischen für: "Informationsrückgewinnung" bzw. "Informationsbeschaffung") bezeichnet das gezielte Auffinden und Wiederauffinden von Dokumenten, die für eine bestimmte Fragestellung relevant sind.
Ein erfolgreiches Information Retrieval ist eines der Ziele der inhaltliche Erschließung von Dokumenten. Es sollen alle eingschlägigen Dokumente zu einem bestimmten Thema verlässlich gefunden werden.
Recall and Precision
Wichtig für die Bewertung eines erfolgreichen Information Retrievals ist ein ausgewogenes Verhältniss zwischen Recall und Precision. Diese beiden Meßgrößen werden i.d.R. im Zusammenspiel betrachtet.
Recall
Mit Recall (Vollständigkeitsquote) bezeichnet man die Trefferquote. Sie gibt an, wieviel relevante Titel eine Suchanfrage ergibt.
Der Wert des Recall ergibt sich als Quotient aus der Anzahl der gefundenen relevanten Dokumente durch die Anzahl aller relevanten Dokumente in einem Bestand. Dabei kann sich ein Wert zwischen 0 und 1 ergeben, wobei 0 der schlechteste und 1 der beste Wert ist: 1 bedeutet, dass bei der Suche alle relevanten Dokumente gefunden wurden.
Precision
Precision (Genauigkeitsquote) bezeichnet die Qualiät der gefundenen Treffer. Je mehr relevante Titel in einer Treffermenge sind, desto höher ist ihre Precision.
Der Wert der Precision ergibt sich als Quotient aus der Anzahl der relevanten gefundenen Dokumente durch die Anzahl aller gefundenen Dokumente während einer Recherche. Dabei kann sich ein Wert zwischen 0 und 1 ergeben, wobei 0 der schlechteste und 1 der beste Wert ist: 1 bedeutet, dass alle Dokumente, die bei einer Recherche gefunden wurden, auch relevant sind.
Verhältnis von Recall und Precision
Zwischen den beiden Meßgrößen besteht ein Zielkonflikt. Durch die Wahl eines sehr allgemeinen Suchbegriffes kann ein Nutzer bei der Recherche seine Treffermenge und damit den Recall erhöhen. Dabei wird sich dann allerdings eine größere Anzahl nicht relevanter Treffer befinden, so dass die Precision gering ist. Durch die Einengung des Suchbegriffes kann der Nutzer zwar die Treffermenge und damit den Recall einschränken, dafür liefert ihm die Suche mehr relevante Treffer: die Precision ist höher. Dies bedeutet, dass mit steigendender Precision der Recall sinkt und umgekehrt.
Pertinenz und Relevanz
Pertinenz
Mit Pertinenz wird die Treffermenge bezeichnet, die für den Nutzer auch wirklich interessant ist, da sich die Treffer mit seinem Thema beschäftigen oder für ihn lesbar (in seiner Sprache) sind. Im Gegensatz zur Relevanz bezieht sich die Pertinenz auf das subjektive Informationsbedürfnis und wird daher auch als subjektive Relevanz bezeichnet
Ein Beispiel:
Bei der Suche nach Bibliothekar Ausbildung sind die Treffer „World trends in library education“ oder „Guidelines for the education and training of school librarians“ pertinent
Relevanz
Mit Relevanz wird die Treffermenge bezeichnet, die mit der Suchanfrage übereinstimmt. Hier geht es um die objektive Befriedigung eines Informationsbedarfs. Das bedeutet, dass ein gefundenes Dokument zwar relevant (passt zum Thema), für den Nutzer jedoch nicht pertinent sein muss.
Man unterscheidet unterschiedliche Arten von Relevanz:
- Subjektive Relevanz = Beziehung zwischen einem Dokument und einem Informationsbedürfnis. Wird vom Benutzer beurteilt.
- Objektive Relevanz = Beziehung zwischen einer Anfrage und dem Dokument an sich. Wird von einer Gruppe unabhängiger Experten beurteilt.
- Geschätzte Relevanz = Beziehung zwischen einer Anfrage und einem Dokument vom Suchsystem aus betrachtet.
Ein Beispiel: Wenn man nach Bibliothekar Ausbildung sucht, sind die Treffer "Bibliotečnyj specialist: osobennosti truda i professionalizacii" oder "La evaluación de la educación bibliotecológica en América Latina" relevant.
Literatur
- Gantert, Klaus: Bibliothekarisches Grundwissen. 9. vollständig neu bearbeitete und erweiterte Auflage, Berlin: De Gruyter Saur, 2016. S. 197 f.
- Werr, Naoka: Skript Sacherschließung. (FHVR, Fachbereich Archiv- und Bibliothekswesen, 2. Fachstudienabschnitt, Stand: Sommersemester 2016). S. 5 f.