VL 17800

Einführung

in das geisteswissenschaftliche

Arbeiten und Schreiben

#11 Recherche · 5.1.2026
FU Logo

Lisa Poggel Professur für Digital Humanities, FU Berlin

QR Code Presentation

Was ist Recherche?

Begriff "Recherche" im DWDS

Bedeutung: Nachforschung, Ermittlung, Untersuchung

Bedeutungsverwandt: Abfrage, Überprüfung, Retrieval, Nachschau

Herkunft: recherchieren [...], entlehnt (vereinzelt 2. Hälfte 17. Jh., häufiger im 19. Jh.) aus gleichbed. frz. rechercher. Dies beruht auf afrz. recerchier ‘suchend durchstreifen’, auch (in der Schreibvariante recherger) ‘sorgfältig suchen’ [...]

Typische Adjektivattribute: investigativ, journalistisch, akribisch, gründlich, aufwendig, umfangreich, intensiv, sorgfältig, verdeckt, monatelang, jahrelang

Digitales Wörterbuch der deutschen Sprache (o.J.), „Recherche“, abgerufen 18.12.2025; Digitales Wörterbuch der deutschen Sprache (o.J.), Wortprofil „Recherche“, abgerufen 18.12.2025.

Zusätzliche Möglichkeit der stabilen Referenzierung über einen Archivlink: z. B. Wayback Machine: https://web.archive.org/web/20250115012044/https://www.dwds.de/wb/Recherche

Begriff "Recherche" in der deutschsprachigen Wikipedia

Der Begriff Recherche […], auch Investigation […] oder Research […], bezeichnet die gezielte, nicht beiläufige Suche nach Informationen.

Seite „Recherche“. In: Wikipedia – Die freie Enzyklopädie. Bearbeitungsstand: 7. Januar 2024, 13:17. URL: https://de.wikipedia.org/w/index.php?title=Recherche&oldid=240935311 (Abgerufen: 29.12.2024, 13:43)

Wissensorganisation und Recherche

Leishu (Reference book, "Enzyklopädie"), 15. Jh

Foto der Yongle Enzyklopädie

Yongle Encyclopedia on display at the National Library of China, LW Yang - National Library of China; siehe auch Elman, Collecting and Classifying. Ming Dynasty Compendia and Encyclopedias (Leishu) (2007)

Arca Studiorum (Zettelkasten, "Ark of Studies"), 17. Jh

Zeichung des Zettelkastens ('Ark of Studies') von Thomas Harrison

Placcius, De arte excerpendi (1689: p. 155/152); siehe auch Blair, Too Much To Know. Managing Scholarly Information before the Modern Age (2010: pp. 62-116); Yeo, Thomas Harrison's Arca studiorum: A Search Engine in an Age of Notebooks (2020)

Korrespondenznetzwerke als europäische Informationsinfrastruktur, bis 19. Jh

Brief aus der Korrspondenz von Karl Marx Visualisierung von Voltaire's Korrespondenznetzwerk

Brief von Karl Marx an Wilhelm Liebknecht in Leipzig. London, Freitag, 4. Mai 1866; Edelstein, Interactive Visualization for Voltaire’s Correspondence Network (o.J.)

Hollerith-Maschine (elektromechan. Tabelliermaschine zur Auswertung von Zensusdaten), 1890 und Hollerith-Lochkarte, 1895

Foto eines Replicas einer Hollerith-Maschine Foto einer Hollerith-Lochkarte

Adam Schuster, Replica of early Hollerith punched card tabulator and sorting box (right) at Computer History Museum (2007); Library of Congress, Image of punched card of Herman Hollerith (1895). Siehe auch Haas et al., Die Zählung der Welt. Kulturgeschichte der Statistik vom 18. bis 20. Jahrhundert (2019)

Bibliothekskataloge und Findbücher

Titelblatt des Dewey Decimal Classification System 1885 Regal in einer Bibliothek in Hong Kong

Dewey, Decimal Classification and Relativ Index (1885); A library bookshelf in Hong Kong classified using the New Classification Scheme for Chinese Libraries, an adaptation of the Dewey Classification scheme (2018). Siehe auch Sullivan, A Brief History of Homophobia in Dewey Decimal Classification (2015)

Suchmaschinen und das World Wide Web

Google homepage in 1998 Abstract of the 1998 publication introducing the PageRank algorithm

Google homepage (1998), via WaybackMachine; Page et al., The PageRank Citation Ranking (1998). Siehe auch Roberts, The Google Page Rank Algorithm (2016)

Digitale Bibliotheken, Objektdatenbanken und Volltextsuche

Knowledge Graphs, Graphdatenbanken und Linked Data

Generative KI, Vektordatenbanken und Retrieval Augmented Generation

Leishu, Enzyklopädie, Bibliografie: Wie wird ein Begriff in einem bestimmten Kontext definiert? Welche Werke wurden zu einem bestimmten Thema geschrieben und erfasst?

Zettelkasten, Knowledge Graph: Wie ordnen andere ein Werk ein? Welche thematischen, interpretativen, konzeptuellen Verbindungen gibt es zwischen Werken, Personen, Begriffen...?

Korrespondenznetzwerk, Zeitschrift, akad. Blog, soziale Medien: Was sind aktuelle Diskurse unter Expert:innen? Was ist gerade wichtig, neu, kontrovers? Welche Ressourcen werden von Fachkolleg:innen zu einem bestimmten Thema empfohlen?

Volltextdatenbank, Volltextsuche: In welchen digitalisierten Quellen und wo im Text wir ein/e bestimmte/r Person, Ort, Begriff erwähnt?

Bibliothekskatalog, Findbuch: Wo finde ich Ressourcen zu einem bestimmten Thema, Ort, Person, Fachgebiet? Welche Ressourcen sind zu einem Thema, Autor:in, Jahr verfügbar?

Suchmaschine: Welche Artikel, Beiträge, Webseiten haben nach einem Ranking-Algorithmus, also z.B. aufgrund von Verlinkungsstruktur und Textmerkmalen, die am höchsten bewertete Relevanz für meine Suchbegriffe?

Generatives Sprachmodell: Welche Antwort ist basierend auf statistisch gelernten Mustern aus großen Korpora digital verfügbarer Texte die wahrscheinlichste Fortsetzung meiner Eingabe ("Prompt")?

Generatives Sprachmodell: Welche Antwort ist basierend auf statistisch gelernten Mustern aus großen Korpora digital verfügbarer Texte und dem durch Embedding-Vektoren repräsentierten Kontext der Eingabe die wahrscheinlichste Fortsetzung meiner Eingabe ("Prompt")?

Recherche in der Praxis

Law of the instrument

[...] it is tempting, if the only tool you have is a hammer, to treat everything as if it were a nail.

Maslow, Psychology of Science (1966: pp. 15-16)

"Standard"-Rechercheinstrumente

  • Suchmaschinen (Google, Bing, Ecosia, ...)
  • Volltextdatenbanken (GoogleBooks, Digitale Sammlungen von Bibliotheken, Archiven, Museen; z.B. der Library of Congress)
  • Bibliothekskataloge (Primo, KVK, KOBV, WorldCat)
  • KI-Tools (ChatGPT, Perplexity, ...)

Für welche Fragestellungen sind diese Instrumente gut geeignet?

Beispiel-Fragestellungen Beantwortbarkeit der Fragestellungen mit den Standardinstrumenten Mögliche Recherchestrategien für die Fragestellungen

Beispiel 1: Volltextsuche - Probleme

  • Fehler bei der automatischen Bilderkennung (OCR)?
  • Alternative Schreibweisen ("Damenclub"), Abkürzungen, "Codewörter"?
  • Stand der Digitalisierung, insbesondere bei Forschung zu historisch marginalisierten Gruppen, wenig beachteten Themen
  • Fehlende Verschlagwortung bei nicht digitalisierten Objekten

Fazit: Analoge Archivsuche und ggf. eigene Digitalisierung immer noch notwendig!

Beispiel 2: Suche mit ChatGPT - Probleme

  • Unklare Definitionen: Was heißt "der Türkei"? Was heißt "bedeutend"? Welcher Bezug zu den 1980ern?
  • Unklare Aussagekraft der Recherche: Statistische Wahrscheinlichkeit und Suchalgorithmus
  • Qualität und Art der Quellen variiert stark
  • Gefahr der Halluzinationen

Fazit: Abgleich mit Sekundärliteratur immer notwendig!

Beispiel 3: Suche nach Entitäten mit gemeinsamen Merkmalen

ChatGPT-Suchergebnis: Liste von Filmregisseur:innen, die Politiker sind mit ca. 20 Suchergebnissen

Unterhaltung mit ChatGPT, abgerufen 22.12.2025

Beispiel 3: Suche nach Entitäten mit gemeinsamen Merkmalen

Ergebnis einer SPARQL-Abfrage nach Filmregisseur:innen, die Politiker sind mit > 500 Suchergebnissen

SPARQL-Abfrage über den Wikidata SPARQL Query Service, abgerufen 22.12.2025

Beispiel 3: Suche nach Entitäten mit gemeinsamen Merkmalen - Probleme

  • KI-Tools ungeeignet für umfangreiche Recherchen
  • Der Knowledge Graph Wikidata bietet eine Abfrageschnittstelle für komplexe Suchen mit mehreren Suchkriterien
  • Bedienung erfordert techn. Kenntnisse (SPARQL)
  • Auch Wikidata enhält Fehler, ist unvollständig und reproduziert strukturelle Verzerrungen (Bias)
Fazit: Um große Datenmengen zu sammeln, reichen die Standard-Rechercheinstrumente nicht aus! Eine Alternative: Wikidata-Abfrage

...aber es gibt noch viele weitere Alternativen, z.B.:

  • DBpedia
  • Normdateien (Virtual Authority Files)

Beispiel 4: Suche nach Metainformationen

Beispiel 4: Suche nach Metainformationen - Probleme

  • Suche nach Metainformationen in Primärquellen mit Standard-Rechercheinstrumenten beschwerlich
  • Manchmal gibt es bereits Sekundärliteratur, welche diese Informationen dokumentiert
  • Digitale Editionen bieten direkten Zugriff auf Metainformationen in Form von XML-TEI Dateien
  • Verarbeitung erfordert aber techn. Kenntnisse (XML-TEI, ggf. R, Python oder XPath)
Fazit: Digitale Editionen und Textsammlungen im XML-TEI-Format sind eine nützliche Ergänzung zu den Standard-Rechercheinstrumenten

Es gibt viele digitale Editionen, z.B.:

Beispiel 5: Suche nach Normdaten

Beispiel 5: Suche nach Normdaten - Probleme

  • Normdatensätze beschreiben Entitäten (Personen, Orte, Werke,..) "eindeutig und regelbasiert"
  • Erfassungsregeln sind oft historisch gewachsen, bilden eine bestimmte Perspektive auf die Daten ab und werden i.d.R. nur sehr langsam überarbeitet
  • Auch Normdateien enhalten Fehler, sind unvollständig und reproduzieren strukturelle Verzerrungen (Bias)
Fazit: Normdaten können in strukturierter Form in großen Mengen abgefragt werden, aber wie bei Daten von Wikidata mit schwankender Qualität. Provenienz (Herkunft) der Daten ist für die Interpretation entscheidend!

...aber vielleicht ändert sich bald was?

Überblick: Recherche jenseits der Standard-Rechercheinstrumente

Programmieren als Recherche- und Analysewerkzeug

  • 16199: Textanalyse mit R für die Geisteswissenschaften (VV; Seminarwebsite)
  • 17560: Webscraping mit Python für die Geisteswissenschaften (VV; Seminarwebsite)

“Should humanists learn to code?” Less than a decade ago this question would have ignited quite a controversy in the field of digital humanities (DH). Today, the consensus is that a certain level of code literacy is preferred. Instead of arguing whether code literacy deserves to be part of DH’s skill set, the debate has moved on to discussing what it means, exactly, to be code literate.

Bleeker et al., A Game of Persistence, Self-doubt, and Curiosity (2022: pp. 1-2)

Recherche dokumentieren und verwalten

Zotero Literaturverwaltung

Screenshot des Desktop-Userinterfaces von Zotero mit einem roten Kasten um einen Eintrag, zu dem in der rechten Spalte die Metadaten angezeigt werden

Screenshot der Zotero-Nutzeroberfläche; neben der Desktop- und Webanwendung gibt es außerdem zahlreiche Browser-Plugins; Plugins für Microsoft Word, LibreOffice, Google Docs

Obsidian Notiz- und Projektorganisation

Screenshot der Obsidian-Nutzeroberfläche; es gibt zahlreiche Obsidian-Plugins, z.B. für Kalender, Kanban-Boards für ToDo-Listen; Visualisierungen der Verweise in Notizen, uvm.

Vielen Dank! Gibt es Fragen?