Ressourcen

Allgemein:

Lehrbuch-Klassiker (für Grundlagen, bei speziellen Anwendungen zum Teil nicht mehr aktuell):

Textanalyse mit Quanteda:

Datenvisualisierung mit ggplot2:

Statistik:

Hintergrund Preprocessing und Natural Language Processing (POS Tagging, Dependency Parsing, NER,…):

Theorie (wird fortlaufend ergänzt):

Glossar der Zeitschrift für digitale Geisteswissenschaften (mit Beiträgen zu Theorie, Operationalisierung, Daten, …): https://zfdg.de/wp_2023_001.

Literaturhinweise zu den verschiedenen Analysemethoden findet ihr in den optionalen ausklappbaren Abschnitten im jeweiligen Kapitel.

Einige Digital Humanities Zeitschriften (für die eigene Recherche):

Volltextrepositorien mit Texten im Plaintext- oder XML-TEI-Format:

Datensätze und Korpora für die Textanalyse (wird fortlaufend ergänzt):

Sammlung tabellarischer Datensätze mit ausführlichen Erläuterungen zum Kontext der Daten und R-Programmierübungen: https://www.responsible-datasets-in-context.com/datasets.html

Verschiedene Universitäten weltweit sammeln außerdem Datensätze und Forschungsdaten in eigenen Forschungsdatenrepositorien, zum Beispiel:

  • Harvard Dataverse (aktuell mit Stand Feb. 2025 37.000 Datensätze für das Thema “Arts and Humanities”), https://dataverse.harvard.edu/
  • Heidelberg Open Research Data (heiDATA; kleine Sammlung von Volltexten und XML-TEI-Editionen von Forschungsprojekten an der Uni Heidelberg, z.B. digitale Editionen der Kaiserchronik, des Maltechnik-Notizbuchs von Hans Emmenegger, der Korrespondenz von Nicodemus Frischlin, Index zu Artikeln der chinesischen Zeitschrift Shenbao, Metadaten zu allen Werken von Abou Naddara, uvm.), https://heidata.uni-heidelberg.de/dataverse/root
  • Einen Überblick über weitere solche “Dataverses” findet ihr unter https://dataverse.org/

Zuletzt arbeiten auch außeruniversitäre Forschungsinstitute und die Akademien der Wissenschaften in den verschiedenen Bundesländern an digitalen Editionen und anderen Forschungsprojekten: