4.lv edit
From DHVLab
Contents
Editionstool "Squirrel"
Zum Einsatz kommt im Kurs das an der LMU München durch Prof. Dr. Mark Sven Hengerer und Dr. Gerhard Schön entwickelte und durch eine Projektgruppe stetig weiter verbesserte Editionstool "Squirrel". Squirrel entstand vor dem Hintergrund, Studierenden, Doktoranden und Wissenschaftler/-innen verschiedener Disziplinen (u.a. Geschichtswissenschaften, Germanistik, Linguistik) ein Hilfsmittel an die Hand zu geben, um Editionen zu erarbeiten, die sich durch hohe Qualitätsstandards auszeichnen.
Vorteil: Durch die Anbindung des Editionstools an die Infrastruktur des DHVLab können Studierende wie wissenschaftlich interessierte Nutzer gleichermaßen durch einmalige Registrierung im DHVLab das Tool nutzen. Die Daten, die im Editionsprozess entstehen, werden dauerhaft und sicher auf den Servern der IT-Gruppe abgelegt. Damit bietet sich gerade auch für kleinere Projekte die Gelegenheit, ihre Daten an einem sicheren Ort und institutionell angebunden abzulegen.
Durch Kooperationen des Entwicklerteams u.a. mit dem Centrum für Informations- und Sprachverarbeitung (Dr. Maximilian Hadersbeck) - kurz CIS - wird das Editionstool um Funktionalitäten erweitert und in seiner Einsatzvielfältigkeit noch verstärkt.
Projektwebseite des Editionstools "Squirrel"
Benutzung des Editionstools:
! Wichtiger Hinweis: Durch die sukzessiven Verbesserungen und Erweiterungen am Editionstool können die im folgenden genannten Hinweise zur Benutzung Veränderungen unterliegen !
Aufbau und Benutzung des Editors
Startmenü
- Anmeldung: Melden Sie sich mit den Benutzerdaten an, die Sie bei Ihrer Registrierung im DHVLab erhalten haben
- Anschließend werden Sie auf die Übersichtsseite weitergeleitet (siehe Abb. 1).
- Dort befindet sich auf der rechten Seite eine Liste aller bereits hochgeladenen Schriftstücke.
- Auf der linken Seite befindet sich eine Suchmaske, die eine detaillierte Suche nach einem bestimmten Schriftstück (z.B. über zugehörige Metadaten) ermöglicht.
- Sobald Sie ein Schriftstück anklicken, öffnet sich im unteren Bereich eine Detailseite, die Ihnen alle zugehörigen Informationen sowie Abbildungen des ausgewählten Stückes ausgibt.
Startmenü: Hinzufügen eines Datensatzes
- Drücken Sie die Taste "F9".
- Es öffnet sich das Kontextmenü (vgl. Abb. 2). Durch Klick auf das graue Dreieck öffnet sich ein Eingabedialog für den Import der Bilddatei Ihres Schriftstückes. Sie können auch mehrere Bilddateien hochladen (z.B. bei einem mehrseitigen Brief), indem Sie wiederum auf das graue Dreieck klicken.
- Anschließend können Sie die zugehörigen Metadaten eingeben, wie z.B. Archivsignatur, Ausstellungsort und -datum.
- Tipp (um fehlerhaften Upload zu vermeiden): Speichern Sie den Datensatz zunächst nur mit den zugehörigen Bildern mit Klick auf den zugehörigen Button (grünes Pluszeichen). Doppelklicken Sie anschließend auf den soeben angelegten Eintrag in der Liste der vorhandenen Schriftstücke. Fügen Sie anschließend die gewünschten Metadaten hinzu.
- Sollte der neu hochgeladene Eintrag nicht sofort angezeigt werden, loggen Sie sich erneut bei Squirrel ein.
Transkriptionsumgebung
- Um mit der Transkription Ihres Schriftstückes zu beginnen, klicken Sie auf den entsprechenden Eintrag in der Liste der Schriftstücke. Es öffnet sich im unteren Bildschirmbereich eine Detailseite inklusive einer verkleinerten Abbildung Ihres Schriftstückes. Klicken Sie darauf, um in die Transkriptionsumgebung zu gelangen (vgl. Abb. 3).
- Tipp: Sie können mit dem Mausrad in die Abbildung hineinzoomen.
- Beginnen Sie nun mit der Transkription, in dem Sie den Text in den weißen Bereich auf der rechten Bildschirmseite Wort für Wort, Zeichen für Zeichen eingeben.
- Verknüpfung der Transkription mit der Abbildung:
- Markieren Sie im weißen Bereich auf der rechten Bildschirmseite das erste Wort (z.B. "Heinrich") Ihrer Transkription.
- Suchen Sie im Digitalisat die Stelle, an der sich das Wort "Heinrich" befindet.
- Drücken Sie die Alt-Taste und ziehen Sie mit der Maus ein Fenster auf, welches das komplette Wort (Heinrich) im Digitalisat umfasst.
- Lassen Sie die Maustaste los - ein Kästchen um das transkribierte Wort im Digitalisat signalisiert, dass das Wort aus der Transkription mit dem zugehörigen Bildausschnitt verknüpft wurde.
- Möchten Sie eine fehlerhafte Verknüpfung löschen, klicken Sie entweder auf das entsprechende Kästchen im Digitalisat oder markieren Sie das entsprechende Wort in Ihrer Transkription und drücken Sie "Esc".
- Leerzeichen, Satzzeichen etc. können beliebig zwischen den Kästchen gesetzt werden.
- Zeilenumbrüche signalisieren werden durch das Zeichen | (Alt Gr + |) signalisiert; das System interpretiert dieses Zeichen als Umbruch.
- Vergessen Sie nicht, vor dem Verlassen der Transkriptionsumgebung zu speichern. Möchten Sie eine Änderung nicht speichern, verlassen Sie die Umgebung über den Button "Zurück" (roter Pfeil).
Transkriptionsumgebung: Tagging
- Es gibt drei verschiedene Arten, transkribierte Wörter zu taggen (auszuzeichnen bzw. um Metainformationen anzureichern):
- Parameter-Auszeichnung: Tags (grau markiert), denen Zusatzinformationen beigegeben werden: Personen, Orte (Abschnitt D im Tagset). Beispiel: Markieren Sie zunächst einen vollständigen Personennamen (z.B. "Heinrich von Hakkenberg") und klicken Sie dann auf das Tag "Person". Es erfolgt eine entsprechende Auszeichnung in der Transkription. Doppelklicken Sie nun das so markierte Tag. Es öffnet sich ein Dialogfenster, in das Sie die GND-Nummer (Normdatei) der Person - sofern vorhanden - eingeben können.
- Blockauszeichnung: Tags (gelb markiert), durch die größere Passagen in einer Transkription gekennzeichnet werden (z.B. Formularbestandteile von Urkunden wie Protokoll, Kontext und Eschatokoll (Abschnitt A im Tagset) oder textkritische Anmerkungen/inhaltliche Erläuterungen (Abschnitt C im Tagset)).
- Inline-Auszeichnung: Alle anderen Tags, die keine Parameter besitzen und sich nicht über eine größere Passage erstrecken (z.B. Abschnitt D im Tagset wie 'hochgestellt', 'unterstrichen', 'durchgestrichen').
- Allgemein gilt: Elemente können sich überlagern, d.h. innerhalb einer Blockauszeichnung können Personen, Orte oder andere Auszeichnungen vorgenommen werden (vgl. Abb. 4).
Weitere Tipps für die Arbeit mit dem Editor:
- Achten Sie immer darauf, wo sich der Cursor im Transkriptionsfeld befindet - genau dort wird beim Loslassen der linken Maustaste ein Kästchen angelegt
- Sie können zunächst den Text Ihrer Transkription vollständig eingeben und ihn anschließend mit dem Digitalisat auf oben beschriebene Weise verknüpfen. Dies kann sinnvoll sein, wenn der Transkriptionstext bereits in weiten Teilen vorliegt.
- Achten Sie darauf, dass - wenn Sie mit mehreren Benutzern ein Schriftstück gemeinsam bearbeiten - Sie sich nach Abschluss Ihrer Arbeit die Transkriptionsumgebung verlassen (d.h. Änderungen speichern oder abbrechen). Diese ist während Ihres Bearbeitungszeitraumes für andere Personen gesperrt.
Einschub: Warum wird getaggt?
- ) Stichwort "Extensible Markup Language" (XML): Die Auszeichnung von Transkriptionen in XML ist in den Editionswissenschaften und den Geisteswissenschaften im Allgemeinen heute ein "Quasi-Standard". Es ist daher sinnvoll, auch aus Gründen der Nachnutzbarkeit, durch die Arbeit mit dem Editionstool einen Text vorzulegen, der diesem Standard entspricht. Gleichzeitig wird durch die Ablage der Daten (und der zugehörigen Tags) in einer relationalen Datenbank eine Weiterverarbeitung in verschiedenen technischen Kontexten ermöglicht.
Praktisch gesehen bedeutet dies: Jedes Mal, wenn im Editor ein Kästchen um ein Wort gezogen wird, wird in der Datenbank ein XML-Tag abgelegt und mit dem auszuzeichnenden Wort verknüpft. Durch diese einheitliche Form der Textauszeichnung kann später eine ansprechende und relativ einfach zu verwaltende Wiedergabe im Netz generiert werden: Mit Hilfe von XSLT kann an zentraler Stelle in der entsprechenden Style-Information die Ausgabe einzelner Elemente angepasst werden. Dies gilt ebenso für eine etwaige Druckfassung der Edition. - ) Unterstützung beim Transkriptionsprozess: Durch das Tagging wird das jeweilige transkribierte Wort mit dem zugehörigen Bildausschnitt verknüpft. Die Bildausschnitte werden auf dem Webserver' abgelegt. Klickt man im Transkriptionsmodus ein Wort an, werden Transkriptionsvorschläge am oberen Bildschirmrand angezeigt (vgl. Abb. 5), die in kniffligen Fällen eine wertvolle Unterstützung bei der Lesung darstellen.
Tipp: Mit Doppelklick auf eines der angezeigten Vorschlagbilder gelangt man unmittelbar in die Transkription des zugehörigen Schriftstückes.
Hinweis: Bei den Vorschlägen handelt es sich um menschliche Eingaben und nicht um automatische Texterkennung (Optical Character Recognition). Sie sind daher stets 'mit Vorsicht zu genießen', um Fehlerreproduktion zu vermeiden. (N.B.: Der kritische Blick ist bei automatisierten OCR-Verfahren selbstverständlich in selbiger Weise notwendig!)
Werkzeuge
Unter dem Reiter "Werkzeuge" ist insbesondere die Rubrik "Korrekturstellen" von Bedeutung. Hier können Sie nach einem Wort Ihrer Wahl suchen, um dessen Schreibweise in verschiedenen Schriftstücken zu vergleichen, oder Fehler in der Transkription zu identifizieren. Geben Sie das gewünschte Wort in die Suchleiste ein und klicken Sie zum Abschicken der Suchanfrage erneut auf "Korrekturstellen" im Menü auf der linken Seite. Es werden Ihnen nun alle Bildausschnitte angezeigt, die Ihrer Anfrage entsprechen. Wie in der Transkriptionsumgebung gelangen Sie durch Doppelklick direkt an die entsprechende Stelle im zugehörigen Schriftstück.
Die unscharfe, trunkierte Suche ermöglicht eine entsprechende Ausweitung der Trefferergebnisse ("%der%" gibt beispielsweise auch "oder", "andern" oder "hundert" aus).
Es bietet sich, insbesondere bei der Arbeit im Team an, ein Zeichen für die Kenntlichmachung von Unsicherheiten in der Lesung zu verwenden (z.B. "€", da dieses Zeichen in handschriftlichen Texten vor Einführung des Euros nicht existiert). Sucht man nun nach "%€%", werden alle als unsicher markierten Worte ausgegeben. Der versierte Paläograph kann daraufhin unsichere Fälle lösen.
Weiteren Möglichkeiten der Kennzeichnung von Unsicherheiten sind keine Grenzen gesetzt: Beispielsweise kann die Anzahl der fehlenden Buchstaben in einem Wort durch die entsprechende Anzahl an Unt_rstri_hen kenntlich gemacht werden. Unsicherheiten bei Groß-/Kleinschreibung können z.B. durch einen nach oben gerichteten Pfeil markiert werden.
Neben den Korrekturstellen finden sich im Bereich "Werkzeuge" auch vorläufige Personen- und Ortsregister. Diese werden automatisch auf Grundlage der Textauszeichnungen generiert. Geordnet nach der Reihenfolge der Markierungen in den transkribierten Schriftstücken, werden sie jeweils mit einem Verweis auf das zugrundeliegende Schriftstück aufgelistet.
Übungsaufgabe (Kurs)
Zum Einstieg in die Arbeit mit dem Editionstool dient eine Urkunde aus der Lehrsammlung der Abt. Historische Grundwissenschaften der Ludwig-Maximilians-Universität München:
DE-LMUHGW|Urkunden|20 (1381 März 1, Wien)
Aufgabe:
- Laden Sie das Digitalisat der genannten Urkunde wie beschrieben im Editionstool hoch und versehen Sie es mit den zugehörigen Metadaten.
- Transkribieren Sie die drei Ihnen am Ende der Sitzung zugewiesenen Textzeilen und zeichnen Sie die Transkription mit Hilfe des zur Verfügung stehenden Tagsets aus.
- Überlegen Sie sich in Hinblick auf die kommende Sitzung, welche Regeln (= Editionsrichtlinien) Ihnen bei der Transkription spätmittelalterlicher Privaturkunden sinnvoll erscheinen. Ist das Tagset hierfür ausreichend oder werden Ergänzungen benötigt?
- Machen Sie sich Gedanken darüber, welches Stück aus dem Münchener Bestand auf monasterium.net Sie für Ihre Edition (= Leistungsnachweis) gerne bearbeiten möchten - vorzugsweise aus dem 14. Jahrhundert.
Nach dem Einstieg in die Arbeit mit dem Editionstool stehen in der folgenden Lehreinheit Lesestrategien im Vordergrund, die bei der Annäherung an ein Schriftstück hilfreich sind.
Zurück zu 3. Lehreinheit (Digitale Editionen: Grundlagen) ⇐⇒ Weiter zu 5. Lehreinheit (Lesestrategien)