Interview zu digitaler Edition

Ein bisschen Werbung in eigener Sache…

Während der Tagung «Edition! Wozu? Wie? Und Wieviele?» vom vergangenen November hat die Gelegenheit genützt und einige Interviews mit den beteiligten Personen durchgeführt (zur Reporting-Seite mit allen Interviews und Mitschnitten einiger Vorträge). Ich hatte das Glück zusammen mit Christiane Sibille (DODIS) und Gerhard Lauer (Uni Göttingen) kurze Statements abzugeben.

Das Resultat:

Interview zum Panel 4: T. Hodel, C. Sibille, G. Lauer from on Vimeo.


Quantifying Witness Lists – An approach doomed to fail

The following is a short paper prepared for a course. Since I was not able to further elaborate on it and put more material around, it remains a miscella with no specific claims.

The Witness Lists of the Cartulary of Holy Trinity, Aldgate

Research concerning persons, especially such dealing with masses of persons, often refers to the use and the possibilities offered by information and computational technologies: Faster re­search and more intriguing results are said to be possible. Through digitization and quantifica­tion more efficient and more precise work by historians ought to be possible. This paper seeks to test these promises by applying quantificational (factive) analyses on a collection of documents of Holy Trinity, Aldgate (London).


Witness lists offer the possibility to use an analysis based on quantification. For example it can be useful to distinguish how many witnesses were “needed” for a certain type of docu­ment, if any, and what changes occurred to this type over time. By looking solely at measura­ble fac­tors, I try to find as many possible conclusions that could be compared to results gained by close reading of similar sources. The danger of conclusions based on misinter­preted data is here willingly accepted and a test to check out approaches that are mostly neglected in the field of historical studies. Besides focusing on the use of wit­nesses in medieval documents, the methodology applied is of interest.

The questions posed in this paper are therefore threefold:

  1. How often and in what types of documents did witnesses occur in the cartulary of Holy Trin­ity abbey, Aldgate?
  2. What conclusions regarding typological as well as temporal patterns can be reached?
  3. How useful is the methodology in order to gain insights about matters of document produc­tion and connection between appearances of witnesses, date of document production, and types of documents?

The idea is to neglect the “content” of the entries in order to not be influenced by biases such as how much and what witnesses are to be expected when.

In order to have a quantifiable sample, I chose to analyze the documents copied in the cartu­lary of Holy Trinity. Due to the fact that the cartulary is available in a normalized English form and following a standardized description it is possible to structure the entries as data accordingly and without great effort (linguistical and paleographical). The structuring as well as the ba­sics of the documents will be explained in part 3. Part 4 deals with insights gained by the ap­plied methods. Part 5 offers conclusions as well as a critique of the methods applied, but first a short introduc­tion about Holy Trinity and its cartulary.

Holy Trinity and its Cartulary

Holy Trinity, Aldgate (also called Christ Church) was one of the most important monasteries within the city of London. Founded in 1108 by Queen Matilda (c. 1080—1118), secular can­ons following an Augustinian rule inhabited the site until its dissolution in 1532.[1] Since the founda­tion a strong connection to King and Queen as patrons can be found. Right at the beginning the endowments were invested heavily in buildings, vestments, and other objects of display, lead­ing to a scarcity of food and an involvement of the locals at Aldgate by donat­ing bread to the can­ons.[2] Foremost in London was land acquired and rented to citizens. There­fore most of the in­come stemmed from the city and was only partially augmented by revenues from out of town.[3] Until the dissolution in the 16th century, starting around 1290, the income of the monastery increased.[4]

Detail of structured document, containing seven entries of the cartulary

Figure 1: Detail of structured document, containing seven entries of the cartulary

The cartulary is one of the main sources for the economic and political history of Holy Trin­ity. In the 18th century the manuscript was edited and partially printed.[5] The edition in 1971 by Hodgett follows this tradition and treats the manuscript as a trustworthy collection of docu­ments in possession of the monastery.[6] The production of the cartulary itself is only given a lim­ited account. Although time (between 1425 and 1427) and scribe (Thomas de Ax­bridge) are known, it’s not asked what the reasons for the production of the cartulary could have been, and why the documents were ordered by parish. Similarly, it is not asked, why after the 13th century fewer and fewer documents were copied into the cartulary.

Without being able to consult the manuscript, it is hard to judge what reasons do stand be­hind the production in the 1420. The order of documents suggests connections between the cartu­lary and book of accounts. Bringing together the scattered documents of a parish in one place. Due to the fact that even summation (aggregation) were part of every parish-entry, it’s highly likely that the book was needed in order to defend or execute entitlements. This would explain the differ­ent types of documents and some of the frequencies (outlined below in figure 3).[7] Yet, these are only assump­tions that need further research.

In order to produce a distinct nomenclature in this paper, a “document” refers to the docu­ment that was copied into the cartulary. “Entry” is a part of the cartulary, i.e. a document, but also the notice (similar to a chronicle), or a summation. “Manuscript” meanwhile describes the cartulary as a book.

Structures of the documents – structuring the cartulary

The basis of this analysis is the edition by G. A. J. Hodgett published in 1971. This edition of the cartulary was digitized by British History Online[8] “a digital library containing some of the core printed primary (…) sources for the medieval (…) history of the British Isles.”[9] Most parts of the edition by Hodgett do not consist of full-text transcriptions but modernized and standard­ized summaries of the documents copied into the cartulary. The cartulary itself, as mentioned above, is not executed by the editor, and thus every copy is treated as a sin­gle entry referring to the document that should have existed at the time of the produc­tion of the cartulary.[10] Each entry is numbered,[11] followed by time of production (or time frame if un­sure), and a typological classification.[12] There are many types of documents and sometimes overlap­ping: Grants appear most often, followed by lists of those paying (quit) rents, notes, and summation of parishes.[13] Subsequent to the type of the char­ter follows a description of the act that was attested by the document, outlying the legal act, the involved parties, as well as the amount of money that was part of the agreement. Due to the goals of this paper that parts have been almost entirely ignored. Of far more interest are the lists of witnesses attached to the description of the documents. Although often shortened in cartularies, it seems as if this prac­tice was not followed in Holy Trinity. While this is obviously beneficial for the present study, we still wonder why the witnesses were copied.


Figure 2: Quantity of entries in cartulary by year.

In order to work with the available material, a structured document was created that can be searched and interpreted using so called “regular expressions”.[14]

Of the 1073 entries contain at least 366 entries one witness. Subtracting the entries of the summations of parish totals (84), the lists of those paying (quit) rent (264), and the chronicle en­tries (22), 703 entries could possibly include witnesses.[15] In slightly more than 50 percent (52%) of the entries at least one witness is mentioned.

A charter mentions on average 3.65 witnesses (if witnesses are in it at all). Of the 1336 witnesses in the cartulary, about 1080 of those are mentioned only once as wit­nesses: 134 appear twice or more.[16]

The use of the structured document appears to be useful in order to determine how many wit­nesses to expect. Therefore it is possible to determine that as a maximum 18 witnesses were listed (in 1193),[17] whilst several entries only name one witness.[18]

Not counted were entries mentioning an undefined number of witnesses (like “and further noble­men”).

The distribution of charters over the years within the cartulary shows that most entries were written between 1147 and 1272. Some years dominate the entries in the cartulary, for reasons that might have to do with the fact that in case of uncertain dating (i.e. postquam dating) the earliest possible date was taken.[19] No differences were made between dates vali­dated with cer­tainty compared to dates only assumed. On average almost 1.06 dated entries can be found in the cartulary per year.[20]

In order to fully understand the appearing witnesses (especially its shifting quantities) it is neces­sary to describe all entries of the cartulary in a similar manner, leading to a typology that was assumed by Hodgett’s edition (and of course a strong point of attack).

Although several checks and controls were conducted there still will be errors in the 3945 lines of the structured files, a caveat to relativize all conclusions to come.


Figure 3: Distribution of types of charters, including containing witnesses.

The typology of different charters demonstrates that mostly grants were copied into the cartu­lary. Lists of those paying (quit) rents does make the second largest part (together with the grants more than 80 percent. The fact that mostly grants were witnessed is very intri­guing, since it makes claims about the nature of grants possible and strengthens the presupposi­tion that the transmission of grants was one of the main goals of the production of the cartulary.[21] Combined with the appearance of entries of summation and lists of leasehold­ers a system of accounting becomes most likely a “background” of the cartularisa­tion. Regarding the distribu­tion of entries containing witnesses it becomes obvious that no type of document with certainty needed the involvement of named witnesses.[22]

Applied Quantifications – What the Numbers Tell

The next question to tackle concerning the witness lists deals with the distribution of wit­nesses per entry per year, in order to be able to tell whether there was a shift in pure quan­tity of wit­nesses listed in the documents.

Every dot in figure 4 symbolizes the number of witnesses in a given document in a particular year. Looking for patterns it becomes obvious that no development towards a more standard­ized number of witnesses per document can be stated over the long run. On the contrary, alt­hough two or three witnesses seem to become rather “normal” at the end of the 12th century, around 1300 the diversity grows again (maybe also due to the fact that the sam­ple around that time gets thinner). Also between 1190 and 1280 a lot of documents were pro­duced, naming either more witnesses than the two or three, or even less by nam­ing just one. The one witness-entry is only a frequent option between 1215 an 1250, which diminishes at the turn of the 14th century.

Further insights are promised by the analysis of three factors at the same time: date – type – and quantity of witnesses (figure 5). The regular connection between witnesses and grants be­comes once again obvious. As already demonstrated in the typological comparison, grants do mostly come with witnesses (more than 88% of the documents). And they do so steadily over time. Although usually containing about three witnesses, peaks and lows aren’t missing and no connection between time frame and quantity (concerning peak and low) can be found. Concern­ing the overall quantity of witnesses in the documents, there is no pattern or evolu­tion to­wards a consistent quantity detectable, not even for certain types of documents. A tendency towards three or four witnesses on average per grant can perhaps be found between 1230 and 1280.

Figure 4

Figure 4: Distribution of Witnesses by year per document. Grey cross lines stand for two witnesses. The figure is to scale.

For the same time period is also a concentration detectable on using witnesses only in grants (ex­cept for two leases and one release). Before as well as after the time frame the variety of types was broader, although not consisting of the same types of documents before and after. Whereas before, types such as “confirmations”, “letters”, and a “release” can be found, in the later period one “acquittance”, “quitclaims” and others can be stated. In both periods (before 1230 and after 1280) occurred witnessed “exchanges”.

Patterns in Documents produced in the same time – an excursus

Due to the fact that certain years appear more often as dates of entries, the likelihood of pat­terns in appearing witnesses are higher. And analyzing the entries of 1222 (or rather post 1222) shows that certain people and even identical or almost identical combinations of peo­ple appear (42 entries containing witnesses): 7 documents were witnessed solely or accompa­nied with not more than one other named witness by Gilbert Fulc (or “son of Fulk”). Even more intri­guing is the appearance of a combination of witnesses in the same year: William de Alegate, Ralph his brother, Stephen the Tanner, Terricus, Bartholomew (also a brother of William) ap­pear among others (and twice in a different sequence) in 9 entries.

Similar to the insights of McKitterick for Saint Gall, it can be stated that in 13th century Lon­don witnesses were denominated (at least partially) in groups.[24] Due to the fact that the char­ters cannot be dated exactly, it remains questionable whether the issuing of the char­ters happened at the same date or whether the same group was called up on different dates.

Interestingly, the same cannot be concluded for the documents dated 1197 (or rather post 1197). In this group of documents only 3 persons appear more than once.[25] In the same pe­riod it’s also conspicuous that a majority of people with a clerical background are listed as witnesses (es­pecially in comparison to the group of 1222).[26]

Quantifying Witness Lists: a Conclusion and a Critique

The idea of this project was to rely solely on gained “data” (rather than information) of the cartu­lary’s digitized version in order to test how far and in what directions a quantitative analysis could lead. The results are biased:

No constant patterns of when how many witnesses were present in order to produce a char­ter was found. Neither is there, barring grants to a certain degree, a type of document identifiable that had to have witnesses mentioned. Except for the period between 1230 and 1280 there is no evolution or stream-lining of documents detectable. But interestingly right at the beginning of this period, a pattern of groups of witnesses can be stated. These two percep­tions united could belong to an attempt to produce documents a certain way using a certain group of peo­ple. Or it could be a sign of the influence claimed by a certain group in the 1220ies and 1230ies. Between 1222 and 1248 Richard was prior, right at the time that “the greatest business activity took place”[27] according to Hodgett.[28]

These conclusions make two points obvious: A quantitative analysis only makes sense if compared and enhanced with further perspectives that can’t be gained from pure num­bers. Second, one of the main problems of this paper remains or gets even aggravated: The cartu­lary stands like a semi-translucent curtain between the documents and the historian. The uncer­tainty of what is trustworthy and what not remains.[29] For example, the re­peated occurrence of the same group of people could indicate a forgery.

Figure 5

Figure 5: Representation of quantity of witness – type – and time of production. The charter (years) is not to scale! The average value is taken if the same type appeared more than once in one year.

Nevertheless, depictions and quantifications might help to approach questions of why and how witnesses were “used” in documents (and further in medieval societies). Dealing with quantifica­tions might help to detect patterns and modifications that would have gone unno­ticed in close reading. Comparisons are more easily feasible and hone our approaches to differ­ent institutions and settings. Though, of course a wider array of data needed to be collected in order to be able to make more sustainable arguments.

[1] A short introduction to the monastery, its history, and its economic standing is given in the introduction of the edition: Hodgett, G. A. J.: The Cartulary of Holy Trinity, Aldgate: London Record Society 7 (1971), pp. xi-xxi, here: xiii-xvi. The site of the monastery was before its foundation already inhabited by canons, see ibid, p. xiii.

[2] Without having indepth insight, one could argue that this was not done due to the scarce endowment but in order to popularize the newly established monastery. Following the narrative of the scarcity: Ibid, p. xiv.

[3] Ibid, xvi, Hodgett estimates that 60 percent were income from the city. One of the neglected sources of incomes were coming from churches collated to Holy Trinity, cf. Ibid, xvii.

[4] Ibid.

[5] Ibid, xi.

[6] Hodgett claims that the scribe of the book (Thomas de Axbridge) was not negligent but partially ill informed.

[7] See Figure 2, p. 6.

[8] Hodgett: The Cartulary of Holy Trinity, Aldgate: London Record Society 7 (1971). URL: [accessed: 15 October 2013].

[9] Cited after self-description: [accessed 2013-10-15]. The ressource was created and is maintained by the Institute of Historical Research and the History of Parliament Trust.

[10] Except for page breaks of the cartulary that are mentioned within the documents.

[11] Numbers run from 1 to 1073, baring an appendix.

[12] The classification is only partially stringent, since some of the charters were described rather than classified in length.

[13] As mentioned above (see page 1), the main goal of the cartulary might have been a more severe control of the dues, thus understandably the mentioned parts occur the most often. A list of the most frequent types of documents is to be found in figure 3.

[14] The document is in XML, a markup language that does not define the interpretation of the used tags but demands for a strict hierarchy. The style of the structure is close (but not according) to the quasi-standard of TEI (Text Encoding Initiative) for the structured encoding of texts (especially editions): [accessed: 2013-10-15].

[15] The subtracted entries were either never produced as charters and appear in the cartulary for the first time (such as chronicle entries and summations of parishes), or are traditionally not known to have contained a witness list (such as lists of those paying rents etc.).

[16] There is an uncertainty in these numbers because they were collected by comparison of names, independent of the time of their appearance, thus it is possible, that persons were counted as identical because they had had the same name. Further it is also possible that persons appeared several times as witnesses but were counted as distinct persons, since the spelling of their name varied greatly (small variations were taken into consideration if possible) and/or they were only called by their first name.

[17] Entry n° 270, a grant of Jordan to Holy Trinity.

[18] To be found in the years 1087, 1135, 1136, 1170 (twice), 1180, 1197 (twice), 1215, 1222 (eleven times), 1223, 1228, 1231, 1241, 1243, 1247, 1250 (twice), 1252, 1270, 1303, 1308, as well as five undated entries.

[19] 1222 is mentioned in 45 entries, 1170 in 41, 1197 in 28. The postquam dating could refer to: 1170, assassination of Thomas Becket; 1222, council at Osney.

[20] The average per year is 1.05974 (all years considered).

[21] In this regard a comparison of grant holders and lease paying people could be very fruitful.

[22] „Sales“ and „quitclaims“ do always contain named witnesses, but since they only appear in small numbers, the conclusion would not be steady. There is also no pattern to be found in the grants not containing witness lists.

[23] Grey cross lines stand for two witnesses. The figure is to scale.

[24] McKitterick, Rosamond: The Carolingians and the written word, Cambridge 1989, pp. 98-103.

[25] Roger, the chaplain of St. Edmund (twice); Robert, the chaplain (five times); John, chaplain of St. Michael.

[26] In the group of 1197 slightly more clericus than laicus can be found, whereas in the group of 1222 less than a handful clericus appear.

[27] Hodgett, Cartulary, p. xv.

[28] Assuming this is correct, that means that not the biggest spikes in the production of documents could point to such activity but rather a steady production.

[29] Similar to the observations of: Geary, Patrick J.: Phantoms of remembrance : memory and oblivion at the end of the first millennium, Princeton 1994, pp. 112-114.

Nachlese eigener Beiträge zur DH2014 Lausanne im Netz

Unter weiterer Vernachlässigung des eigenen Blogs habe ich mich auf anderen Seiten des weltweiten Netzes betätigt und zu Diversem der Digital Humanities 2014 in Lausanne geschrieben:

Etwa auf Ordensgeschichte:

Der Beitrag wurde auch auf dem Blog von Geschichte und Informatik ( publiziert.

Beiträge für Infoclio, welche mir freundlicherweise den freien Zugang zum Kongress ermöglichten:

Nicht zu vergessen Twitter-RTs von vielem (mehr oder weniger) Relevantem während der DH2014 (siehe Twitterleiste rechts und Link zur Suche unten).


Digital Humanities Defined — zu eng?

In seinem Beitrag vom Sonntag bringt Michael Piotrowski (twitter: @true_mxp) ein wichtiges Thema auf den Punkt: Was zum Teufel sind eigentlich DH (Link zu seinem Blogbeitrag).

Vorausschicken muss man, dass Michael in vielen Punkten recht hat: Die DH keine eigene Disziplin ist (sondern innerhalb der „alten Disziplinen“ agieren muss), ein (weites, undefiniertes) Methodenset anbietet, etc. (oder kurz: Beitrag lesen).

Seine Definition der Digital Humanities ist knapp und schlüssig, wobei er zwischen „enger“ (1) und „erweiterter“ (2) Definition unterscheidet.
(1) Die Anwendung von quantitativen, computer-basierten Methoden für geisteswissenschaftliche Forschung (sprich zur Beantwortung geisteswissenschaftlicher Fragestellungen)
(2) Die Anwendung von computer-basierten Tools für geisteswissenschaftlicher Forschung.

Zur Veranschaulichung zählt er etwa digitalen Editionen zu zweiter Gruppe, jedoch nicht zu DH im ersten, engeren Sinn.

Grundsätzlich bin ich sehr dafür, ab und zu kurze Diskussionen über die Definition von Digital Humanities zu führen. Ich bin wie Michael der Meinung, dass in vielen Definitionen zuviel dazu gerechnet wird und der Begriff bereits zu oft als Buzzword (sei es bei Anträgen für Forschungsprojekte oder zur Selbstdarstellung) missbraucht wird. Wie er ausführt hat das Führen eines Blogs wenig mit DH zu tun, ebenso wenig wie Konversationen auf twitter oder Ausschreibungen auf H-Soz-Kult.

Mein Problem an seinen Definitionen ist sein strenge: (1) ist mir zu eng, (2) dagegen zu weit. (hört sich wie eine herrlich endlose scholastische Debatte an…)
Die zweite Definition würde — meiner Meinung nach — eigentlich alle WissenschaftlerInnen zu DHler machen, die nur ab und zu einen Computer anmachen und eine Abfrage auf dem Suchanbieter/Bibliothekskatalog ihrer Wahl durchführen. Obwohl ich noch nicht ganz von der Zweiteilung in weite und enge Definition überzeugt bin, müsste daher hier eine Verfeinerung stattfinden.

Bei (1) der Definition bin ich dagegen völlig d’accord, dass es sich bei allen damit beschriebenen Forschungen um DH handelt. Gleichzeitig gehört aber dennoch mehr in diese Kategorie: Wenn der Begriff Quantifizierung vorgebracht wird, impliziert dies eine statistische Veri-/Falsifizierung. In vielen vorstellbaren Anwendungsfällen der Geisteswissenschaften wird die Datenlage jedoch zu klein sein um jemals zu einem statistisch belastbaren Ergebnis zu kommen (und eine Ausweitung der Stichprobe ist für mich ein äusserst zweischneidiges Schwert, big data ist nicht die Antwort auf alles). Würden solche Forschungen folglich dennoch als „quantifiziert“ gelten?

Ein weiteres Themenfeld das völlig weggelassen wird, sind Visualisierungen. Der versierte Argumentator wird vorbringen, dass es sich dabei nicht um Forschung/“Denken“ im engeren Sinn handelt, zugegeben. Dennoch kann etwa die Darstellung auf einer Karte zu Einsichten führen, die nicht einmal Ortskundigen auffallen würde (ganz zu Schweigen vom Potential der Kombination mit geologischen oder anderen Filtern).

Dies führt mich zum eigentlichen Kern: Meiner Meinung nach geht es in den Geisteswissenschaften um das Verstehen von Menschen, ihren Vorstellungswelten (Wirklichkeiten?), ihren Handlungen und ihren Beeinflussungen. Um dem aber näher zu kommen, bedarf es oft dem Überwinden eigener Vorstellung und Logik („Selbst-Befremden“) und genau dafür kann (und soll) die Maschine auf dem Schreibtisch auch genutzt werden. Mit neu dargestellten, umgeordneten Daten (Quellen) ist es möglich zu anderen (vielleicht besseren) Anregungen gegenüber von Problemgemengen kommen. Und genau solche Impulse gehören zu den Digital Humanities (meiner Meinung nach sogar dann wenn die Auswertung theoretisch ohne Rechenleistung erbracht werden könnte, in dem etwa selbst eine Karte gezeichnet würde). Ansonsten sind wir relativ schnell wieder bei Diskussionen um Quantifizierungen und „Zählbarmachungen“, die bereits in den 70er Jahren die Geschichtswissenschaft zu revolutionieren versuchten und in Retrospektive zahlreiche Grabenkämpfe auslösten.

Die von Michael vorgebrachte Kategorie für Natural Language Processing und ähnliches als Humanities Computing (ausserhalb der DH), könnte als Anstoss gesehen werden über die Einführung von weiteren Kategorien nachzudenken, welche die DH als Umbrella-Term nutzen. Statt einer Zweiteilung hätten wir dann eine Vielzahl von Unterdefinitionen…

Und was bedeutet es nun Digital Humanities zu betreiben?

Der Einsatz von digital(isiert)en Ressourcen und Algorithmen (Programmen?) um geisteswissenschaftliche Fragestellungen zu beantworten. (na ja, auch nicht ganz zufrieden stellend…) [eine Fortsetzung der Diskussion ist wohl unumgänglich :]

6. Schoenberg Manuscript Symposium – take aways

Das in Philadelphia abgehaltene Symposium bringt regelmässig Experten der „alten“ Manuskriptwissenschaften und der „neuen“ digitalen Welt zusammen und natürlich insbesondere auch solche, welche sich in beiden Welten bewegen (die Trennung stellte sich als äusserst dünn heraus). Dass die Zusammenarbeit alle beteiligten Wissenschaftszweige belebt, zeigten die vergangenen Tag und eine Reihe von Verknüpfungen die aus früheren Symposien hervorgingen.

Hier einige Ansätze und Tools die (höchst subjektiv) als aussergewöhnlich oder interessant gewertet wurden:

Zum Anfang ein neuer Ansatz zur Identifikation von Schreiberhänden: Im Gegensatz zum Versuch einzelne Eigenheiten von Schreibern zu identifizieren, wie in DigiPal praktiziert, versucht Elaine Treharne (Stanford), dass die Messung von Zwischenräumen zwischen Buchstaben und Zeilen möglicherweise ein Mittel zur Identifikation sein könnte.

Ganz in eine andere Richtung deutete die Untersuchungen von Kathryn Rudy: Ihre „dirty books“ (vorwiegend Stundenbücher aus dem niederländischen Raum) sind teilweise abgegriffen, dies eröffnet die Möglichkeit den tatsächlichen Gebrauch der Bücher abzuschätzen. Mittels densitometrischer Analyse (eigentlich die Messung der Verfärbung) ist es möglich zu zeigen, dass vorwiegend die Seiten aufgeschlagen wurden, welche die höchsten Ablassleistungen versprachen. Genauer in ihrem Aufsatz von 2010 (hier). In einer Abwandlung beschäftigt sie sich nun mit „osculatory targets“: Illuminationen die geküsst wurden und dadurch teilweise gravierende „Schäden“ erlitten. Wobei sie die Theorie vertritt, dass der Akt aus der Öffentlichkeit in den privaten Umgang mit Schriftstücken eingang fand.

Ganz andere Probleme können mittels T-Pen umgangen (und neu geschaffen werden): Das Tool, dass bereits seit längerer Zeit verfügbar ist, hilft bei der Erstellung von Transkriptionen und Editionen. Mittlerweilen ist das Produkt soweit, dass TEI unterstützt wird oder aber auch eigene Definitionspakete geladen werden können. Dank der Übernahme von frei verfügbaren Handschriften (etwa aus e-codices) ist auch für den nur testenden User genügend Material vorhanden. T-Pen ist als freie Software konzipiert und kann dadurch auch auf eigenen Servern installiert und betrieben werden, was das Produkt für Editionsunternehmungen interessant machen dürfte.

Viel geschlossener und auf Lehre ausgerichtet ist Homer Multitext. Obwohl die bearbeiteten Manuskript der Illias offen zugänglich sind, wird der wirkliche Leistungsumfang nicht auf der Internetseite sichtbar. Jeder beliebige Teil (eines Bildes, eines Textausschnitts etc.) ist zitier- und verknüpfbar. Wörterbücher und Ontologien schreiben dabei vor, welche Werte überhaupt eingegeben werden können, wobei die Eingabe von Schreibvarianten auch berücksichtigt wurde.

Schliesslich sei auf das Projekt von Martin Foys (UCL) hingewiesen, welcher mit dem Virtual Mappa Project unterschiedliche Karten annotiert und Verknüpfungen herstellt zwischen den Karten und zeitgenössischen Texten, die sich mit Geographie beschäftigen (hier beschrieben). Die Software, welche die Verknüpfung möglich macht ist ausgesprochen intuitiv zu bedienen und geeignet um eigene Korpora zu schaffen: DM Tools for Digital Annotation and Linking.

Das Programm des gesamten Symposiums findet sich hier.

Das kleine Digitale, ein paar Überlegungen nach Feierabend

Gerade erschienen das aktuelle Jahrbuch zur Zürcher Wissensgeschichte: Nach Feierabend 7 mit einem kleinen Artikel meinerseits.

Dank ZORA (dem Zürcher Repository) auch als Preprint greifbar:

Der Artikel wurde angeregt durch kontroverse Mittagessens-Diskussionen (vielen Dank an alle Beteiligten!) über zwei in diesem Blog vorgebrachten Ideen und Problemstellungen: Kritik an OCR Praktiken und eine kurze Darstellung der Rezeption des Google nGram-Viewers.

Der Artikel wirft einen kritischen Blick auf die Digitalisierungsbegeisterung des 21. Jahrhunderts und daraus entstehende Quantifizierungsversuche in den Geisteswissenschaften. Anhand des als Vorbild verstandenen Google Ngram Viewers wird demonstriert, wie problematisch die Anwendung großer, undurchsichtiger Korpora auf mehreren Ebenen ist. Neben technischen und konzeptionellen Mängeln kommen auch Fragen zum Verständnis und der Analyse von »Kultur« auf. Ein zweiter Teil skizziert als Gegenvorschlag die Möglichkeiten sorgfältig erarbeiteter kleiner Korpora, die neue Erkenntnisse dank neuer digitaler Methoden versprechen und heute bereits erfolgreich in den Geisteswissenschaften angewendet werden.

Der Inhalt des sehr lesenswerten Bandes findet sich auf der Seite des Verlags: Zu Diaphanes

Interessant (aber hier nur am Rande): Der Preis des elektronischen Artikels bemisst sich aus seiner Länge… Was ja irgendwie auch konsequent ist, schliesslich wird vor allem Satz und Korrekturlesen vom Verlag betrieben und da kommt’s auf den Umfang an.

Akademisches Publizieren: Ideenskizze zum Neuanfang

Ein Artikel der NZZ zur Arbeitsweise beim Magazin Forbes (Link) beschreibt, wie jegliche Beiträge der regelmässigen und nicht-regelmässigen Mitarbeitenden der Zeitschrift publiziert werden und eine Bewertung durch die Redaktion erst nachträglich (wenn überhaupt) stattfindet. Der Mitarbeitende also zu einem Grossteil selbst verantwortlich ist, dass der von ihnen publizierte Inhalt an die Leute gebracht wird. Dies impliziert natürlich momentan hippe „Social Media Kampagnen“ und Self-marketing pp.

Könnte das Modell nicht auch auf die Welt der academia übertragen werden? Oder anders gefragt: Wie könnte „Publizieren“ oder noch allgemeiner „Wissenschaft betreiben“ im 21. Jahrhundert aussehen. Und um dem ganzen noch ein bisschen mehr Schwung zu verleihen, nehme ich an, dass so etwas wie Verlage gar nicht nötig sind… auf in die Utopie

Zeitschriften und Sammelbändaufsätze sind die wohl häufigsten Formen des geisteswissenschaftlichen Publizierens neben Monographien. Erwachsen aus Tagungen, Arbeitsgruppen oder vor dem Hintergrund des publish or perish werden Druckseiten en masse produziert. Bei Tagungsbänden ist es teilweise so, dass die Beiträge zwar in die Nähe der in der Einleitung skizzierten Thematik gehen, aber doch Spezialaspekte abdecken; teilweise scheinen die Beiträge schnell zusammengeschustert, weil die Möglichkeit des Publizierens bestand; andere Beiträge wiederum sind passend und gut. Bei Zeitschriften besteht meistens – von Sonderheften, die ich in die Nähe von Tagungsbänden rücken möchte, abgesehen – eine weitere Freiheit und das Prestige der Zeitschrift verleitet zum Eingeben von Manuskripten. Nach einer redaktionellen und peerigen Review-Phase kommen schliesslich die ausgewählten Aufsätze zum Handkuss und werden in alt-ehrwürdigen oder jungen-frechen Seiten gedruckt.

Nun könnte man das Pferd mal von hinten aufzäumen: Eine Schreibende möchte eine Entdeckung, einen besonders gelungenes Argument aus einem Vortrag oder die Kurzfassung einer Qualifikationsarbeit verbreiten. Nun ist vorstellbar, dass dies ohne grosses Aufhebens (nach sorgfältiger Erarbeitung oder wie die eigenen Qualitätsstandarts aussehen…) auf einer (blog-artigen?!) Seite der eigenen Institution geschieht.
Dank Selbstmarketing und Weiterempfehlungen gelangt der zitierfähige (und im institutseigenen Repository langfristig verfügbare) Artikel in den Umlauf. Diskussionen zum Artikel werden auf der entsprechenden Kommentarseite und in fremden Blogs geführt (deren Verlinkung mittels ping-back direkt ebenfalls als Kommentar beim veröffentlichten Artikel sichtbar werden).

Auf den Artikel werden (dank seiner passenden Thematik, der Wichtigkeit der Entdeckung oder anderer Faktoren) sogenannte Redaktionen aufmerksam. Anstatt, dass aber nun der Artikel kopiert wird, veröffentlicht die Reaktion einzig den Link auf den Artikel, evtl. einen Abstract, eine Einleitung oder die Erwiderung einer Fachperson. Mehrere solche Artikel gesammelt ergeben eine neue Ausgabe einer „Zeitschrift“ oder gar einen „Sammelband“. Vielleicht mit einer Diskussion von früher empfohlenen Artikeln etc.

Konkret könnten Zeitschriftenredaktionen also die Aufgabe des Kuratierens übernehmen. Wer entsprechend in höher angesehenen „Zeitschriften“ kuratiert wird, erhält höheres Prestige (citation-index etc.). Qualitätskontrolle post festum. Dank Versionierung ist es aber auch denkbar, dass eine Redaktion von sich aus oder weil sich die Schreibende auf einen Call for Article gemeldet hat, einen peer-review-prozess durchführt. Um in der Zeitschrift kuratiert zu werden, verlangt die Redaktion einige Anpassungen oder Korrekturen des bereits (öffentlich?) zugängigen Artikels, sodass auch die Gefahr verhindert wird, dass ungeprüftes/qualitativ „Minderwertiges“ (aus der Perspektive der Redaktion) unter dem Label der Zeitschrift erscheinen könnte. Aufgrund unterschiedlicher Versionen wird es möglich einen Artikel zu überarbeiten und Zitierungen bleiben gültig. Gleichzeitig hätten auch andere die Möglichkeit auf die Entwicklung des Artikels Einfluss zu nehmen.

Aus der Perspektive der Institutionen ergäben sich auch einigen Gewinn: Eine Uni müsste etwa nicht mehr mühsam seine angegliederten Wissenschaftlerinnen auffordern Ende Jahr ihre wissenschaftlichen Publikationen in irgendwelche Formular einzugeben, um sicherzustellen, dass Statistiken erstellt und die eigene Exzellenz hervorgehoben werden kann. Im Gegenteil: Auf den Instituts/Seminarseiten können die Beiträge der eigenen Forscherinnen (umgehend) aufgezeigt und die Langzeitsicherung durch (bereits bestehende) Repository übernommen werden. Rückschlüsse auf die Forschungsleistung wäre für die Institutionen durch die vergebenen DOI-Nummern automatisch durchführbar, damit würde auch klar, welche Periodika und welche Sammelbände den Beitrags der Forscherin kuratierte.

Weitergedacht wäre es gar möglich ganze Bücher so zu publizieren. Solange assoziert, behält ein Forscher eine Seite, auf welcher die Publikation als Download oder als interaktive Datenbank verknüpft mit Analyseteil zu finden ist. Langzeitsicherung erfolgt wiederum mittels repository (die natürlich fähig sein müssen, entsprechende Datenbank-Abbilder aufzunehmen und über die Zeit zu retten). Sollte eine Forscherin nun die Institution wechseln, bleiben seine Artikel bei der Institution, in welcher die Erarbeitung erfolgte (sozusagen beim Sponsor). Einer Institution entsteht also ein konkreter Mehrwert, wenn „gute“ Forschung bei ihr entsteht, werden doch mehr Personen auf den Artikel aufmerksam und werden die Seite besuchen, die Klick-Rate wird zum Qualitätsmerkmal. Auch für die (immer wichtiger werdenden?) Anwerbung von Master- und Doktoratsstudierenden würde direkt klar, wo die „innovative“ Forschung herkommt.

Dass sich  Afficionados sich eine entsprechende Publikation als Book on Demand gebunden frei haus liefern lassen ist klar. Druckkostenzuschüsse, dies der grosse Vorteil, könnten vollumfänglich in die Forschung, das Lektorat oder die (webgerechte) Aufbereitung des erarbeiteten Inhalts fliessen. Insgesamt erscheint die finanzielle Seite ohnehin entlastet, da der ganze Vertrieb und die Bewerbung von Druckerzeugnissen wegfällt und Anschaffungen von Bibliotheken kleiner werden. Auch die (meiner Meinung nach) ungute Verknüpfung zwischen etablierter Wissenschaft und Verlagen würde entfallen.

Natürlich handelt es sich hier um eine Utopie, denn nach wie vor vertraut die Wissenschaft (wer immer da dazugehört) den Druckerzeugnissen, wie sie bereits seit fünfzig Jahren etabliert sind (und sich aus diversen Strömungen und Anforderungen herausbildeten: siehe etwa William Clark: Academic Charisma and the Origins of the Research University), dennoch ist es angebracht über alternative Formen der Wissensverbreitung nachzudenken. Formen, die nicht an schwerfällige und profitorientierte Vermittlung gebunden sind.