Alle Links in diesem Artikel führen, soweit nicht anders gekennzeichnet, zu englischsprachigen Webseiten.
Einer der mühsamsten Momente bei der Arbeit mit Texten ist der, wenn Formate wie Word oder PDF in ein les- und auswertbares Format konvertiert werden müssen.
Das Problem ist nicht neu, es gab nur bislang keine Lösung dafür. Aber wir leben ja heute in einer Zeit der Gemeinschaftsprojekte und eines der neuesten dieser Projekte ist eine Software, die unter dem Namen SayIt auf den Markt gekommen ist. SayIt gehört zum Poplus-Projekt, einem internationalen Netzwerk ziviler Hacker, die frei verfügbare Anwendungen entwickeln. Es wurde unter anderem von MySociety geschaffen, deren Mission lautet, “Menschen durch digitale Mittel dazu befähigen, einflussreicher in den zivilen und demokratischen Bereichen ihres Lebens zu werden”.
Laut dem Blog von Poplus kann SayIt dazu benutzt werden, Transkriptionen von PDF- oder Word-Dokumenten und anderen Formaten zu veröffentlichen und zu lesen.
SayIt is a new way to publish transcripts online – transcripts such as parliamentary debates, court trials, speeches, or even playscripts. It can be embedded into your website, or used as a standalone instance.
SayIt ist eine neue Art, Transkriptionen online zu veröffentlichen, Transkripte von Parlamentsdebatten, Gerichtsprozessen, Reden oder sogar Theaterstücken. Es kann in eine Webseite eingebettet oder als eigenständiges Exemplar genutzt werden.
Unter “Hilfe” [es] erklärt die Seite SayIt noch einiges mehr, unter anderem, warum es wichtig ist, über höherwertige Transkripte zu verfügen:
Transcripts are a kind of oil that greases the wheels of well-functioning societies. They let people discover when powerful people have made pronouncements that affect less powerful people. We believe that by making transcripts function better, more people will end up learning about decisions and opinions that affect their lives.
Transkripte schmieren das Getriebe gut funktionierender Gesellschaften. Sie ermöglichen es Menschen dahinterzukommen, wenn einflussreiche Leute Erklärungen machen, die sich auf weniger einflussreiche Menschen auswirken. Wir glauben, dass besser funktionierende Transkripte dazu führen werden, dass letztlich mehr Menschen von Entscheidungen und Meinungen erfahren, die ihre Leben betreffen.
Die Anwendung, die noch eine Alpha-Version ist und sich also noch in der Entwicklung befindet, hat bereits das Interesse von Fachmedien geweckt. Die Online-Ausgabe des Technologie-Magazins Wired sprach beispielsweise mit Myfanwy Nixon, der Kommunikations- und Marketingmanagerin von MySociety. Nixon erklärte, dass SayIt mit der Initiative Akoma Ntoso kooperiert [es], die einen Standard für die Maschinenlesbarkeit von Regierungsdokumenten vorgibt und daran arbeitet, die Struktur und Semantik von Texten sichtbar zu machen, so dass korrekte Transkripte entstehen können.
“The transcripts tend to be in all sorts of different formats — PDFs, Word documents, scans, you name it — and each requires a slightly different approach. You can't just run a magic piece of code and immediately get them all nice and shiny.”
Transkriptionen neigen dazu, in allen möglichen Formaten vorzuliegen, als PDF, Word-Dokument, Scans, was auch immer. Jedes dieser Format bedarf einer leicht unterschiedlichen Vorgehensweise. Man kann nicht irgendein Zauberprogramm ausführen und sie mal eben nett herrichten und blitzeblank polieren.
Sie fügt hinzu, dass in der zweiten Phase des Projekts eine Schnittstelle geschaffen werden soll, mit der Transkriptionen während des Prozesses der Erstellung formatiert werden können.
” […] we also foresee that a lot of organisations and individuals will have existing transcripts that they want to publish. We're keen to see this happen, but we know that the biggest task will be transforming them into a format we can use. Not impossible, just (often) labour-intensive,”
[…] Wir sehen außerdem kommen, dass viele Organisationen und Individuen bereits über Transkriptionen verfügen, die sie veröffentlichen wollen. Wir sind sehr daran interessiert, dass das geschieht, aber wir wissen, dass die größte Aufgabe sein wird, sie in ein nutzbares Format zu bringen. Nicht unmöglich, aber eben (oft) arbeitsintensiv.
Auch Robert Sharp kommentierte auf seinem Blog den Start von SayIt. Es gehöre zu “diesen Dingen, die Kampagnen der Basis befähigt und Demokratieprozesse beschleunigt” und er erklärt, warum er davon so begeistert ist:
Readers of this blog will know how irritated I get with the quality of parliamentary and government papers online. Transcripts and other documentation are frequently uploaded as PDFs, as if the only thing a researcher or campaigner plans to do with the document is print it.
Die Leserschaft des Blogs weiß, wie gereizt ich auf die Qualität von offiziellen Papieren des Parlaments und der Regierung reagiere, die online veröffentlicht werden. Transkripte und andere Dokumente werden gelegentlich als PDF hochgeladen, als wäre das einzige, was Forscher oder Aktivisten damit beabsichtigten, es auszudrucken.
Auf der anderen Seite schreibt Mark Ballard auf dem Blog Public Sector IT des digitalen Technikmagazins Computer Weekly über die Markteinführung von SayIt. Er bringt es in Zusammenhang mit der Politik Großbritanniens, wo vor nicht allzu langer Zeit die regierende konservative Partei zehn Jahre Unterlagen aus den Archiven im Internat hat löschen lassen. Computer Weekly sprach mit Tom Steinberg, dem Gründer und Leiter von MySociety, der sagt:
“The whole business of transcripts – whether its parliament or celebrity interviews – needs bringing up to speed. It's woefully old-fashioned. We want people all over the world to find out when powerful people talk about things that matter to them. If someone is talking about your road in a local government meeting today, you will never know. […] structured data is what makes each Tweet a beautifully-structured thing. It's what makes Facebook work. And it's what makes everything on the internet work. But as of today transcripts are not structured at all
Diese ganze Unternehmung mit den Transkriptionen, seien es parlamentarische Dokumente oder Interviews mit Prominenten, müssen in Schwung gebracht werden. Es ist elend altmodisch. Wir möchten, dass Menschen aus aller Welt in Erfahrung bringen können, wenn einflussreiche Leute über Dinge sprechen, die sie etwas angehen. Wenn irgendjemand heute über deine Straße bei einem lokalen Regierungstreffen spricht, wirst du es niemals erfahren. […] Strukturierte Daten sind es, die jede einzige Twitternachricht zu einer wunderschön strukturierten Sache machen. Das ist es, was Facebook funktionieren lässt. Und das ist es, was alles im Internet am Laufen hält. Aber nach heutigem Stand sind Transkripte überhaupt nicht strukturiert.
Verschiedene Netzbürger rund um die Welt haben ebenfalls ihre Erwartungen bezüglich der Funktionsweise der Software formuliert.
@mySocietyIntl needs your help to test @SayItPoplus… it could be a great tool in the fight for #humanrights #OpenGovernment
— Diana Delamer (@DoruntineUK) January 20, 2014
MySociety braucht deine Hilfe um SayIt zu testen… Es könnte ein großartiges Werkzeug sein für den Kampf um Menschenrechte und transparente Regierungen.
@sinarproject will soon focus on getting important transcripts accessible with Sayit thanks to @mySocietyIntl http://t.co/IWjpeEntf1
— Khairil Yusof (@kaerumy) January 17, 2014
Das Sinar-Projekt wird sich dank MySociety bald darauf konzentrieren, mit SayIt wichtige Transkripte zugänglich zu machen.
.@SayItPoplus As a Human Rights lawyer, I am loving this tool. Already in mind the @RiosMonttTrial and the Manning trial!
— Renata Avila (@avilarenata) January 15, 2014
Als Menschenrechtsanwalt liebe ich dieses Programm. Ich habe da schon im Hinterkopf die Prozeses um [Efraín] Rios Montt und [Chelsea] Manning!
How many times does Shakespeare mention ‘Africa’ in his plays? @SayItPoplus new tool can tell you http://t.co/DDNYZCrtxT
— The Indigo Trust (@indigotrust) January 16, 2014
Wie oft erwähnt Shakespeare “Afrika” in seinen Stücken? Das neue Programm SayIt kann es euch sagen.
Um die Funktionsweise von SayIt zu verstehen, stehen uns drei Beispiele aus den Archiven Großbritanniens zur Verfügung: Der Leveson Inquiry, eine Untersuchung zur Ethik der britischen Presse [im Zusammenhang mit dem Skandal um News International], der Prozess gegen Charles Taylor, der wegen Kriegsverbrechen verurteilte Ex-Präsident Liberias und die gesammelten Werke Shakespeares (die nach Stichwörtern, Figuren oder nach dem jeweiligen Stück durchsucht werden können). Außerdem gibt es kurze Gebrauchsanweisungen zum Hochladen von Transkripten für die Leser, die technisch nicht so versiert sind und für Entwickler.
Wie die Vertreter von MySociety in einem Beitrag auf ihrem Blog über SayIt selbst sagen, kann die Software eine große Hilfe sein, um Transkripte zu veröffentlichen und zu archivieren, wie Gemeinderatssitzungen, Gerichtsverhandlungen, Wahlkampfkampagnen, Interviews und Fokusgruppen wissenschaftlicher Forschung, akademische Seminare, Konferenzen, Inszenierungen, Gruppendiskussionen in der Marktforschung, Archive historischer Ereignisse wie einer Krönung oder bedeutsamer Debatten.
Da gibt es sicherlich viele Möglichkeiten. Es ist abzuwarten, wie die Zivilgesellschaft, Aktivisten oder gemeine Bürger das nutzen werden. Zum Schluss noch ein Hangout jüngeren Datums, in dem der Leiter von MySociety Tom Steinberg über SayIt spricht.