-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathhtml_thesis_aug2.html
2313 lines (2312 loc) · 134 KB
/
html_thesis_aug2.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
699
700
701
702
703
704
705
706
707
708
709
710
711
712
713
714
715
716
717
718
719
720
721
722
723
724
725
726
727
728
729
730
731
732
733
734
735
736
737
738
739
740
741
742
743
744
745
746
747
748
749
750
751
752
753
754
755
756
757
758
759
760
761
762
763
764
765
766
767
768
769
770
771
772
773
774
775
776
777
778
779
780
781
782
783
784
785
786
787
788
789
790
791
792
793
794
795
796
797
798
799
800
801
802
803
804
805
806
807
808
809
810
811
812
813
814
815
816
817
818
819
820
821
822
823
824
825
826
827
828
829
830
831
832
833
834
835
836
837
838
839
840
841
842
843
844
845
846
847
848
849
850
851
852
853
854
855
856
857
858
859
860
861
862
863
864
865
866
867
868
869
870
871
872
873
874
875
876
877
878
879
880
881
882
883
884
885
886
887
888
889
890
891
892
893
894
895
896
897
898
899
900
901
902
903
904
905
906
907
908
909
910
911
912
913
914
915
916
917
918
919
920
921
922
923
924
925
926
927
928
929
930
931
932
933
934
935
936
937
938
939
940
941
942
943
944
945
946
947
948
949
950
951
952
953
954
955
956
957
958
959
960
961
962
963
964
965
966
967
968
969
970
971
972
973
974
975
976
977
978
979
980
981
982
983
984
985
986
987
988
989
990
991
992
993
994
995
996
997
998
999
1000
<!DOCTYPE html>
<html xmlns="http://www.w3.org/1999/xhtml" lang xml:lang>
<head>
<meta charset="utf-8" />
<meta name="generator" content="pandoc" />
<meta name="viewport" content="width=device-width, initial-scale=1.0, user-scalable=yes" />
<title>Untitled</title>
<style>
html {
color: #1a1a1a;
background-color: #fdfdfd;
}
body {
margin: 0 auto;
max-width: 36em;
padding-left: 50px;
padding-right: 50px;
padding-top: 50px;
padding-bottom: 50px;
hyphens: auto;
overflow-wrap: break-word;
text-rendering: optimizeLegibility;
font-kerning: normal;
}
@media (max-width: 600px) {
body {
font-size: 0.9em;
padding: 12px;
}
h1 {
font-size: 1.8em;
}
}
@media print {
html {
background-color: white;
}
body {
background-color: transparent;
color: black;
font-size: 12pt;
}
p, h2, h3 {
orphans: 3;
widows: 3;
}
h2, h3, h4 {
page-break-after: avoid;
}
}
p {
margin: 1em 0;
}
a {
color: #1a1a1a;
}
a:visited {
color: #1a1a1a;
}
img {
max-width: 100%;
}
svg {
height: auto;
max-width: 100%;
}
h1, h2, h3, h4, h5, h6 {
margin-top: 1.4em;
}
h5, h6 {
font-size: 1em;
font-style: italic;
}
h6 {
font-weight: normal;
}
ol, ul {
padding-left: 1.7em;
margin-top: 1em;
}
li > ol, li > ul {
margin-top: 0;
}
blockquote {
margin: 1em 0 1em 1.7em;
padding-left: 1em;
border-left: 2px solid #e6e6e6;
color: #606060;
}
code {
font-family: Menlo, Monaco, Consolas, 'Lucida Console', monospace;
font-size: 85%;
margin: 0;
hyphens: manual;
}
pre {
margin: 1em 0;
overflow: auto;
}
pre code {
padding: 0;
overflow: visible;
overflow-wrap: normal;
}
.sourceCode {
background-color: transparent;
overflow: visible;
}
hr {
background-color: #1a1a1a;
border: none;
height: 1px;
margin: 1em 0;
}
table {
margin: 1em 0;
border-collapse: collapse;
width: 100%;
overflow-x: auto;
display: block;
font-variant-numeric: lining-nums tabular-nums;
}
table caption {
margin-bottom: 0.75em;
}
tbody {
margin-top: 0.5em;
border-top: 1px solid #1a1a1a;
border-bottom: 1px solid #1a1a1a;
}
th {
border-top: 1px solid #1a1a1a;
padding: 0.25em 0.5em 0.25em 0.5em;
}
td {
padding: 0.125em 0.5em 0.25em 0.5em;
}
header {
margin-bottom: 4em;
text-align: center;
}
#TOC li {
list-style: none;
}
#TOC ul {
padding-left: 1.3em;
}
#TOC > ul {
padding-left: 0;
}
#TOC a:not(:hover) {
text-decoration: none;
}
code{white-space: pre-wrap;}
span.smallcaps{font-variant: small-caps;}
div.columns{display: flex; gap: min(4vw, 1.5em);}
div.column{flex: auto; overflow-x: auto;}
div.hanging-indent{margin-left: 1.5em; text-indent: -1.5em;}
ul.task-list[class]{list-style: none;}
ul.task-list li input[type="checkbox"] {
font-size: inherit;
width: 0.8em;
margin: 0 0.8em 0.2em -1.6em;
vertical-align: middle;
}
.display.math{display: block; text-align: center; margin: 0.5rem auto;}
</style>
</head>
<body>
<nav id="TOC" role="doc-toc">
<ul>
<li><a href="#inhalt" id="toc-inhalt">Inhalt</a></li>
<li><a href="#vorwort" id="toc-vorwort">Vorwort</a></li>
<li><a href="#einleitung" id="toc-einleitung">Einleitung</a>
<ul>
<li><a href="#die-replikationskrise-in-den-wissenschaften" id="toc-die-replikationskrise-in-den-wissenschaften">Die
Replikationskrise in den Wissenschaften</a></li>
<li><a href="#die-künstliche-intelligenz-lernt-sprechen" id="toc-die-künstliche-intelligenz-lernt-sprechen">2.2 Die Künstliche
Intelligenz lernt sprechen</a></li>
<li><a href="#methodik-oder-die-informationswissenschaft-kommt-zur-rettung" id="toc-methodik-oder-die-informationswissenschaft-kommt-zur-rettung">2.3
Methodik, oder: Die Informationswissenschaft kommt zur Rettung!</a></li>
<li><a href="#computergestützte-narrative-computational-narratives" id="toc-computergestützte-narrative-computational-narratives">2.4
Computergestützte Narrative [Computational Narratives]</a></li>
</ul></li>
<li><a href="#historische-hintergründe" id="toc-historische-hintergründe">Historische Hintergründe</a>
<ul>
<li><a href="#die-schriftgeschichte" id="toc-die-schriftgeschichte">3.1
Die Schriftgeschichte</a></li>
<li><a href="#die-buchgeschichte" id="toc-die-buchgeschichte">3.2 Die
Buchgeschichte</a></li>
<li><a href="#die-geschichte-des-web" id="toc-die-geschichte-des-web">3.3 Die Geschichte des Web</a></li>
<li><a href="#linked-open-data" id="toc-linked-open-data">3.4 Linked
Open Data</a></li>
</ul></li>
<li><a href="#open-science-in-der-praxis" id="toc-open-science-in-der-praxis">Open Science in der Praxis</a>
<ul>
<li><a href="#fair-prinzipien-digitale-objekte" id="toc-fair-prinzipien-digitale-objekte">FAIR-Prinzipien & Digitale
Objekte</a></li>
<li><a href="#daten-management-repositorien" id="toc-daten-management-repositorien">4.2 Daten-Management &
Repositorien</a></li>
</ul></li>
<li><a href="#ausführbare-bücher-als-strukturierte-wissenschaftskommunikation" id="toc-ausführbare-bücher-als-strukturierte-wissenschaftskommunikation">5.
Ausführbare Bücher als strukturierte Wissenschaftskommunikation</a>
<ul>
<li><a href="#digital-history" id="toc-digital-history">5.1 Digital
History</a></li>
<li><a href="#section" id="toc-section"></a></li>
<li><a href="#digital-humanities-im-zeitalter-computergestützter-narrative-und-digitaler-reproduktion" id="toc-digital-humanities-im-zeitalter-computergestützter-narrative-und-digitaler-reproduktion">5.2
Digital Humanities im Zeitalter computergestützter Narrative und
digitaler Reproduktion</a></li>
</ul></li>
<li><a href="#fazit-und-ausblick" id="toc-fazit-und-ausblick">6. Fazit
und Ausblick</a></li>
<li><a href="#literaturverzeichnis" id="toc-literaturverzeichnis">7.
Literaturverzeichnis</a></li>
</ul>
</nav>
<p>Universität Bern</p>
<p>Historische Fakultät</p>
<p>MAS ALIS in Archiv-, Bibliotheks-, und Informationswissenschaften</p>
<p><strong>Masterarbeit</strong></p>
<p>Betreuung: Prof. Dr. Tobias Hodel</p>
<p><strong>Open Science in der Praxis: Über den Sinn und die Entstehung
von computergestützten Narrativen innerhalb der
Wissenschaftskommunikation im frühen 21. Jahrhundert.</strong></p>
<p><strong>-</strong></p>
<p><strong>Hoffnungen, Chancen und Möglichkeiten.</strong></p>
<p>Jonas Hässig</p>
<p>12-450-185</p>
<p>[email protected]</p>
<p>Bern/Burgdorf, 30.07.2024</p>
<p><strong><br />
</strong></p>
<p><em><strong>Abstract</strong></em></p>
<p>Diese Abschlussarbeit leistet einen Beitrag zum Sinn und der
Entstehung von computergestützten Narrativen innerhalb der
Wissenschaftskommunikation im frühen 21. Jhdt. Dies geschieht in einem
Kontext von Open Access und Open Science Bestrebungen. Folgende
theorie-, und praxisbildenden Ebenen werden angesprochen: Ausgehend von
den beiden problematisierten Themenfeldern der Replikationskrise in den
Wissenschaften sowie schwer durchschaubaren Fortschritten im Bereich der
künstlichen Intelligenz, beleuchtet die Arbeit zunächst die historischen
Hintergründe, von der Schriftgeschichte über die Buchgeschichte bis zur
Entwicklung des World Wide Web und Linked Open Data. Ein Schwerpunkt
liegt auf der Analyse von Open Science Praktiken und deren Umsetzung,
insbesondere im Hinblick auf FAIR-Prinzipien, digitale Objekte und
Datenmanagement. Die Arbeit liefert einen fundierten Literaturbericht
und eine Dokumentation, wie ausführbare Bücher als Form strukturierter
Wissenschaftskommunikation den Weg in eine Daten-intensive Zukunft ebnen
könnten. Besondere Aufmerksamkeit wird den Implikationen für die Digital
Humanities und die Bibliotheks-, Archiv- und Informationswissenschaften
gewidmet.</p>
<p>Methodisch kombiniert die Arbeit einen umfassenden Literaturbericht
mit praktischen Beispielen, die in Form eines ausführbaren
Jupyter-Notebooks präsentiert werden. Dadurch demonstriert sie nicht nur
die theoretischen Konzepte, sondern setzt sie auch praktisch um. Als
lebendes, offenes & ausführbares Dokument, mit kurierter
Bibliografie, zugänglich über das BORIS Portal der Universität Bern und
GitHub. Auf diese Weise besteht eine grosse Auswahl and
Anschlussmöglichkeiten für Studierende, Forschende und Promovierende,
die sich in Teilaspekte der vorliegenden Informationen vertiefen
möchten.</p>
<p>“All the books of the world</p>
<p>will not bring you happiness,</p>
<p>but build a secret path</p>
<p>toward your heart.</p>
<p>what you need is in you:</p>
<p>the sun, the stars, the moon,</p>
<p>the illumination you were seeking</p>
<p>shines up from within you.</p>
<p>the quest for wisdom</p>
<p>made you comb the libraries.</p>
<p>now every page speaks the truth</p>
<p>that flashes forth from you.”</p>
<p>–Hermann Hesse, "Books"</p>
<blockquote>
<p><em>ORCID von Jonas Hässig</em>: <a href="https://orcid.org/0009-0004-2126-9129">https://orcid.org/0009-0004-2126-9129</a></p>
<p><em>GitHub</em>: <a href="https://github.com/jonason92">https://github.com/jonason92</a></p>
<p>Webpage zum visualisierten Jupyter-Notebook: <a href="https://jonason-mas.curve.space/">https://jonason-mas.curve.space/</a></p>
<p>Zotero Group-Bibliographie: <a href="https://www.zotero.org/groups/5580329/open_science_jh">https://www.zotero.org/groups/5580329/open_science_jh</a></p>
</blockquote>
<h1 class="TOC-Heading unnumbered" id="inhalt">Inhalt</h1>
<p><a href="#vorwort">1. Vorwort <span>3</span></a></p>
<p><a href="#einleitung">2. Einleitung <span>6</span></a></p>
<p><a href="#die-replikationskrise-in-den-wissenschaften">2.1 Die
Replikationskrise in den Wissenschaften <span>6</span></a></p>
<p><a href="#die-künstliche-intelligenz-lernt-sprechen">2.2 Die
Künstliche Intelligenz lernt sprechen <span>7</span></a></p>
<p><a href="#methodik-oder-die-informationswissenschaft-kommt-zur-rettung">2.3
Methodik, oder: Die Informationswissenschaft kommt zur Rettung!
<span>10</span></a></p>
<p><a href="#computergestützte-narrative-computational-narratives">2.4
Computergestützte Narrative [Computational Narratives]
<span>14</span></a></p>
<p><a href="#historische-hintergründe">3. Historische Hintergründe
<span>17</span></a></p>
<p><a href="#die-schriftgeschichte">3.1 Die Schriftgeschichte
<span>17</span></a></p>
<p><a href="#die-buchgeschichte">3.2 Die Buchgeschichte
<span>19</span></a></p>
<p><a href="#die-geschichte-des-web">3.3 Die Geschichte des Web
<span>22</span></a></p>
<p><a href="#linked-open-data">3.4 Linked Open Data
<span>24</span></a></p>
<p><a href="#open-science-in-der-praxis">4. Open Science in der Praxis
<span>25</span></a></p>
<p><a href="#fair-prinzipien-digitale-objekte">4.1 FAIR-Prinzipien &
Digitale Objekte <span>28</span></a></p>
<p><a href="#daten-management-repositorien">4.2 Daten-Management &
Repositorien <span>32</span></a></p>
<p><a href="#ausführbare-bücher-als-strukturierte-wissenschaftskommunikation">5.
Ausführbare Bücher als strukturierte Wissenschaftskommunikation
<span>35</span></a></p>
<p><a href="#digital-history">5.1 Digital History
<span>38</span></a></p>
<p><a href="#digital-humanities-im-zeitalter-computergestützter-narrative-und-digitaler-reproduktion">5.2
Digital Humanities im Zeitalter computergestützter Narrative und
digitaler Reproduktion <span>39</span></a></p>
<p><a href="#fazit-und-ausblick">6. Fazit und Ausblick
<span>41</span></a></p>
<p><a href="#literaturverzeichnis">7. Literaturverzeichnis
<span>43</span></a></p>
<p><strong><br />
</strong></p>
<h1 id="vorwort">Vorwort</h1>
<p>Die vorliegende Abschlussarbeit geht zurück auf den Studiengang MAS
ALIS 2022-2024 in Archiv-, Bibliotheks-, und Informationswissenschaften
an der Universität Bern. Während diesen Studien habe ich mir als
Wissenshistoriker, Wissenschaftsphilosoph und angehender Bibliothekar
und Informationswissenschaftler vertieft Gedanken über gegenwärtige
Entwicklungen innerhalb des Gebietes der modernen
Wissenschaftskommunikation machen und diese in einen grösseren
wissenshistorischen Kontext stellen können. Auf der einen Seite erlebten
wir über die vergangenen Jahre, wie grosse Sprachmodelle auf dem Gebiet
der künstlichen Intelligenz regelrecht sprechen lernten und nun auch in
der wissenschaftlichen Arbeit im Hinblick auf Literaturrecherchen,
Zusammenfassungen und Mind-Mapping-Prozesse sowie als Codier-Assistenten
den Weg in den Alltag gefunden haben. Gleichzeitig stammen diese Modelle
meist aus der Privatwirtschaft und erheben keinen Anspruch auf
Wissenschaftlichkeit. Ausserdem stellen sie teilweise sog. Black-Boxes
dar, da von den Anbietern nicht durchgehend erklärt werden kann, wie
einzelne Ausgabeinformationen in deren Benutzung zustande kommen. Wir
wissen, dass die Durchbrüche auf diesem Gebiet auf Datenanalysen
zurückgehen, die wiederum auf linguistischen Narrativ-Analysen basieren,
wie in Kapitel 2.4 aufgezeigt wird. Auf der anderen Seite hören wir seit
2005 von einer Replikationskrise, die vielen Wissenschaftlern einiges zu
denken gibt. Auch hier steht der Umgang mit Forschungsdaten im Zentrum
des Diskurses. Die Nicht-Reproduzierbarkeit der präsentierten
Forschungsergebnisse von teilweise mehr als der Hälfte der Studien in
einzelnen medizinischen und humanwissenschaftlichen Fachgebieten wird in
Kapitel 2.1 näher thematisiert.</p>
<p>Ein noch junges Gebiet, das sich annimmt, gleich beiden dieser hier
aufgeführten Problematiken entgegenwirken zu können, sind ‘Ausführbare
Bücher’ - als neue, reproduzierbare und auf den Fachbegriff von
‘Computergestützten Narrativen’ zurückgehende, digitale Medien und/oder
Formen der Wissenschaftskommunikation, um deren Sinn und die Entstehung
es in der vorliegenden Thesis geht. Sie versprechen nicht nur die beiden
hier angesprochenen Problemfelder zu lösen, sondern auch mehr Ordnung,
Kollaboration, Transparenz und Handlungsfreiheit in die Welt
reproduzierbarer Wissenschaft zu bringen, was sie auch für die ‘Open
Science’ Bestrebungen in dem global agierenden Forschungs- und
Universitäten-Netzwerk macht. Während meinem Studium hatte ich die
Möglichkeit, ein 20-tägiges Praktikum im Bibliotheksbereich ‘Open
Science’ der Universität Bern zu absolvieren und mich den aktuellen
Entwicklungen innerhalb dieses Gebietes, wie etwa dem Bereich
‘Data-Stewardship’, vertieft anzunehmen. Hier vorliegend findet sich
eine Dokumentation mit ausführlichen Bibliografien, die Studenten,
Forschenden und Promovierenden den Weg in ein nachhaltiges Paradigma der
modernen, reproduzierbaren & datengestützten
Wissenschaftskommunikation ebnen soll, die auf OPEN und FAIR-Prinzipien
basiert und sich auf einen Datenmanagement-Plan stützt. Ich versuche
dabei die Thematik durch die gleichzeitige Beleuchtung von kritischen
Stimmen möglichst wertneutral und dadurch gewissermassen ohne
abschliessende Feststellungen auf diese oder jene Seite zu halten.
Vielmehr präsentiere ich eine fundierte zeitliche Momentaufnahme mit
einer grossen Anzahl an referenzierten Vertiefungsmöglichkeiten auf der
Seite des Lesers, der selbst der Stimme der akademischen Berufung
folgt.</p>
<blockquote>
<p>«<em>The earliest papers [wissenschaftliche Artikel] were in some
ways more readable than papers are today. They were less specialized,
more direct, shorter, and far less formal. Calculus had only just been
invented. Entire data sets could fit in a table on a single page. What
little “computation” contributed to the results was done by hand and
could be verified in the same way.</em>»<a href="#fn1" class="footnote-ref" id="fnref1" role="doc-noteref"><sup>1</sup></a></p>
</blockquote>
<p>Im selben <em>Atlantic</em> Artikel von 2018 wird der moderne
wissenschaftliche Artikel für obsolet erklärt und das graphische
Benutzer-Interface (GUI) als für wissenschaftlich-technische
Kommunikationen als Nachkommenschaft vorgeschlagen. Zusammenfassend aus
dem Aufsatz <em>Jupyter, Mathematica, and the Future of the Research
Paper</em>:</p>
<blockquote>
<p>«0. A graphical user interface (GUI) can facilitate better technical
writing.</p>
<p>1. Wolfram’s proprietary notebook showcased innovative technology,
but decades after its introduction, still has few users.</p>
<p>2. Jupyter is a new open-source alternative that is well on the way
to becoming a standard for exchanging research results.</p>
<p><em>Each is spot on. I had to learn the hard way why so many kept
their distance from Mathematica. Now, I’m much more productive with
Jupyter. I’m experimenting with, and excited about, its potential as a
way to write up research results</em>. »<a href="#fn2" class="footnote-ref" id="fnref2" role="doc-noteref"><sup>2</sup></a></p>
</blockquote>
<p>Während der Autor Wolframs <em>Mathematica</em> Interface für
wissenschaftliche Kommunikation rechtmässig als Eigentümer-Modell
einordnet, erkennt er den von manchen verloren geglaubten Geist der
Mitgliedschaft am wissenschaftlichen Projekt in der Open Source
Community wieder, zu der das Jupyter-Projekt zu zählen ist. Mittlerweile
bestehen geschätzt mehr als 2.5 Millionen in der
Jupyter-Programmierumgebung verfasste Forschungsartikel. Damit ist in
den Bibliotheks-, Archiv-, und Informationswissenschaften die Zeit
gekommen, sich aktiv an dem hier vorliegenden Diskurs zu beteiligen.</p>
<p>Die vorliegende Arbeit in Form eines klassischen PDF-Ausdrucks sowie
einem ausführbaren Jupyter-Notebook mit GitHub Repositorium und eigenem
Online-Webauftritt, findet sich ebenfalls online im ‘Berner Open
Repository and Information System’ BORIS Portal. Die der Betreuung und
der Studienleitung vorgelegte, als Word-Dokument verfasste
Papierversion, findet ihre Endgültigkeit mit dem Ausdruck des
.doc-Files. Die BORIS-Version liefert einen digitalen Objekt-Identifier
[DOI], mit dem die digitale Version des schriftlichen Artikels versehen
wird. Die Jupyter-Notebook Version präsentiert die vorliegende
Abschlussarbeit als offen zugänglichen Code und eigenem
Datenrepositorium, der wissenschaftlichen Welt frei zugänglich und damit
ein weiterlaufendes Projekt darstellend, für alle, die daran teilhaben
möchten.</p>
<p>Die Arbeit liefert einen fundierten historischen Bericht über die
Entstehung der Schrift, über die Buchgeschichte, hin zu den Anfängen des
Internets, bis zu sprechenden Maschinen und bedient sich gleichzeitig
der informationswissenschaftlichen Methode des Literaturberichts, der
eine begleitende dokumentarische Anleitung auf dem Weg zu dieser, auf
nachhaltiger Datenwissenschaft beruhenden Art der
Wissenschaftskommunikation darstellt. Somit ist die Grundlage für eine
kontinuierliche Weiterarbeit an den vorliegenden Themenfeldern gegeben.
Ich hoffe, dem interessierten Leser durch die visuelle Präsentation des
ausführbaren Jupyter-Buches der hier vorliegenden Zahlen,
Schriftzeichen, Links und Literaturverweise Hoffnungen, Chancen und
Möglichkeiten dieser Art der Wissenschaftskommunikation vor Geist und
Auge führen zu können.</p>
<h1 id="einleitung">Einleitung</h1>
<p>In diesem Kapitel werden einleitend kurz die beiden Problemstellungen
erläutert, die am Anfang der vorliegenden Arbeit stehen. Im weiteren
Verlauf des Textes wird klar, wie diese mit computergestützten
Narrativen [Computational Narratives] in Verbindung stehen. Ausserdem
wird einleitend kurz auf die informationswissenschaftliche Methode des
Literaturberichts Bezug genommen, welche hier zusätzlich erweitert wird
anhand der Möglichkeit, die vorliegenden Daten in Form eines
ausführbaren Buches [Executable Book] in einer Computerumgebung zu
öffnen, zu reproduzieren, zu erweitern und/oder zu vertiefen. So dient
die vorliegende Arbeit als fundierter Ausgangspunkt für weitreichende
vertiefende Recherchen auf dem Gebiet. Dabei werden auch die in der Open
Science Praxis üblichen Vorteile der angewendeten FAIR- und
Openness-Definitionen sichtbar.</p>
<h2 id="die-replikationskrise-in-den-wissenschaften">Die
Replikationskrise in den Wissenschaften</h2>
<p>Unter dem Stichwort der Reproduzierbarkeitskrise, oder
Reproduktionskrise, ist seit 2005 ein Diskurs im Gange, der auf eine
weitreichende Problematik innerhalb der Wissenschaften schliessen lässt.
Ausgehend von Publikationen wie derjenigen von John P.A. Ioannidis
<em>Why Most Published Research Findings Are False</em> <a href="#fn3" class="footnote-ref" id="fnref3" role="doc-noteref"><sup>3</sup></a><em>,</em> gelang der Diskurs ab 2015
dann auch in populäre wissenschaftliche Zeitschriften wie
<em>Nature</em> und ist seit jeher zu einem Begriff und einem Besorgnis
in der wissenschaftlichen Forschungscommunity geworden.<a href="#fn4" class="footnote-ref" id="fnref4" role="doc-noteref"><sup>4</sup></a>
Dieses methodologische Problem, das sich durch verschiedene
wissenschaftliche Disziplinen offenbart, insb. den Sozial- und
Lebenswissenschaften, geht u.a. auf die mangelnde Transparenz in der
Berichterstattung von Methoden und Daten, einem Publikationsbias mit der
Tendenz, vorwiegend positive oder statistisch signifikante Ergebnisse zu
veröffentlichen sowie mangelnde Stichprobengrössen und fehlende Anreize
für Replikationsstudien zurück.<a href="#fn5" class="footnote-ref" id="fnref5" role="doc-noteref"><sup>5</sup></a> Dabei handelt es sich
nicht etwa um eine kleine Anzahl von Studien, die nicht wissenschaftlich
reproduziert werden können, sondern in gewissen Fällen ist gar von mehr
als 50% nicht-reproduzierbarer Forschung die Rede.<a href="#fn6" class="footnote-ref" id="fnref6" role="doc-noteref"><sup>6</sup></a>
Währen im U.S. Diskurs Lösungen zur Bekämpfung dieser Probleme gefordert
werden, z.B. durch transparenteres Records- und Qualitätsmanagement von
den Labordaten<a href="#fn7" class="footnote-ref" id="fnref7" role="doc-noteref"><sup>7</sup></a>, bestehen in den
Bibliothekswissenschaften bereits Lösungsvorschläge und Richtlinien, die
die Reproduzierbarkeit der Forschung durch Open Science Praktiken,
Forschungsdatenmanagement, Daten/Code/Methoden-Transparenz und
Belohnungen für offene Forschungspraxis beinhalten.<a href="#fn8" class="footnote-ref" id="fnref8" role="doc-noteref"><sup>8</sup></a></p>
<h2 class="unnumbered" id="die-künstliche-intelligenz-lernt-sprechen">2.2 Die Künstliche
Intelligenz lernt sprechen</h2>
<p>Seit ein paar Jahren hören wir von Durchbrüchen und einem rasanten
Fortschritt auf dem Gebiet der KI-Forschung, insbesondere der grossen
Sprachmodelle [LLM’s], die sich in der Praxis mittlerweile auch als
schriftstellerische und recherchierende Assistenten für
wissenschaftliche Arbeiten nutzen lassen. Dessen vergewissern kann man
sich relativ schnell durch einen kurzen Test von Modellen wie
Anthropic’s Claude Sonnet 3.5, das hochgeladene PDF-Inhalte von
wissenschaftlichen Artikeln innert kürze zu verstehen scheint und davon
Zusammenfassungen liefern kann, Literaturangaben extrahiert und
Vorschläge zu weiterer vorhandener Forschung auf den jeweiligen Gebieten
gibt. Bei Bedarf liefert das Modell auch gleich die Übersetzung der
Inhalte in verschiedenste Sprachen. Des Weiteren bestehen auf grossen
Sprachmodellen aufbauende Recherche-Assistenten wie Elicit, die zu
beliebigen wissenschaftlichen Gebieten über vorhandene Literatur und
Forschung befragt werden können und aktuelle Quellenvorschläge liefern.
Diese Ereignisse auf dem Gebiet der Künstlichen Intelligenz, zu den auf
maschinellem Lernen [Machine Learning] basierenden grossen
Sprachmodellen [Large-Language-Models] zählen, scheinen sich
sprichwörtlich zu überschlagen und es kann kaum eine Rede sein von einem
sachlichen Überblick durch wissenschaftliche Studien. Das geht zu einem
Teil auch auf die privatwirtschaftlichen Akteure und IT-Firmen zurück,
die sich nicht der Methode der offenen wissenschaftlichen Forschung und
fundierter sachlicher Wissenschaftskommunikation verschrieben sehen. Im
Gegenteil wird von Seiten der grossen IT-Firmen den politischen Akteuren
die fachkundige technologische Kenntnis in dieser Hinsicht abgesprochen
und gleichzeitig wird, nehmen wir das Beispiel USA, aus denselben
Kreisen bereits massiv Lobbyismus in Washington betrieben. Der
alltägliche Endnutzer ist diesen Entwicklungen gewissermassen
ausgesetzt, solange das technologische Know-How und die Einsicht in den
Code nicht nach Open Source Standards offengelegt werden. Diese
Feststellungen können insb. in Kapitel 5 des Stanford University ‘<em>AI
Index Report 2024’</em> vertieft werden.<a href="#fn9" class="footnote-ref" id="fnref9" role="doc-noteref"><sup>9</sup></a></p>
<p>Gleichzeitig können diese Durchbrüche auf diesem Gebiet auch positiv
gewertet werden und wie bei den meisten Entwicklungen im Softwarebereich
findet sich neben der eher skrupellosen kapitalistischen Vermarktung
einzelner Anwendungen auch fundierte und offene wissenschaftliche
Forschung, die hinterfragt und nichts für bare Münze nimmt. Um hier zwei
Beispiele aus den Archivwissenschaften anzuführen, die uns einen
aktuellen Einstieg in diese Forschungen geben, lassen sich insbesondere
die immerwährenden Apelle an die Ethik hervorheben, die im Hinblick auf
solch mächtige Instrumente stets präsent sein sollte. Gerade in der
Anwendung von KI-Algorithmen in Archiven beispielsweise, werden dadurch
neue Daten erzeugt und das Berufsbild vom passiven, datenvermittelnden
Archivar wird zum aktiven Akteur innerhalb eines ‘Record Continuums’:
«Finally, we described the role of AI technologies to open up new types
of archives such as social media collections or diaries, which extend
our current institution-focused ideas of archives. Because of their
scale, these pose distinct challenges in terms of organisation and
access to these collections that can only be solved with further AI
technology development, which sets access to these collections apart
from commercial Application Programming Interfaces (APIs). Only this way
can the core archival mission of building trust in the past record be
sustained.»<a href="#fn10" class="footnote-ref" id="fnref10" role="doc-noteref"><sup>10</sup></a></p>
<p>Dadurch, dass es sich in den in diesem Kapitel besprochenen
KI-Werkzeugen um <em>lernende</em> Algorithmen handelt, deren Qualität
und Fortschritt v.a. in der Qualität und der Anzahl von vorhandenen
Daten abhängt, ergeben sich diesen Technologien Möglichkeiten der
Abnahme von komplexen Aufgaben, die bisher nur von Menschen ausgeführt
werden konnten. So etwa im Archivbereich: «These [die Arbeiten] vary
from providing intelligent support for searching the archives to
automate tedious and time-consuming tasks. In this article, we focus on
sensitivity review as a practical solution to unlock digital archives
that would allow archival institutions to make non-sensitive information
available. This promise to make archives more accessible does not come
free of warnings for potential pitfalls and risks: inherent errors,
"black box" approaches that make the algorithm inscrutable, and risks
related to bias, fake, or partial information. Our central argument is
that AI can deliver its promise to make digital archival collections
more accessible, but it also creates new challenges - particularly in
terms of ethics. In the conclusion, we insist on the importance of
fairness, accountability and transparency in the process of making
digital archives more accessible.»<a href="#fn11" class="footnote-ref" id="fnref11" role="doc-noteref"><sup>11</sup></a> Ähnliche
Feststellungen sind anhand dieses Abschnittes also gemacht, wie wir sie
hier bereits im Vorwort erwähnt haben. Egal ob naturwissenschaftliche
Forschung oder archivarisches und/oder bibliothekarisches
Datenmanagement, der Fokus findet sich mehr und mehr darin, <em>wie</em>
mit Information umgegangen werden soll, ohne dabei unethisch,
unwissenschaftlich und rechtsverletzend zu werden. Die offene
Wissenschaft, wie sie unter dem Begriff Open Science weltweit in die
Wissenschaftspraxis gefunden hat, scheint zumindest einen ersten Ansatz
zu liefern und den Diskurs zu vorhandenen Konzepten zu lenken, die
Lösungsansätze und Antworten zu den thematisierten Problembereichen
darstellen können.</p>
<p>Diese Punkte im Bewusstsein haltend, kommen wir nun zu dem Zweig der
Informationswissenschaften und deren methodologischen Grundlagen, um uns
den Möglichkeiten, dem Tätigkeitsbereich sowie der Vielfalt der darin
thematisierten Aufgaben und Arbeitsfelder gewahr zu werden. Es sind die
Informationswissenschaften, die zumindest theoretisch die nötige
fachliche Interdisziplinarität verkörpern, die gebraucht wird, um sich
in einer gemeinsamen Sprache den Fragen zu nähern, wie sie bisher auf
der Abstraktionsebene des vorliegenden Aufsatzes, Textes oder auch der
vorliegenden ausführbaren Datensammlung aufgestellt wurden.</p>
<h2 class="unnumbered" id="methodik-oder-die-informationswissenschaft-kommt-zur-rettung">2.3
Methodik, oder: Die Informationswissenschaft kommt zur Rettung!</h2>
<p>Innerhalb des Gebietes der Informationsdienstleistungen bildet der
Literaturbericht einen Mehrwertdienst, «der die Literatur zu einem
Thema, meistens freilich eine Auswahl davon, zusammenstellt und wie eine
Sammelrezension referiert, kommentiert und wertet.»<a href="#fn12" class="footnote-ref" id="fnref12" role="doc-noteref"><sup>12</sup></a>
Während diese Art der Informationsvermittlung, läuft sie über den
klassischen Weg von ausgedruckten Literaturbericht-Artikeln, für den
Leser einige Arbeit mit sich bringt, um die im Literaturbericht
präsentierte Literatur ausfindig zu machen und zu konsultieren,
gestaltet sich die moderne, computergestützte Version davon, wie sie
sich hier zumindest in der computergestützten, ausführbaren
Jupyter-Version präsentiert, wesentlich einfacher. Der Literaturbericht
mit einem Datenrepositorium innerhalb der Jupyter-Notebook Umgebung
lässt eine durchgehende Verlinkung sämtlicher Informationsquellen zu.
Sind diese zusätzlich via Open Access verfügbar und mit einem digitalen
Objekt Identifikator [DOI] ausgestattet, lassen sich die rezensierten
Artikel mit einem einzelnen Klick abrufen. In einer idealen Welt wären
so durch die Open Science Standards, die in Kapitel 4 näher besprochen
werden, sämtliche aufeinander Bezug nehmenden wissenschaftlichen
Artikel, Monographien und Beiträge miteinander direkt verlinkt, was
einen wesentlichen Fortschritt in der Transparenz der Forschung
darstellen würde. Ausserdem wäre dadurch Bibliotheken und Archiven viel
Zeit-lastige Arbeit abgenommen.<a href="#fn13" class="footnote-ref" id="fnref13" role="doc-noteref"><sup>13</sup></a></p>
<p>An diesem Punkt gilt es sich als einen der Diversität verschriebenen
Bibliotheks-Menschen jedoch auch zu erinnern, dass selbst im Streben
nach mehr Offenheit in der Informationsvermittlung versteckte Bias
lauern könnten: «Bibliothekarische Arbeit wird oft als wertneutral
angesehen, da sie im Gegensatz etwa zu Wissenschaft und Kunst nicht
selbst Inhalte produziert, sondern diese „nur“ erschliesst und
zugänglich macht. Dabei spielen jedoch Entscheidungen über Einschluss
beziehungsweise Ausschluss‒ und damit stets auch eine implizite Wertung
der Inhalte ‒ eine zentrale Rolle, besonders in Zeiten knapper
Erwerbungsbudgets oder bei der selektiven Aufnahme von Open
Access-Titeln in den Bibliothekskatalog.»<a href="#fn14" class="footnote-ref" id="fnref14" role="doc-noteref"><sup>14</sup></a>
Die zusammengetragenen Informationsquellen in der vorliegenden Arbeit
wurden somit nicht nur aufgrund ihrer bereits vorhandenen Open Science
Eigenschaften gewählt, sondern im Zentrum stand der Blick, ganz
allgemein die wichtigsten Werke zu den jeweiligen Teilthemen, vereint in
dem grösseren Kontext der Thesis abzudecken. Während sich der
vorliegende ausführbare Text in einigen Start- und Mittelkapitel der
Methode des historisch-kritischen Fliesstextes mit klassischen
Literaturreferenzen bedient, kann ab insgesamt aus dem Sinn der Sache
von der Methodik eines auf einem computergestützten Narrativ basierenden
Literaturberichts gesprochen werden.</p>
<p>Um hier bereits hier ein Gefühl für die beschriebene
Literaturbericht-Methodik zu erhalten, möchte ich dieses Kapitel anhand
der besprochenen Methodik abschliessen.<a href="#fn15" class="footnote-ref" id="fnref15" role="doc-noteref"><sup>15</sup></a>
Es sind die Informationswissenschaften, die gleichzeitig im Hintergrund
dieser Arbeit stehen und Lösungen für die einleitend besprochenen
Probleme innerhalb der heutigen Wissenschaftskommunikation sowie den
unüberschaubaren Entwicklungen auf dem Bereich der Künstlichen
Intelligenz bieten können, die wiederum auf die Datenwissenschaften
zurückgehen. Die Grenzen vom wissenschaftlichen Bibliothekar zum
digitalen Archivar zum Informationswissenschaftler und weiter zum
Datenwissenschaftler sind bereits fliessend und werden das
wahrscheinlich immer wie mehr. Nach und nach, mit immer grösserer
Digitalisierung, wird die Relevanz der Computerwissenschaften für alle
diese Tätigkeitsbereiche immer stärker sichtbar:</p>
<blockquote>
<p>«Making use of data is not anymore a niche project but central to
almost every project. With access to massive compute resources and vast
amounts of data, it seems at least in principle possible to solve any
problem. However, successful data science projects result from the
intelligent application of: human intuition in combination with
computational power; sound background knowledge with computer-aided
modelling; and critical reflection of the obtained insights and
results.»<a href="#fn16" class="footnote-ref" id="fnref16" role="doc-noteref"><sup>16</sup></a></p>
</blockquote>
<p>Während bereits ein riesiger Literaturkorpus zu den technischen
Details in den Datenwissenschaften besteht, findet sich nur wenig
Literatur, die darauf eingeht, was diese gesellschaftlichen Wandlungen
für Bibliotheken und Informationsspezialisten bedeuten.</p>
<blockquote>
<p>Herndon, Joel, Hrsg. Data Science in the Library: Tools and
Strategies for Supporting Data-Driven Research and Instruction. London,
England: Facet Publishing, 2022.</p>
</blockquote>
<p>Ein wichtiger Artikel für grosse Digitalisierungsprojekte und die
damit einhergehende Publikation von Kollektionen als Daten-Services für
Gallerien, Bibliotheken, Archive und Museen [GLAM], findet sich unter
folgendem DOI-Link:</p>
<blockquote>
<p>Candela, Gustavo, Nele Gabriëls, Sally Chambers, Thuy-An Pham, Sarah
Ames, Neil Fitzgerald, Katrine Hofmann, u. a. „A Checklist to Publish
Collections as Data in GLAM Institutions“. arXiv, 5. April 2023.
<https://doi.org/10.48550/arXiv.2304.02603>, Stand:
16.07.2024.</p>
</blockquote>
<p>Ein Werk aus dem Jahr 2020, das aufkommende Trends und Technologien
in den Bibliotheks- und Informationswissenschaften abdeckt und dabei die
Themenfelder ‘Künstliche Intelligenz’, Big Data, Distanz-Bildung,
Wissensmanagement und auch Soziale Netzwerke abdeckt, ist als
434-seitiges Hardcover-Handbuch oder als E-Book erhältlich, wobei nur
einzelne Kapitel unter einer Open Access Lizenz direkt abrufbar
sind:</p>
<blockquote>
<p>Kaushik, Anna, Ashok Kumar, und Payel Biswas. Handbook of Research on
Emerging Trends and Technologies in Library and Information Science.
Advances in Library and Information Science (ALIS) Book Series. Hershey,
PA: IGI Global, 2019. DOI: 10.4018/978-1-5225-9825-1, Stand:
16.07.2024.</p>
</blockquote>
<p>Während das <em>Handbuch Methoden der Bibliotheks- und
Informationswissenschaft: Bibliotheks-, Benutzerforschung,
Informationsanalyse. Handbuch Methoden der Bibliotheks- und
Informationswissenschaft,</em> erschienen im De Gruyter Verlag, zu
Beginn dieses Kapitels bereits zitiert wurde, existiert vom selben
Verlagshaus das Open Access Grundlagenwerk zu den
Informationswissenschaften. Über mehr als 950 Seiten werden dort
Theorien, Methoden, Ausbildungen und die Institutionalisierung der
Informationswissenschaft abgehandelt. Durch einen Blick in das
Inhaltsverzeichnis wird klar, welcher Mannigfaltigkeit an
Themenkomplexen sich die VertreterInnen dieses Gebiets angenommen haben.
Nicht nur die Wissensorganisation in Bibliotheken, Archiven, Museen und
Informationszentren, zu denen die intellektuelle Indexierung, die
Klassifikation, formale Erschliessungen, Abstracting,
Metadaten-Generierung und die Erstellung von Ontologien für Linked Open
Data gehören, sondern auch automatische Sprachverarbeitung,
Informationsvisualisierungen, maschinelle Übersetzungen, Verfahren
wissenschaftlicher Qualitätssicherung, Forschungsdatenmanagement,
Information Retrieval, Sprachmodelle und computervermittelte
Kommunikation sind Teil dieser Wissenschaft, die erst noch definieren
muss, wie jung sie ist oder ob es sie schon immer gab.</p>
<blockquote>
<p>Kuhlen, Rainer, Dirk Lewandowski, Wolfgang Semar, und Christa
Womser-Hacker, Hrsg. Grundlagen der Informationswissenschaft, 2022.
Online: <https://doi.org/10.1515/9783110769043>, Stand:
16.07.2024.</p>
</blockquote>
<p>Die 6100-seitige, amerikanische Version davon wird als sieben Bände
umfassende Enzyklopädie herausgegeben, in der auch die Verbindung der
Linguistik mit der modernen Informationswissenschaft thematisiert wird,
wie sie hier in der vorliegenden Thesis auch speziell herausgehoben ist,
durch eine zusammenfassende historische Abdeckung der Schrift-, Buch-
und Webgeschichte, die im Denken des Autors untrennbar miteinander
verbunden sind.</p>
<blockquote>
<p>McDonald, John D.; Levine-Clark, Michael (Hg.): Encyclopedia of
Library and Information Sciences, Boca Raton 2019. Online:
<https://doi.org/10.1081/E-ELIS4>, Stand: 16.07.2024.</p>
</blockquote>
<p>Um hier nicht weiter durch forschungssichernde Rezensionsverweise
noch das Thema der Zukunft der Informationswissenschaft abzudecken, zu
dem denn auf englischer<a href="#fn17" class="footnote-ref" id="fnref17" role="doc-noteref"><sup>17</sup></a> sowie als auch auf deutscher<a href="#fn18" class="footnote-ref" id="fnref18" role="doc-noteref"><sup>18</sup></a> Seite tatsächlich einige Literatur
vorhanden ist, kommen wir, dieses einleitende Kapitel abschliessend, zum
Fachbegriff des computergestützten Narrativs, das als zentraler Begriff
zum vorliegenden Unterfangen den Weg in den Titel gefunden hat. Es
verbindet interdisziplinär die Sprachwissenschaft mit der
Datenwissenschaft und ist damit Dreh- und Angelpunkt vieler
informationswissenschaftlicher Fragestellungen und Aufgabenbereiche.</p>
<h2 class="unnumbered" id="computergestützte-narrative-computational-narratives">2.4
Computergestützte Narrative [Computational Narratives]</h2>
<p>Ohne hier vertieft in die KI-Forschung springen zu wollen, ist es an
diesem Punkt für unsere Zwecke nötig, kurz auf den Begriff der
computergestützten Narrativen und wie er hier verstanden wird,
einzugehen. Ich stiess das erste Mal bewusst auf diesen Begriff durch
die Lektüre des Textes <em>Project Jupyter: Computational Narratives as
the Engine of Collaborative Data Science,</em> der im April 2015 als
Fördermittel-Antrag formuliert wurde. Computer seien gut im Konsumieren,
in der Produktion und im Prozessieren von Daten. Menschen hingegen,
prozessieren die Welt durch Narrative. Vgl. dazu beispielsweise:</p>
<blockquote>
<p>Piper, Andrew, Richard Jean So, und David Bamman. „Narrative Theory
for Computational Narrative Understanding“. In <em>Proceedings of the
2021 Conference on Empirical Methods in Natural Language
Processing</em>, herausgegeben von Marie-Francine Moens, Xuanjing Huang,
Lucia Specia, und Scott Wen-tau Yih, 298–311. Online and Punta Cana,
Dominican Republic: Association for Computational Linguistics, 2021.
<https://doi.org/10.18653/v1/2021.emnlp-main.26>.</p>
</blockquote>
<p>Und:</p>
<blockquote>
<p>Riedl, Mark O. „Computational Narrative Intelligence: A
Human-Centered Goal for Artificial Intelligence“. arXiv, 20. Februar
2016. <https://doi.org/10.48550/arXiv.1602.06484>.</p>
</blockquote>
<p>Damit die Daten und deren computergestützte Prozessierung und
Visualisierung für Menschen brauchbar werden, müssen diese in ein
Narrativ eingebettet werden, in ein computergestütztes Narrativ – das
eine Geschichte erzählt, für ein bestimmtes Publikum und einen
bestimmten Kontext. Diese fundamentalen Aspekte probieren
computergestützte Narrative zu adressieren. Erstens sollte ein einziges
computergestütztes Narrativ eine grosse Anzahl von Kontexten und
Audienzen abdecken können. Zum Beispiel macht ein biomedizinischer
Forscher zuerst eine statistische Analyse und Datenvisualisierungen für
eine höchst technische Studie, die in einem akademischen Journal
veröffentlicht werden soll. Mit der Zeit hält jedoch das selbe
Individuum Vorträge für andere Forscher oder auch nicht-gebietskundige
Audienzen. Dann könnte es auch wichtig werden, nicht-codierenden
Laborforschenden die selben statistischen Datenanalysen und
Datenvisualisierungen zugänglich machen zu können, in einem
vereinfachten graphischen Interface. Die Kernaspekte des
computergestützten Narrativs bleiben über alle diese verschiedenen
Anwendungen die gleichen. Zweitens müssen diese computergestützten
Narrative reproduzierbar sein. Andere Leute und der Autor mit
inbegriffen, müssen auch sechs Monate nach dem Erscheinen der Arbeit
nachvollziehen können, was mit dem Code, den Daten und dem Narrativ
gemacht wurde, um die Forschungen nachhaltig reproduzieren und darauf
aufbauen zu können. Die Reproduzierbarkeit stellt schon lange die
Fundation der wissenschaftlichen Methode dar, wobei die
Datenwissenschaft in dieser Hinsicht neue Herausforderungen mit sich
bringt und auch fragen lässt, wie diese in anderen Gebieten wie der
Festsetzung von politischen Richtlinien oder Wissenschaftsjournalismus
erfüllt werden können. Drittens können computergestützte Narrative
kollaborativ erstellt werden. Mehrere Individuen können am gleichen
Code, den gleichen Daten und den gleichen Narrativen arbeiten. Die
Kollaborationsfähigkeit ist fast in allen Kontexten gegeben im Hinblick
auf computergestützte Narrative, sei das zwischen zwei Postdocs und
einem Professor in der gleichen Forschungsgruppe, zwischen
Schriftsteller, Editoren und graphischen Designern von News-Seiten,
zwischen Datenwissenschaftlern und Unternehmensstrategen in grossen
Internet-Firmen, oder zwischen einem Lehrer und seinen Schülern in einem
Universitätszimmer. All dies möchte das Jupyter-Projekt, das zuerst
IPython hiess, mit den Open Source Software Werkzeugen für interaktives
und forschendes, computergestütztes Erzählen erreichen. Diese
Software-Entwicklungen in der Umgebung vom Jupyter-Projekt, in denen
sich eine grosse Anzahl von Programmiersprachen wie Python, Julia, R
etc. anwenden lassen, befindet sich in stetiger Entwicklung und es
erscheinen regelmässig Updates für die bereits vorhandenen
Nutzer-Umgebungen.<a href="#fn19" class="footnote-ref" id="fnref19" role="doc-noteref"><sup>19</sup></a></p>
<p>Im selben, hier auf Deutsch übersetzten Text wird eine weitere
gängige Definition des Begriffs des computergestützten Narrativs
geliefert:</p>
<blockquote>
<p>«The problem the Jupyter project tackles is precisely this
intersection: creating tools to support in the best possible ways the
computational workflow of scientific inquiry, and providing the
environment to create the proper narrative around that central act of
computation. We refer to this as Literate Computing, in contrast to
Knuth’s concept of Literate Programming, where the emphasis is on
narrating algorithms and programs. In a Literate Computing environment,
the author weaves human language with live code and the results of the
code, and it is the combination of all that produces a computational
narrative.»<a href="#fn20" class="footnote-ref" id="fnref20" role="doc-noteref"><sup>20</sup></a></p>
</blockquote>
<p>Die Hauptanwendung, das Jupyter-Notebook, ist eine Web-basierte,
interaktive Computer-Plattform, die es den Nutzern erlaubt,
computergestützte Narrative zu verfassen, die Live-Code, Formeln,
narrativer Text, interaktive, graphische Interfaces und andere digitale
Medien miteinander zu kombinieren. Diese Dokumente liefern die
kompletten Aufzeichnungen der gemachten computergestützten Arbeiten und
lassen sie unmittelbar in verschiedenste Formate wie HTML, PDF, Word,
LaTeX etc. konvertieren. Das kann auch heissen, dass die
Jupyter-Notebooks unmittelbar in akademische Publikationen,
Blog-Artikel, Bücher, journalistische Artikel, technische
Dokumentationen, Regierungsreporte, Finanzierungsanfragen und
kommerzielle Anwendungen konvertiert werden können. Je nach Gebrauch
lassen sich daraus Live-Demonstrationen, Webseiten, Präsentationen und
weiteres für verschiedenste Audienzen erstellen. Zudem sind
Jupyter-Notizbücher maschinenlesbar und erfüllen die FAIR-Kriterien der
Open Science Community.</p>
<p>Um sich ausserhalb des Kontextes vom Jupyter-Projekt in
computergestützte Narrative zu vertiefen, empfehlen sich folgende zwei
Beiträge:</p>
<blockquote>
<p>Ranade, Priyanka, Sanorita Dey, Anupam Joshi, und Tim Finin.
„Computational Understanding of Narratives: A Survey“. <em>IEEE
Access</em> 10 (2022): 101575–94.
<https://doi.org/10.1109/ACCESS.2022.3205314>.</p>
<p>Mani, Inderjeet. „Computational Narratology“. In <em>Handbook of
Narratology</em>, 84–92. De Gruyter, 2014.
<https://doi.org/10.1515/9783110316469.84>.</p>
</blockquote>
<h1 id="historische-hintergründe">Historische Hintergründe</h1>
<h2 class="unnumbered" id="die-schriftgeschichte">3.1 Die
Schriftgeschichte</h2>
<p>Erst kürzlich erschien im <em>Cambridge Archeology Journal</em> ein
Artikel, der die Datierung des ersten geschriebenen Wortes von 5'000
Jahren zurück bis auf 20'000 Jahre vor unserer Zeit datiert, nämlich in
die Eiszeit. Ein Katalog von 862 gezeichneten Tierrepräsentationen in
den Höhlen von Frankreich und Spanien wurde ergänzt mit fast ebenso
vielen Punkten, Schrägstrichen und y-förmigen Zeichen, die auf
monatliche Assoziationen hinweisen, wann die Fortpflanzungszyklen dieser
Tiere stattfinden. Da es sich dabei um Assoziationen handelt, die noch
nicht wirklich dem entsprechen, was wir von Handschrift erwarten würden,
wird von einem «Proto-Schriftsystem» gesprochen.<a href="#fn21" class="footnote-ref" id="fnref21" role="doc-noteref"><sup>21</sup></a>
Die Schrift als ein System grafischer Zeichen, die die Einheiten einer
bestimmten Sprache darstellen, geht zurück auf drei unabhängig
voneinander vermutete Entwicklungen in Mesopotamien, dem heutigen Irak,
in China und in Mesoamerika und wird auf ca. 3000 v. Chr. datiert. Als
Vorläufer dieser Keilschriften gelten Systeme, die der Aufzeichnung und
der Zählung von Waren und Tonmünzen galten. Die Entwicklung der Schrift
von den Spielsteinen über die Piktographie und das Silbenalphabet bis
hin zum heutigen Alphabet veranschaulicht die Informationsverarbeitung
zur Bewältigung immer grösserer Datenmengen in immer grösserer
Abstraktion. Auf die gleiche Weise wie ein Token heute in der Nutzung
von künstlicher Intelligenz für eine fundamentale Einheit von Daten
steht, die von natürlichen Sprachprozessoren verarbeitet werden in
maschinellen Lernsystemen, stehen Token in Form von Kugeln, Kegeln,
Scheiben, Zylinder etc. für als der Schrift vorläufige Artefakte. Einige
solcher Funde werden in der Archäologie bis auf 8000 v. Chr. datiert.
Die Schaffung phonetischer Zeichen, die die Laute der Sprache
repräsentieren und somit die gesprochene Sprache nachzuahmen versuchen,
wird dann unter dem Fachbegriff der Logographie v.a. in Bezug auf die
Entwicklungen in Mesopotamien untersucht. Als dritte Phase der
Schriftgeschichte gilt die Entwicklung des Alphabets um 1500 v. Chr. im
Alten Orient, wo im heutigen Libanon das erste proto-sinaitische
Alphabet entstand. Als System basiert es auf Akrophonie, kombiniert mit
konsonantischen Sprachlauten. Dieser Übergang von der Keilschrift zum
Alphabet vollzog sich über mehrere Jahrhunderte. So diktierten im sieben
Jhdt. v. Chr. die assyrischen Könige beispielsweise ihre Erlasse noch
zwei Schreibern. Der erste schrieb Akkadisch in Keilschrift auf eine
Tontafel, der zweite Aramäisch in einer kursiven Buchstabenschrift auf
eine Papyrusrolle. Perfektioniert wurde das Alphabet dann von den alten
Griechen, die es mit Vokalen für Sprachlaute ergänzten. Da das Alphabet
nur einmal erfunden wurde, stammen alle Alphabete der Welt,
einschliesslich Latein, Arabisch, Hebräisch, Amharisch, Brahmanisch und
Kyrillisch vom Proto-Sinaitischen ab. Das heute in der westlichen Welt
verwendete lateinische Alphabet ist der direkte Nachkomme des
etruskischen Alphabets. Es geht somit direkt auf die Etrusker zurück,
die die heutige Provinz der Toskana in Italien bewohnten und dort das
griechische Alphabet übernahmen und abänderten, bis es zu demjenigen der
Römer wurde.<a href="#fn22" class="footnote-ref" id="fnref22" role="doc-noteref"><sup>22</sup></a> Zu erwähnen in dieser Hinsicht ist
der Stein von Rosetta aus Memphis, Ägypten, der auf das Jahr 196 v. Chr.
zurückgeht und im Auftrag des Königs Ptolemaios V. Epiphanes, einem
Nachfolger von Alexander dem Grossen, ein Synodaldekret enthält,
verfasst in Hieroglyphen, demotischer Schrift und altgriechischer
Schrift. Er stellte für die westliche Welt ein entscheidendes
Puzzlestück zu der Entzifferung der ägyptischen Schriftzeichen dar.<a href="#fn23" class="footnote-ref" id="fnref23" role="doc-noteref"><sup>23</sup></a> Die chinesische Schrift musste nie
entziffert werden, weil sich die Zeichen in den 3400 Jahren ihres
Bestehens kaum verändert haben. Die phonetischen Glyphen der
mesoamerikanischen Maya bewahrten die von den Olmeken im vorherigen
Jahrtausend eingeführte Symbolik. Wie Marshall McLuhan definierte,
bestehen diese Alphabete aus semantisch bedeutungslosen Buchstaben, die
semantisch bedeutungslosen Lauten entsprechen. Das Alphabet brachte die
Datenverarbeitung somit zu einer endgültigen zweistufigen Abstraktion.<a href="#fn24" class="footnote-ref" id="fnref24" role="doc-noteref"><sup>24</sup></a></p>
<p>Gerade im Hinblick auf Forschungen in Verbindung mit modernen
Wissenschaftskommunikation, computergestützten Narrativen und
Wissensrepräsentationen sollte m.E. der historische Blick, wie er hier
nur kurz ansatzweise skizziert werden kann, nie vergessen gehen. Alles
andere wäre, wie man so schön sagt, den Wald vor lauter Bäumen nicht
mehr sehen zu können.</p>
<h2 class="unnumbered" id="die-buchgeschichte">3.2 Die
Buchgeschichte</h2>
<p>Aufbauend auf der Schriftgeschichte lässt sich die Buchgeschichte
skizzieren und eine Überleitung zu dem für uns relevanten
computergestützten, wissenschaftlichen Aufsatz denken.</p>
<p>Als Vorläufer der Buchgeschichte<a href="#fn25" class="footnote-ref" id="fnref25" role="doc-noteref"><sup>25</sup></a> gelten, in Bezug auf
die uns hier vorliegenden Informationen, die Höhlenzeichnungen, in Stein
gemeisselte Hieroglyphen, Runen und anderweitige Schriftzeichen, gefolgt
von der Entwicklung des Papyrus im alten Ägypten, die auf ca. 2500 v.
Chr. datiert wird.<a href="#fn26" class="footnote-ref" id="fnref26" role="doc-noteref"><sup>26</sup></a> In China hatten die ersten Bücher
die Form von Bambus- oder Holzstreifen, die mit Schnüren
zusammengebunden waren und auf die Shang-Dynastie (1600-1046 v. Chr.)
zurückgehen. Die Erfindung des Papiers durch Cai Lun im Jahr 105 n. Chr.
revolutionierte die schriftliche Kommunikation, da es ein billigeres und
praktischeres Medium darstellte.<a href="#fn27" class="footnote-ref" id="fnref27" role="doc-noteref"><sup>27</sup></a> Als weiteres wichtiges
Medium der Buchgeschichte gilt der Kodex, unter dem ein Stapel
beschrifteter Holz- oder Wachstafeln verstanden wird. Die Geschichte des
Kodex, die auch stark mit der Geschichte religiöser Überlieferungen
zusammenhängt, unterscheidet Kodizes aus Papyruslagen, Kodizes aus
Pergamentseiten, Kodizes aus Papierseiten sowie Kodizes aus
Seidenpapier. Diese Entwicklungsgeschichte beginnt spätestens im 8 Jhdt.
v. Chr. mit den Holztafeln und zieht sich bis hinein ins Mittelalter,
auf das die Tradition des Manuskriptes zurückgeht.<a href="#fn28" class="footnote-ref" id="fnref28" role="doc-noteref"><sup>28</sup></a>
Die Manuskriptgeschichte wiederum geht zurück auf das mittelalterliche
Klosterleben ab dem 11. Jhdt. n. Chr., wo Mönche oftmals mit der
Handschriftlichen Kopie und der damit einhergehenden Buchproduktion
beschäftigt waren.<a href="#fn29" class="footnote-ref" id="fnref29" role="doc-noteref"><sup>29</sup></a> Etwa zweihundert Jahre nach dem
Entstehen der ersten Universitäten in Europa kommt es mit der von
Johannes Gutenberg erfundenen Druckerpresse und der Verwendung von
beweglichen Metalllettern ab ca. 1450 zu einer Medienrevolution in der
Ausbreitung des Buchdrucks.<a href="#fn30" class="footnote-ref" id="fnref30" role="doc-noteref"><sup>30</sup></a> Diese Entwicklungen
stehen dann auch am Anfang der Renaissance und dem Aufkommen der
modernen Wissenschaften, der naturwissenschaftlichen Revolution in der
frühen Neuzeit Europas.<a href="#fn31" class="footnote-ref" id="fnref31" role="doc-noteref"><sup>31</sup></a> Vergleiche zu diesen Ausführungen
auch das Grundlagenwerk von der Cambridge University Press:</p>
<blockquote>
<p>Howsam, Leslie, Hrsg. <em>The Cambridge Companion to the History of
the Book</em>. Cambridge Companions to Literature. Cambridge: Cambridge
University Press, 2014.
<https://doi.org/10.1017/CCO9781139152242>.</p>
</blockquote>
<p>Im deutschen Sprachraum empfiehlt sich für interessierte der
Buchgeschichte folgendes Werk, in dem sich auch ein Kapitel zum Übergang
ins elektronische Medium findet:</p>
<blockquote>
<p>Janzin, Marion, und Joachim Güntner. <em>Das Buch vom Buch: 5000
Jahre Buchgeschichte</em>. Schlütersche, 2007.</p>
</blockquote>
<p>Im selben Werk wird auf S. 474 die Haltbarkeit von Informationen nach
Trägermedien aufgeführt. Während bei der Felsmalerei die Angabe ca.
20'000 Jahre zu lesen ist, werden bei den Steintafeln ca. 10'000 Jahre
angegeben, beim Papyrus ca. 2000 Jahre, beim Pergament ca. 1'000 Jahre,
beim entsäuerten Papier ca. 300 Jahre, bei der Magnetplatte ca. 50-100
Jahre und beim elektronischen Chip nur ca. 20 Jahre angegeben. Die
Haltbarkeit von Datenbanken im Internet ist theoretisch unendlich, wobei
diese Technologie einem stetigen Wandel ausgesetzt bleibt. Es lässt sich
bisher nur spekulieren, ob wir es bei diesem Medium also tatsächlich
auch mit einer langlebigen Entwicklung zu tun haben, spricht man in
Jahrhunderten oder Jahrtausenden. Trotz allem sieht sich der
realistische Blick erst am Anfang dieser Entwicklungen. Der grosse
Vorteil dieses neuen Mediums ist jedenfalls die Möglichkeit der
einfachen Vervielfältigung der vorhandenen Informationen sowie deren
unmittelbare Teilbarkeit. Überlegungen bezüglich der Haltbarkeit von
digitalen Informationen auf einer physischen Ebene könnten
beispielsweise auch die Thematik der Dezentralisierung von Daten
innerhalb eines Blockchain-Paradigmas beinhalten. In diesem Fall würden
die Informationen unabhängig von einzelnen zentralisierten Datenbanken
so lange bestehen bleiben, wie es Datenbanken gibt, die die
nicht-manipulierbaren Datenketten bestätigen. So wird bei dieser
Technologie von einem verteilten Datenbankmanagementsystem
gesprochen.</p>
<p>Bezüglich dem unter dem Begriff der Digitalisierung thematisierten
Übergang von Printmedien hin zu elektronischen Medien empfiehlt sich für
weitere Recherchen ein Ausgehen von den folgenden beiden Beiträgen.
Natürlich handelt es sich dabei um ein riesiges Gebiet, in dessen Mitte
sich auch die vorliegende Arbeit befindet und einen eigenen,
pragmatischen Beitrag dazu zu leisten versucht. Weitere Texte zu dieser
Thematik, bezogen auf konkretere Teilaspekte dieses Übergangs von Print
zu Elektronik, finden sich im Verlauf der vorliegenden Ausführungen. In
Bezug auf die Digitalisierung im Zusammenhang mit der
Bibliotheksgeschichte:</p>
<blockquote>
<p>Kumar, Bhardwaj, Raj. <em>Digitizing the Modern Library and the
Transition from Print to Electronic</em>. IGI Global, 2017.</p>
<p>Thompson, John B. <em>Book Wars: The Digital Revolution in
Publishing</em>. Polity Press, 2021.</p>
</blockquote>
<p>Computergestützte Narrative in Form von ausführbaren Büchern in einem
Open Science Kontext und Umfeld versprechen zumindest auf einer
theoretischen Ebene eine Vielfältigkeit von pragmatischen
Lösungsvorschlägen in Bezug auf diesen grösseren digitalen Wandel
innerhalb der Wissenschaftskommunikation. In den kommenden Jahren wird