2014-06-08

Hur ett digitalt tidningsarkiv (inte) ska se ut

Man har ju sett en del digitala tidningsarkiv.

Ofta är grundmaterialet, de inscannade sidorna, utmärkt; ibland kan urvalet ifrågasättas, ibland saknas årgångar eller nummer på ett irriterande men förmodligen förklarligt sätt. Ibland finns texten OCR:ad (automatiskt tolkad till sökbar text); ibland är materialet så svårtolkat för programmen (knepiga stilar och gryniga mikrofilmer i förening) att man nästan hade kunnat vara utan den, men icke desto mindre är även usel OCR-text bättre än ingen alls.

Men för det mesta ligger de största bristerna i presentationen av materialet. Det går inte att söka på något vettigt sätt, eller så är sökmotorerna handikappade helt i onödan. Det är svårt att tänka sig en modern sökmotor där man inte brytt sig om att implementera sökningar på fraser, där du kan söka på "Sveriges" och "kung", men inte på "Sveriges kung". (Exemplet gäller självaste KB:s Digitaliserade svenska dagstidningar; där finns det fler onödiga brister men jag sätter punkt här för att inte lacka ur fullständigt.)

Ibland kan man begränsa datum genom att skriva in YYYY, YYYY-MM eller YYYY-MM-DD vilket man vill. Andra gånger måste man pillra runt i en förmodat användarvänlig kalenderruta eller välja årtal i jättelånga menyer. Det ser nog bättre ut men är i längden avgjort knöligare att använda.

Ett av de mest fantastiska digitala arkiven är JSTOR för vetenskapliga tidskrifter, journals. (Av flera anledningar borde det vara fritt för allmänheten att söka i men är det, av någon anledning, inte.) Dess förra sökmotor var suboptimal, dess nuvarande ser bättre ut men fungerar sämre, och dess "Beta Search" ska jag inte gå in på av samma anledning som ovan.

Sökmotorer som ser snyggare ut fungerar ofta sämre. Andra gånger fungerar de lika illa som de ser ut. Inte av nödvändighet, utan ... Ja, varför?

Vad är det egentligen med folk som ansvarar för att göra digitala arkiv tillgängliga? Förser man fantastiskt material med halvkassa sökmöjligheter av ointresse, inkompetens eller på pin kiv?

För att avsluta i en muntrare ton: Här är ett digitalt tidningsarkiv som levererar på alla fronter. Det är rentav helgratis, utan inskränkningar. Även den som inte är jätteduktig på tyska och/eller fraktur kan ha såväl nytta som nöje av det.

ANNO står för AustriaN Newspapers Online. Det hittas på anno.onb.ac.at. Det finns fritextsökning men min favorit är det kronologiska bläddrandet: Jahresübersicht der Zeitungen. Där hittar man ett hav av årtal. De länkade är de där man hittar digitaliserade tidningar.

Låt oss till exempel gå in på ödesåret 1914. Länkade datum är återigen de som har arkiverade tidningar kopplade till sig.

Vi väljer dagens datum, den 8 juni (som tydligen var en måndag). Vad kunde folk i dubbelmonarkin läsa om för prick hundra år sedan? Vi hittar inte mindre än trettio förstasidor; så många tidningar som gavs ut just denna dag har man arkiverade.

Vi väljer Die Neue Zeitung, en dagstidning från Wien. Ett klick till så ser vi att den rymde åtta sidor:

En av dem ser särskilt intressant ut:


Sidorna är scannade i tillräckligt hög upplösning för att man ska kunna dechiffrera den ofta finstilta och inte alltför lättlästa texten.


Så kan man, med lite språkkunskaper och/eller hjälpmedel, efter några klick läsa om den äventyrliga fallskärmshopperskan på sid 5 i Die Neue Zeitung den 8 juni 1914. Det är så det ska se ut.

Inga kommentarer: