måndag 23 november 2009

Dubbelarbete

BTJ:s ledning skriver på hemsidan under rubriken "En seriös och ärlig diskussion tack" att jag sprider osanna påståenden. Det är inte sant. Jag vill också ha en öppen debatt. Jag vill att Libris ska vara den nationella databasen. Det är bra att BTJ ser över tjänsten bibliografisk service, och gör den kostnadseffektiv. Tjänsten är bra, men dyr.

BTJ påstår felaktigt att jag sagt en rad saker. Det känns inte särskilt ärligt. Det finns en förstudie, och det finns blogginlägg att hänvisa till. Inget av det skrivna citeras. Ett påståendet gäller hur arbetet med interna resurser fördelas. Där sägs att endast fem procent går till att uppdatera poster. Det finns ingen anledning att betvivla. Det stora arbetet är att katalogisera. Några bibliotek, som katalogiserar själva har uppskattat den tid de lägger på katalogisering resp uppdatering till 95% mot 5%. Om Btj lägger 5% av resurserna på att leverera omvårdnad av posterna så antar jag att 95% av resurserna går till att leverera katalogposter.

Katalogisering tar mycket tid. Därför är det viktigt att vi inte använder folkbibliotekens pengar till dubbelkatalogisering. Jag har aldrig nämnt någon siffra om hur stor överlappning det är mellan BURK och Libris. Jag har inte någon uppfattning om den siffran. Peter Alsbjer nämner i sin blogg att den var 20% 1985. Det innebär ett stort dubbelarbete, större än man vid en första anblick kan tro. Eftersom Libris är ungefär dubbelt så stor som BURK, betyder 20% överlappning att halva BURK dubbelkatalogiseras.

För att förtydliga detta vill jag ta två exempel där överlappningen i båda fallen är 20%. I det ena fallet blir dubbelarbetet 50%, i det andra 100%. Vi har databasen A, som har 100 poster, B som har 50 poster, och C har 20 poster.

Exempel 1: databaserna A och B har 25 poster gemensamma. Det betyder att A har 75 poster som är unika och 25 poster som är gemensamma. B har 25 poster som är unika och 25 poster, alltså hälften, som är gemensamma. Tillsammans har de båda databaserna 125 poster, A har 60% unika poster, B har 20% unika poster och 20% av posterna är överlappande.

Exempel 2: databaserna A och C har 20 poster gemensamma. Det innebär att alla 20 poster som finns i basen C även finns i basen A. Överlappningen är 20 poster, vilket också är 20%. Det betyder att A har 80% unika poster och 20% gemensamma. Databasen C har 20% gemensamma och 0% unika. Allt arbete med basen C är dubbelarbete, trots en låg överlappning i procent.

Jag vet ingenting om hur många poster som överlappar varandra i BURK och LIBRIS. Berätta gärna!

1 kommentar:

  1. Ja, du vet: Ränderna går aldrig ur. Kh Anders Hjertén, gammal i gården

    SvaraRadera