Jeg trodde min bok ble dårlig behandlet, inntil jeg fikk se hva de gjorde med min mors billedbok Iguana våkner (klikk på skjermdumpen over for stor versjon). Dette er så dårlig at det hadde vært morsomt, om ikke det hadde vært så trist. Jeg vet ikke hvem som skanner inn billedbøker for Nasjonalbiblioteket, eller hva slags utstyr de bruker. Men det som nå kan fastslås er at produksjonsprosessen bak bokhylla.no mangler et ledd for kvalitetssikring – oppslag som det over ville aldri ha sluppet gjennom i motsatt fall.
Man skulle tro at kvalitet sto sentralt i forhandlingene mellom Kopinor og Nasjonalbiblioteket som førte til avtalen (PDF) som gjorde bokhylla.no mulig, men blant avtalens 21 punkter finnes ingen som forplikter Nasjonalbiblioteket til å levere ebøker av en akseptabel kvalitet. Selv om avtalens §6 kan gi inntrykk av at det kun er Kopinor som kan trekke enkeltverk fra prosjektet, har forfatterne fremdeles full disposjonsrett over verket. Det er en rett det kan bli aktuelt å bruke…
Oppdatering: Jan Omdahl har en vettug gjennomgang av bokhylla.no i dagens Dagbladet.
01/06/2009 at 12:45
Det er jo helt horribelt. Er flere steder jeg ikke klarer å lese hva som står, selv ved å velge høy kvalitet.
Og slik som skanningen av bildene er gjort kunne en jo tro de hadde brukt forskjellige skanner på hver side.
Og sånn litt på siden, så er det helt utrolig at når man går inn på http://www.bokhylla.no så kan man ikke bla seg igjennom innholdet, man MÅ søke (om jeg ikke har klart å misse en eller annen skjult funksjon). De burde legge opp tjeneste mer som enn vanlig bokhandel, så man kan finne innhold katalogisert på innhold.
01/06/2009 at 13:15
Fargestikk har en tendens til alltid å oppstå når en velger fargeinnstillinger ut fra gjennomsnittsverdien i bildet. Men å fjerne fargestikk i digitale bildefiler er jo en elementær ferdighet i Photoshop (eller Photoshop-kloninger).
Hadde NB åpna for at brukerne kunne bidratt til redigering og feilretting av bildefiler, metadata og objektgjenkjent tekst – slik Prosjekt Gutenberg, Distributed Proofreader, LibraryThing og Wikipedia Commons gjør, ville en kunne fiksa slike feil på < 1 min. I steden blir feilene værende til spott og spe, uten mulighet til forbedring.
01/06/2009 at 13:39
På bokhylla.no er det faktisk en del informasjon om hva slags utstyr og prosesser de bruker i innscanningen. Etter hva jeg kan skjønne, er det ganske avansert utstyr de har. De har både helautomatiske, halvautomatiske og manuelle scannere. De skriver at de scanner inn 4000 bøker i måneden, og at de derfor ikke har kapasitet til å sjekke innholdet.
Hvis de ikke kan sjekke innholdet, er det hele ganske bortkastet, spør du meg. Hvis det er slik at de skal begynne arbeidet med kvalitetssikring først etter at de er ferdige med å scanne alle bøkene (altså om noen år), så vil det bli veldig mye dobbeltarbeid. Det hadde vært mye lurere å kvalitetssikre underveis slik at de kan justere innscanningsprosessen etter hvert som de oppdager problemene.
Hvis man ser på Google Books, så vil jeg si at kvaliteten er mye bedre. Brukervennligheten er bortimot optimal, og det er blant annet funksjonalitet for å vise teksten som “ekte” tekst. Altså en tekst som bruker standard skrifttype og er velgbar.
Visningsmodiene (lav og høy) på bokhylla.no er begge ganske ubrukelige. Som du har pekt på tidligere, er både fargegjengivning og oppløsning betenkelig.
Det hadde vært veldig interessant å få noen svar på hva de tenker å gjøre med disse problemene.
01/06/2009 at 14:00
@Kristian: Et av de mange mysteriene med bokhylla.no er at man ikke rett og slett kopierte Googles motstykke, der førstesiden er full av det man kommer dit for å finne – nemlig bøker. Det er vel vanskelig å se for seg at man skal kunne lage en brukervennlig bokkatalog, all den tid man ikke engang har tid til å sjekke kvaliteten på det som legges ut.
@Harald: Amen.
@Espen: Takk for oppdateringen på det tekniske! Jeg har gitt direkte beskjed om disse problemene til Nasjonalbiblioteket, og fått til svar at man er klar over vanskene og ønsker en dialog om saken. Hva dialogen består i og når den eventuelt kommer, vet jeg ikke.
02/06/2009 at 09:59
Håpløst å scanne på denne måten – og ikke korrigere oppslagene!
Det som forundrer meg er at de ikke har fått/bedt om å få PDF-grunnlag fra forlagene på de nye bøkene! (Altså fått det med i avtalen). Alle bøker laget de siste 10 (?) årene har jo en PDF-base, og det lureste hadde vært å bruke dette som utgangspunkt – ikke scanne! Da har man full digital arbeidsflyt, og kan bevare verket bedre. (I tillegg til å kunne utnyttet interne linker mm).
Dette er som å filme av fjernsynsapparatet for så å legge ut på webtv!
(Mulig denne skulle vært her: http://newth.net/eirik/2009/05/29/look-what-theyve-done-to-my-book-ma/ , men det får stå sin prøve. )
02/06/2009 at 10:38
I all min tid som forfatter/illustratør – i år er det faktisk hele 40 år – har jeg gjort mitt ytterste for holde høy kvalitet, også i trykking av mine bøker, som har blitt nøye fulgt. Det er naturlig, både av hensyn til samarbeidspartnere,lesere og mitt eget omdømme. Mange av mine bøker er ute av sirkulasjon, og derfor sp jeg fram til at Nb skulle holde noen av dem levende for ettertiden digitalt. Men “Iguana våkner” er slurv til spott og spe. Det er en arv jeg ikke vil etterlate meg i bokhylla. Heldigvis eier jeg rettighetene til boka selv og akter å ta affære! ALLE forfattere og tegnere anbefales å sjekke kvaliteten på Bokhyllas presentasjon av deres arbeider.
02/06/2009 at 16:27
Ja, hvorfor i alle dager skannes nye bøker? Har prøvd å komme på noen grunn mens jeg nå hørte om saken på radioen, men greier det ikke.
02/06/2009 at 23:33
I 1998 spurte jeg en av NB-lederne på et besøk i hvelvet deres hvorfor de ikke jobbet for at pliktavleveringen av trykt materiale (som jo samlingen deres er bygd opp av) ble omdefinert til å samle inn de digitale filene som det trykte materialet ble trykket fra. Det ville spart dem for store deler av skanneprosjektet og gitt dem Norges beste samling av små høykvalitets søkbare filer. Det ville til og med spart dem for å stryke alle aviser med strykejern (!) før de ble mikrofilmfotografert for fremtidens redigitalisering.
Svaret jeg fikk var en anekdote fra 80-tallet om at NB måtte få tak i en pensjonert NRK-tekniker for å klare å lese videobåndene de hadde fått avlevert fra NRK-arkivet, siden ingen andre visste hvordan lese disse båndene.
Svaret viste tydelig at ledelsen av NB (dengang da, håper jeg) ikke hadde forstått hva hensikten med åpne standarder og åpne dokumentformater er. (Pdf er jo en slik standard som har eksistert siden 1993). Med andre ord regnet ikke NB – som ikke hadde problemer med uhyre komplisert kuratorarbeid som å restaurere nitratfilm fra 1920-tallet – at de ikke måtte regne med å få til å konvertere de vanligste filformatene (som i bok- og avisverdenen da var QuarkXpress, Indesign, PS og etterhvert PDF).
Til slutt fikk jeg en forventet lekse av en professor i dokumentasjonsvitenskap om at papiret bøkene var trykt på måtte ses på som en integrert del av leseopplevelsen og dermed ikke måtte kunne ses på som noe potensielt adskilt fra bøkene som NB pliktskylig gjemte unna i sitt fjellhvelv for evigheten…