Arne Næss har etterlatt seg store mengder notater, artikler, forelesningsnotater, brev, seminarer, kommentarer etc. Dette materialet har blitt oppbevart til dels usikret på ulike steder. ANCEP har startet arbeidet med å samle, sikre og senere tilgjengeliggjøring av dette materialet. Dette materialet er en viktig del av Norges nasjonalarv, og et viktig aspekt av ANCEP’s arbeide er å sikre dette materialet mot å gå tapt. ANCEP har laget en nært fullstendig bibliografi over Arne Næss arbeide, med nær 4000 innføringer og jobber nå med å utvikle og opprette et elektronisk bibliotek hvor materialet skal publiseres og gjøres tilgjengelig for allmennheten. ANCEP har i denne sammenheng et samarbeide med Nasjonalbiblioteket, og kvaliteten på avfotografering og sikring av materialet legges på samme nivå som for tilsvarende arbeide i Nasjonalbibliotekets regi.

 

Arbeidet med å utvikle et digitalt bibliotek

Avfotografering

For å kunne bevare det unike skiftelige materialet på best mulig måte, er det viktig at det er så god kvalitet som mulig i overførselen fra fysisk til digitalt dokument. Vi benytter oss derfor av avansert utstyr til digitale scanning og avfotografering av materialet. Vi vil på denne måten sitte igjen med et digitalt råmateriale av meget høy kvalitet. Hver enkelt side med det avfotograferte råmateriale vil være på 50 MB, mens de bearbeidede TIFF filene vil være på 200MB pr. side.

Nasjonalbiblioteket benytter et oppsett av Hasselblad teknologi når de jobber med unike samlinger. Vi vil benytte samme standard på avfotografering og sitte igjen med lik kvalitet som Nasjonalbiblioteket på det avfotograferte materialet. Følgende utstyr skal benyttes til avfotografering av dokumentene:

Hasselblad H4D/H3D, Høyoppløselig digitalt mellomformatkamera. Rawfiler i FFF format ca 50MB. Ferdig prosesserte TIFF-filer i (ekte) 16bits farvedybde. ca 200MB

Apple MacPro. MacPro dual processor 8 core/16GB RAM. Hasselblad Phocus software for thedered Hasselblad shooting. 23” kalibrert monitor

Profoto Pro 7a. Blitzaggregat med ekstremt nøyaktig farvetemperatur.

Profoto Pro head. Blitslampehoder med ekstremt nøyaktig farvetemperatur

X-rite Colorchecker Passport. Alle bilder fotograferes med en X-rite Colorchecker (McBeth card) referanse i bildet.

 

Bokscanning

Omlag 46 % av det materialet vi har registrert og ønsker å digitalisere er i bokform, og for størstedelen av dette materialet vil det være mest hensiktsmessig å benytte en avansert bokscanner. En del av bøkene er i grenseland rent kvalitetsmessig i forhold til om de lar seg bokscanne eller ikke, dette er vanskelig å vite før hver enkelt bok blir behandlet. Det er derfor sannsynlig at noe av bøkene må avfotograferes.

 

Cropping/ bearbeiding av ferdige filer.

Hver enkelt side blir avfotografert i et standard format, selv om hver side er ulik i størrelse, kvalitet etc. Hvert enkelt bilde må deretter croppes for at det skal kunne presenteres i en akseptabel kvalitet. En del av bildene er også tatt av dobbeltsider. Her må hver fil deles opp i 2 slik at hver av de ferdige filene kun vil inneholde 1 side.

 

Sortering, kategorisering og tagging av data

For at det skal være mulig å søke seg fram til dokumenter i en database etter ulike søkekriterier, må hver enkelt fil (side) tagges (merkes) med nøkkelord og innhold. Hver enkelt fil må deretter merkes med et unikt tallkode for et det skal bli gjenkjent i databasen.

 

Vi har foreløpig definert følgende søkekategorier og nøkkelord:

Nøkkelord/ Fagområde: 1]Annet  2]Argumentasjon  3]Biografisk 4]Buddhisme  5]Filosofihistorie  6]Fredsarbeid  7]Friluftsliv  8]Fysikk  9]Gandhi  10]Generell filosofi  11]Gresk  12]Heidegger  13]Klatring   14]Livsfilosofi  15]Logikk  16]Metodelære  17]Miljøvern  18]Naturfag  19]Politisk filosofi  20]Psykologi  21]Samfunnsdebatt  22]Spinoza  23]Språkfilosofi  24]Tvergastein  25]Universitetsarbeid  27]Utdanning  28]Vitenskapsfilosofi  29]Økosofi

 

Type dokument:  1]Anmeldelse  2]Appell  3]Arbeidsmanuskript  4]Artikkel  5]Artikkel (kapittel i bok)  6]Artikkel fra bok  7]Artikkelsamling  8]Avhandling  9]Bearbeidet foredrag  10]Bemerkning  11]Bok   12]Bok (utkast)  13]Bokanmeldelse  14]Dagboknotater  15]Debattinnlegg  16]Dialog  17]Diskusjonsinnlegg  18]Doktorgradsavhandling  19]Eksempelsamling  20]Elektronisk bok  21]Epilog  22]Filmanmeldelse  23]Filosofiske skrifter  24]Fjernsynsproduksjon  25]Fjernsynsdebatt  26]Fjernsynsforelesning  27]Foredrag  28]Foredragsnotater  29]Forelesning  30]Forord  31]Fragmenter  32]Innlegg  33]Intervju  34]Kommentar  35]Kronikk  36]Leksikon artikkel  37]Leserbrev  38]Liste  39]Magasin  40]Magistergrad avhandling 41]Minnetale  42]Motinnlegg  43]MS (manuskript)  44]Nekrolog  45]Notat  46]Note  47]Nytt kapittel 48]Oppgavesamling  49]Opprop  50]Oversikt  51]Presentasjon  52]Referat  53]Resymé  54]Sammendrag  55]Samtale  56]Sitater  57]Stensil  58]Tale  59]Tidlig MS  60]Uferdig artikkel  61]Utkast  62]Working paper  63]Åpent brev

 

Øvrige søkekriterier: Tittel, Fri tekst, Årstall, Publisert/ Ikke publisert, Utgiver/ Forlag, Bidragsyter, og Språk.

 

Dette arbeidet er tidkrevende, men helt nødvendig for å få en database som kan fungere effektivt.

Ikke identifisert materiale: En stor del av materialet er håndskrevet, og det kan derfor være til dels tidkrevende å lese gjennom.  I samlingen er det 9700 sider som er av ukjent karakter og som dermed må gjennomgås, sorteres og merkes.

Identifisert materiale: Det resterende materiale har vi forholdsvis god oversikt over, og det vil derfor være enklere å merke materialet og få lagt det inn under riktig kategori i databasen.

OCR (Optical Text Recognition)

Hver fil som genereres blir et resultat av et bilde tatt av hver enkelt side. Dette innebærer at vi har bilder av tekst, og det er i utgangspunktet ikke mulig å søke i den aktuelle teksten. Det finnes derimot såkalt OCR (Optical Text Recognition) software som kan gjenkjenn tekst på et bilde og produsere søkbare dokumenter. Etter å ha gjort en vurdering av ulike alternative programvareløsninger har vi kommet fram til at en ABBYY OCR- software for storbrukere er den beste løsningen for vårt prosjekt. Den støtter en lang rekke språk og får bra brukervurderinger på output- kvalitet. ABBYY kan til en viss grad også lese tekst med noe ”støy”. I en del av det maskinskrevne materialet er det ført inn kommentarer etc. av Arne, og det vil lette arbeidet vesentlig hvis programvaren kan gjenkjenne skrift til tross av denne ”støyen”.

Database / Elektronisk bibliotek

Viktige kriterier ved valg av utformingen av et elektronisk bibliotek er funksjonalitet og brukergrensesnitt. Biblioteket skal være lett å forstå, enkelt å sette seg inn i, oversiktelig og det må være lett å søke seg fram til relevante dokumenter. Vi har vurdert 3 alternativer, enten bygge en egen databasestruktur med backend og frontend- løsning, leie plass på en eksisterende løsning eller kjøpe ferdig software. Etter å ha vurdert de ulike alternativene opp mot hverandre, har vi valgt en løsning med utvikling av egen database. De viktigste grunnene til at vi velger egen løsning er fleksibilitet i forhold til egne behov og brukergrensesnitt, språk, kontroll med eget datamateriale og pris.

 

 

Ulike kategorier dokumenter

 

Job_0015

Job_0014

Magistergradsavhandling. Arne skrev i 1932 sin magistergradsavhandling med tittelen «Adferdspsychologisk teori om dommer». Avhandlingen er på 70 sider

 

 

 

 

 

 

 

Job_0017Job_0016

 

Doktorgradsavhandling. Arne skrev….

 

 

 

 

 

 

Job_0036

Job_0018

Artikkel

 

 

 

 

 

 

 

Job_0043 Job_0042

Brev Håndskrevet

 

 

 

 

 

 

 

Job_0013

Brev Maskinskrevet

 

 

 

 

 

 

 

Job_0020Job_0021

Notatlapper

 

 

 

 

 

 

 

Job_0041

Postkort