Library Technology Guides

Document Repository

In de lift met cloud computing

Digitale Bibliotheek [February, 2010]

Breeding, Marshall.

Copyright (c) 2010 Essentials

Image for In de lift met cloud computing

Abstract: In het bedrijfsleven heeft cloud computing al vaste voet aan de grond. Bibliotheken zetten voorzichtige stappen in die richting. Een goede zaak. Want bibliotheken moeten verder kijken dan de lokaal beheerde computerinfrastructuur die steeds vaker een verouderd en inefficiŽnt model vertegenwoordigt.


Binnen het bibliotheekwezen tekent zich een trend af die in de afgelopen jaren ook al in de IT-wereld te zien was: een abstractie van automatiseringsplatformen door middel van cloud computing. Cloud computing biedt bibliotheken diverse interessante mogelijkheden die bij bepaalde automatiseringsactiviteiten kunnen helpen de kosten te beperken en de capaciteit, betrouwbaarheid en prestaties te verhogen.

De toepassing van cloud computing tilt computerhardware naar een abstracter niveau. De meesten van ons zijn gewend aan computers die we kunnen zien en aanraken. Ik voel de toetsen van mijn laptop terwijl ik dit typ en ik ben zojuist nog in onze serverruimte geweest met rekken vol computers waarop veel van onze bibliotheektoepassingen draaien. En aan de andere kant van de campus staat een groot datacenter met honderden, zo niet duizenden computers en bijbehorende apparatuur die de technische infrastructuur van de universiteit vormen.

Maar stelt u zich nu eens een automatiseringsmodel voor waarin al het zware werk niet langer ter plekke door deze tastbare systemen wordt uitgevoerd, maar elders plaatsvindt in een of meerdere datacenters. We hebben dan nog steeds fysieke apparaten nodig om te communiceren met computerdiensten, maar de infrastructuur die deze diensten aanbiedt, zal steeds meer geconcentreerd zijn in grootschalige centers. Concentratie van automatiseringsystemen in centrale datacenters is in de meeste grote organisaties, zoals universiteiten, overheden en bedrijven, al nagenoeg een feit. De volgende stap is de concentratie van automatiseringstaken van verschillende organisaties waarbij softwareapplicaties worden aangeboden via modellen als software as a service (SaaS) en cloud computing.

Niveaus van abstractie

Voor een beter begrip van cloud computing is het misschien nuttig om de verschillende mogelijkheden voor het applicatiebeheer binnen een organisatie door te nemen. We beginnen met de meest tastbare optie en eindigen bij de meest abstracte. We gebruiken een bibliotheek als voorbeeld, maar de beschreven opties zijn op elke organisatie van toepassing. Lokaal beheer. De meest eenvoudige, maar mogelijk ook de meest inefficiŽnte oplossing is een server ter plaatse. Als uw bibliotheek zelf het automatiseringssysteem beheert en dit in een van de eigen gebouwen is ondergebracht, valt uw bibliotheek in deze categorie. Bij dit model schaft u zelf de server aan en beheert u zelf het besturingssysteem, de applicaties, netwerkverbindingen en beveiliging. Het biedt de meeste controle, maar het is arbeidsintensief en duur.

Colocatie. In plaats van de server in de bibliotheek zelf onder te brengen, plaatsen veel bibliotheken hun server in een extern datacenter dat al dan niet bij de eigen organisatie van de bibliotheek hoort. De meeste servers van de bibliotheek van de Vanderbilt University staan bijvoorbeeld in het datacenter van de universiteit. Openbare bibliotheken kunnen hun servers bij het datacenter van de gemeente of provincie onderbrengen. Ook sluiten bibliotheken vaak een contract af met commerciŽle partijen.

In de meeste gevallen is de bibliotheek zelf de eigenaar van de server. De bibliotheek huurt in wezen ruimte en bepaalde diensten van het datacenter. Als het datacenter onderdeel is van de moederorganisatie van de bibliotheek, vindt deze dienstverlening mogelijk met gesloten beurs plaats. Bij commerciŽle centers kunt u aanvangskosten en maandelijkse kosten verwachten. De leverancier van diensten voor colocatie is verantwoordelijk voor de fysieke plaatsing van de apparatuur en de kosten voor stroom en koeling. De bibliotheek kan al dan niet fysiek toegang hebben tot de apparatuur. Het beheer vindt op afstand plaats. Sommige overeenkomsten voorzien in het beheer van het besturingssysteem, maar doorgaans niet in het beheer van de applicaties die op de servers draaien.

Virtualisatie. De geavanceerde computerhardware van tegenwoordig biedt veel meer dan de gemiddelde softwareapplicatie nodig heeft. Een dedicated server met een gemiddeld applicatiegebruik spreekt misschien niet meer dan 10 procent van zijn verwerkings- en geheugencapaciteit aan. Bij virtualisatie, een techniek die inmiddels algemeen wordt toegepast, delen meerdere besturingssystemen dezelfde fysieke server. Dit kunnen dezelfde soort besturingssystemen of verschillende besturingssystemen zijn. Hierdoor kunnen eindgebruikers tegelijk verschillende desktopsystemen laten draaien, zoals Microsoft Windows, Linux en Mac OS X. In het datacenter kan elke fysieke server door virtualisatie zijn capaciteit optimaal benutten, zodat er in totaal minder servers nodig zijn. Dit levert een besparing in ruimte en stroomverbruik op en vergt tevens minder technisch beheer. Aangezien elke virtuele server zelfstandig functioneert, zijn verschillende klanten met verschillende applicaties te bedienen. Jammer genoeg werken echter niet alle applicaties even goed in een virtuele omgeving. De technische programmering van een applicatie kan dusdanig zijn ingesteld dat de applicatie resources monopoliseert waardoor virtualisatie niet mogelijk is. Organisaties dienen hun applicaties eerst in een virtuele omgeving te testen, voordat deze wordt ingezet.

Virtualisatie kan lokaal, in een datacenter of op afstand worden toegepast. Virtualisatie vereist zorgvuldig beheer om een goede balans in het aantal virtuele computers per fysiek apparaat te bereiken en het gebruik van resources door de verschillende virtuele computers te reguleren. Dedicated hosting. Net als bij colocatie kan een bibliotheek kiezen voor hosting van diensten via een eigen datacenter of een commerciŽle aanbieder. Bij de meeste hosting services wordt de apparatuur geleased van de aanbieder. De bibliotheek betaalt maandelijkse of jaarlijkse abonnementskosten in plaats van aanschafkosten. Bij het aangaan van een hostingovereenkomst moet de bibliotheek de specificaties van de gewenste server aangeven, zoals het processortype, de hoeveelheid geheugen en schijfruimte, en het gewenste besturingssysteem. De aanbieder zal dan een server toewijzen die aan deze specificaties voldoet en de bibliotheek kan vervolgens de gewenste software installeren.

Dit type hostingovereenkomst wordt het meest toegepast voor websites en webapplicaties, maar is ook te gebruiken voor het hosten van een bibliotheekautomatiseringssysteem of andere bibliotheeksoftware. Het belangrijkste hierbij is dat alleen de server wordt gehost. De werking van de software blijft de verantwoordelijkheid van de bibliotheek.

Een virtuele server volstaat

Shared hosting. Een andere veelvoorkomende oplossing is een vorm van hosting waarbij niet noodzakelijkerwijs een dedicated server wordt geleased, maar ook een virtuele server volstaat. De kosten van een virtuele server zijn over het algemeen een stuk lager dan die van een complete fysieke server, maar een voorwaarde is wel dat de gebruikte applicaties in een virtuele omgeving zijn te gebruiken. Applicaties die nagenoeg de volledige servercapaciteit benutten zijn duidelijk niet geschikt voor virtuele hosting.

Webhosting. Nog een gebruikelijke vorm van hosting is het eenvoudig hosten van een website. Bij webhosting kan een aanbieder sites van verschillende klanten op ťťn enkele server plaatsen. Organisaties kunnen met webhosting het server- en verbindingsbeheer aan de aanbieder overlaten en zich richten op de inhoud van de site. Bij technisch gecompliceerde websites met PHP- of Perl-scripts, contentmanagementsystemen en andere plug-ins is mogelijk meer nodig dan eenvoudige webhosting.

Software as a service. Software as a service, of SaaS, is inmiddels een belangrijke methode voor het aanbieden van zakelijke software en consumentensoftware. Veel aanbieders van bibliotheekautomatiseringssystemen geven hier de voorkeur aan.

SaaS biedt toegang tot een softwareapplicatie onafhankelijk van de gebruikte hardware. De aanbieder van SaaS kan gebruikmaken van virtualisatie, serverclustering en andere methoden om software zo efficiŽnt mogelijk aan te bieden, alsof deze lokaal draait. De gebruiker kan de software naar believen configureren, maar niet zodanig aanpassen dat de functionaliteit verandert. Bij SaaS is de aanbieder gewoonlijk verantwoordelijk voor de implementatie van alle software-updates en alle andere technische details achter de schermen. SaaS werkt niet alleen heel goed met webapplicaties, maar ook met applicaties die gebruikmaken van desktopclients.

Gewoonlijk worden voor SaaS eenmalige set-upkosten en vervolgens maandelijkse of jaarlijkse abonnementskosten in rekening gebracht. Dit is een groot verschil met traditionele software, waarbij sprake is van kosten voor aanschaf, installatie en beheer van lokale hardware, kosten voor softwarelicenties en kosten voor ondersteuning en upgrades. De abonnementskosten bij SaaS zijn hoger, maar daar staan besparingen op andere terreinen tegenover.

Cloud computing. Vanuit het perspectief van een organisatie die bedrijfsapplicaties gebruikt, laat SaaS de hardwarecomponent buiten beeld en biedt software als abstractie aan. Cloud computing gaat nog een stapje verder door de hardware voor de ontwikkelaar van software abstract te maken. Cloud computing biedt een diffuse, gedistribueerde computerinfrastructuur via het internet, waarin noch de programmeurs noch de eindgebruikers van applicaties zich bezig hoeven te houden met de ondersteunende hardwarecomponenten. Het model biedt zowel dataopslag- als verwerkingscapaciteit. Programmeurs die cloud-applicaties ontwikkelen, schrijven commando's voor processor- of opslagcapaciteit op basis van een API (applications programming interface) die resources benadert die door een cloud-aanbieder worden aangeboden. Cloud computing is met name populair in e-commerce. Een organisatie kan een volledig toegesneden bedrijfsapplicatie ontwikkelen op basis van diensten die in een cloud worden aangeboden.

De gebruikskosten van cloud computing zijn heel precies te berekenen. De maker van een applicatie kan de cloud-aanbieder betalen op basis van het aantal transacties dat door gebruikers van het systeem wordt uitgevoerd, de hoeveelheid gegevens die wordt opgeslagen en de bandbreedte die wordt gebruikt. Cloud computing biedt makers van software dezelfde kostenvoordelen als SaaS aan eindgebruikers biedt. Er zijn geen voortdurende kosten meer voor investeringen in hardwarecomponenten. Cloud computing is te beschouwen als infrastructure as a service.

Divers pluimage

Cloud computing wint aan terrein en is verkrijgbaar in vele smaken. In de meest abstracte vorm levert een openbare cloud diensten aan applicatieontwikkelaars van divers pluimage. Hoewel het eindproduct zelfstandig functioneert, komen gegevens van verschillende organisaties samen in de cloud-infrastructuur. Een privť-cloud volgt dezelfde technische benadering, maar is afgeschermd van de rest, zodat verschillende organisaties niet dezelfde infrastructuur gebruiken. Een organisatie kan zijn eigen cloud-infrastructuur opzetten voor diverse interne bedrijfsapplicaties in plaats van gebruik te maken van een externe cloud-aanbieder.

Als u uw telefoonoplader in het stopcontact steekt, verwacht u dat deze stroom krijgt. U hoeft niet precies te weten hoe deze wordt opgewekt. Door een kolencentrale, kerncentrale of waterkrachtcentrale? In theorie wilt u misschien wel weten of het van een duurzame energiebron afkomstig is, zoals wind- of zonne-energie. Maar als het om het opladen van uw telefoon gaat, is het enige wat praktisch gezien telt dat er stroom met het juiste voltage uit komt. U verwacht dat het aantal ampŤre stroom dat u gebruikt een paar centen extra op uw elektriciteitsrekening zal zijn. Cloud computing streeft ernaar vanzelfsprekend te zijn, inclusief prijzen op basis van verbruik. Een van de bekendste aanbieders van cloud-diensten in Amerika is Amazon.com met de Elastic Compute Cloud (EC2)- service voor geheugen- en processorcapaciteit en Simple Storage Service (S3) voor gegevensopslag in een cloud. Google biedt App Engine aan als platform voor cloud-diensten. Tienthetallen andere bedrijven bieden openbare, privť of hybride cloud-diensten aan, elk met eigen kenmerken en voordelen. Een organisatie die eenmaal besloten heeft om applicaties in een cloud toe te passen, staat een ruime keus aan aanbieders te wachten.

In bibliotheken houden we ons doorgaans niet zo bezig met de energiekosten van onze servers. We hebben over het algemeen niet veel servers, zodat de energiekosten daarvan slechts een bescheiden aandeel hebben in de totale kosten van de bibliotheek. Maar voor bibliotheken met grote datacenters zijn de energiekosten wel een zorg. Er is veel energie nodig voor het draaiende houden van alle apparatuur en nog eens bijna net zo veel om deze te koelen. Dergelijke kosten kunnen een belangrijke overweging zijn bij de keuze om zo veel mogelijk computerinfrastructuur af te stoten. SaaS en cloud computing kunnen het energieverbruik van een bibliotheek beperken en zo een groot voordeel opleveren. Het voordeel kan groter zijn dan het verplaatsen van verbruik van de ene organisatie naar de andere. Doordat automatiseringsdiensten efficiŽnter zijn te leveren, kunnen deze modellen bijdragen aan lagere totale energiekosten.

Opvallende voorbeelden

Hoewel de verschillende vormen van platformhosting en software as a service in de bibliotheekautomatisering inmiddels al goed zijn ingeburgerd, wordt cloud computing nog maar mondjesmaat toegepast. Er zijn een paar in het oog springende voorbeelden.

Het Online Computer Library Center (OCLC) is waarschijnlijk het meest prominente voorbeeld van cloud computing in het bibliotheekwezen. WorldCat, de wereldwijde catalogus van bibliotheekcollecties van OCLC, maakt gebruik van een wereldwijd gedistribueerde infrastructuur en is daarmee de grootste implementatie van cloud computing in het bibliotheekwezen. De recente plannen om in aanvulling op de bestaande catalogusfuncties ook bibliotheekautomatiseringsfuncties aan te bieden, zoals uitleen- en acquisitiefunctionaliteit, het delen van resources en zoekfunctionaliteit voor eindgebruikers, zal een belangrijke test zijn voor de toepassing van cloud computing bij het leveren van kerndiensten aan bibliotheken. In de verschillende abstractieniveaus in de automatisering kunnen we het nieuwe WorldCat-bibliotheeksysteem van OCLC als privť-cloud zien.

Een interessant voorbeeld van cloud computing op het gebied van gegevensopslag voor instellingen is DuraCloud, dat onlangs werd gelanceerd. Deze dienst wordt gehost door de nieuwe organisatie DuraSpace die is ontstaan uit een fusie van de DSpace Foundation en de Fedora Commons, de twee belangrijkste opensourceprojecten voor gegevensopslag voor instellingen1. Opvallende projecten waarin het gebruik van cloud computing een grote rol speelt zijn onder andere de infrastructuur rond OCLC WorldCat en het DuraCloud archiveringsplatform. Naarmate cloud-infrastructuren steeds meer standaard worden bij het bouwen van applicaties, kunnen we nog veel meer projecten verwachten, zowel van commerciŽle organithesaties als in afzonderlijke bibliotheken, die deze benadering volgen.

Vooral nu bibliotheken met beperktere financiŽle middelen moeten werken, wordt het nog belangrijker om gebruik te maken van de meest efficiŽnte technologische modellen. Hoewel de meest abstracte benadering van cloud computing mogelijk niet geschikt is voor alle technologische scenario's in bibliotheken, kan een bepaald niveau van hardwareconsolidatie of -abstractie helpen om de efficiŽntie en prestaties te verbeteren en tegelijk de kosten te drukken.

De tijd dat elke bibliotheek over eigen lokale servers beschikt ligt grotendeels achter ons. Hiermee is zelden een optimale benutting van bibliotheekruimte en -personeel gediend. Bibliotheken die een volgende stap in hun technologische strategie overwegen, doen er goed aan verder te kijken dan de lokaal beheerde computerinfrastructuur die steeds vaker een verouderd en inefficiŽnt automatiseringsmodel vertegenwoordigt. Colocatie, remote hosting, virtualisatie, SaaS en cloud computing bieden bibliotheken mogelijkheden om minder mankracht en middelen in te zetten voor het beheer van de infrastructuur en zich meer te richten op activiteiten die de bibliotheek direct ten goede komen.

Publication Year:2010
Type of Material:Article
LanguageEnglish
Published in: Digitale Bibliotheek
Issue:February, 2010
Publisher:Essentials
Place of Publication:Rotterdam, The Netherlands
Notes:This translation of the November 2009 Systems Librarian appeared in Digitale Bibliotheek published by Essentials.
Permalink: http://librarytechnology.org/ltg-displaytext.pl?RC=16158
Download   [ pdf ]
Record Number:16158
Last Update:2012-12-29 14:06:47
Date Created:2011-10-08 15:36:44