brughagedis.nl

Deze blog gaat over mezelf en mijn bezigheden



Category: Bibliotheek

Ideetje?

3 June, 2008 (00:07) | Bibliotheek, Boeken | By: brughagedis

Iliad Book EditionIn Introduction to Bioinformatics van A.M. Lesk las ik dat Internet er niet alleen voor heeft gezorgd dat veel wetenschappelijke tijdschriften digitaal beschikbaar zijn gekomen, maar ook voor nieuwe methodes om wetenschappelijke resultaten te verspreiden en te publiceren. Bijvoorbeeld door middel van bulletin boards, blogs, cursus notities, presentaties van wetenschappelijke bijeenkomsten en compendia als Wikipedia. Daarnaast zijn nieuwe media toegevoegd, zoals afbeeldingen, filmpjes en geluiden. Dit alles heeft ertoe geleid dat veel onderzoekers nauwelijks nog in de bibliotheek komen. Daarom moet de bibliotheek op zoek naar nieuwe vormen van dienstverlening.

Nu las ik in de Informatie Professional van deze week dat er een nieuwe Iliad-reader is die gericht is op het lezen van boeken. Deze iLiad Book Edition is lichter en iets voordeliger dan de vorige versie, maar heeft geen ingebouwd Wireless internet. Wel is hij standaard voorzien van vijftig klassieke meesterwerken uit de Engelstalige literatuur. Ik bedacht nu of het misschien aardig is als onze bibliotheek een aantal van die apparaten aanschaft en gaat uitlenen? Laatst kreeg ik een prijsopgave te zien van wetenschappelijke titels voor dit soort ebooks en de prijzen vielen me alleszins mee. Laad hem propvol vol met interessante titels en ik denk dat er best mensen zijn die hem eens willen uitproberen. Dus voor de eerste tijd ben je denk ik wel voorzien van klandizie. Ik ga eens informeren wat men ervan vindt.

Handboeken visueel toegankelijk maken

22 May, 2008 (20:15) | Bibliotheek, Informatie zoeken | By: brughagedis

In het proefschrift Topic driven access to scientific handbooks van de Italiaanse UvA-promovenda Caterina Caracciolo (SIKS Amsterdam, 2008) vond ik een interessant tabelletje met de resultaten van een onderzoek naar het gebruik van elektronische bronnen door Informatica-studenten. Het is gedaan onder 6 (!) master studenten en 8 (!) bachelors Kunstmatige intelligentie. Bij elkaar dus 14 studenten. Zou dat representatief zijn?

Gebruik elektronische bestanden

Het blijkt dat slechts 2 studenten de bibliotheek gebruiken om kennis over een nieuw onderwerp op te doen. De meesten zoeken het liever op in Google of vragen het aan iemand anders. Geen enkele student gebruikt een glossary (verklarende woordenlijst), slechts 3 gebruiken een encyclopedie, 2 zelfs dagelijks. (Welke encyclopedie zou dat dan zijn? Want wij bieden helemaal geen geschikte encyclopedie voor Informatica aan.) Opvallend is ook dat master-studenten geen aantekeningen maken en als digitale informatiebron vooral handouts en Powerpoint slides gebruiken. Gelukkig lezen ze wel tijdschriften en papers. Hieruit lijkt een nogal passieve manier van kennis verzamelen naar voren te komen waarin de bibliotheek geen noemenswaardige rol speelt.

Thinkmap Visual ThesaurusHet proefschrift gaat over het toegankelijk maken van wetenschappelijke handboeken door de inhoud visueel gestructureerd als een soort kenniskaart aan te bieden. Er staat wel meer interessants in. O.a. een summiere beschrijving van de pogingen die tot nu toe gedaan zijn om kennis visueel te structuren, van de Middeleeuwse kennisboom Arbor Scientiae van Ramon Lull, tot aan het Semantische Web.

Als voorbeeld van een zoekinterface wordt de Visual Thesaurus genoemd ontwikkeld door Thinkmap, Inc.  Ik kende het hele ding niet. Had me nou echt iets voor de Spoetnik-cursus geleken. Het nadeel is dat je maar enkele termen kunt opzoeken in de onbetaalde versie. Voor een onbeperkt werkende web- of desktop-versie moet betaald worden. Ik vind hem leuk werken, ongeveer als de aquabrowser. Een gezochte term wordt in het centrum weergegeven met daar omheen in een vertakte boomstructuur de gerelateerde termen. Aan de rechterkant van het scherm vind je korte verklaringen van de gevonden termen. Iets om leuk mee te spelen.

Visual Thesaurus voor term “Cell”

Caterina Carraciolo heeft haar ideeën uitgewerkt in de LoLaLi-browser. Deze is online te raadplegen, maar komt op mij een beetje over als een conceptversie.

Trefwoorden

21 May, 2008 (19:30) | Bibliotheek, Boeken, trefwoorden | By: brughagedis

Vandaag heb ik een heleboel Logica boeken van trefwoorden voorzien. Dat is voor mij als niet-wiskundige een lastige klus, want je komt termen tegen als residuated lattices, substructural logics, Gödels’ incompleteness theorems, Russels’ paradox en the Law of Non-Contradiction en allerlei symbolen waarvan ik niet weet wat het allemaal betekent. In Mathematical Logic van Ian Chiswell and Wilfrid Hodges, Oxford University Press, 2007, vandaag eveneens van trefwoorden voorzien, vond ik een handig overzicht van veel gebruikte symbolen. (Zie tabel.)

SymbolenkaartDoor samenvattingen en inhoudsopgaven te bekijken, een beetje door het boek te bladeren, op termen te Googelen en te zoeken in Wikipedia probeer ik te begrijpen waar het ongeveer over gaat. Ook vergelijkbare boeken opzoeken in OPC of Picarta en bij uitgevers (Springer!) kijken wil wel helpen. Van een oud-collega (wel wiskundige!) begreep ik dat hij wachtte tot een boek in MathSciNet opgenomen was om vervolgens de trefwoorden over te nemen in de GGC. Maar zo wil ik niet werken, dus probeer ik zelf termen te bedenken. Toevallig kwam ik op de website van bol.com terecht en ontdekte dat vrijwel alle titels daar ook zijn opgenomen en van trefwoorden voorzien. Dat is een uitkomst! Niet dat ik nu uitsluitend hier op af ga, maar als ik er echt niet uitkom en als vergelijkingsmateriaal lijken ze mij prima bruikbaar. Ik weet niet precies waar die trefwoorden bij bol.com vandaan komen. Misschien zijn ze overgenomen van de uitgever of automatisch gegenereerd, maar zou het niet mogelijk zijn dat de trefwoorden in de GGC ook gewoon van de uitgevers worden overgenomen? Ik hoop dat dit in het nieuwe LBS wel gaat gebeuren. Of anders stel ik voor die af te leiden van veel voorkomende en specifieke termen uit de index. Moet toch te doen zijn? In Web of Science worden trefwoorden automatisch gegenereerd uit de titelwoorden van verwante publicaties, maar bij boeken zijn de titelwoorden vaak minder gerelateerd aan de inhoud. 

Zo moeilijk is het toekennen van trefwoorden op een onbekend vakgebied overigens niet als je een beetje begint te begrijpen waar het over gaat. Die Law of Non-Contradiction is gewoon een oude wet van Aristoteles waarin gesteld wordt dat twee beweringen niet tegelijkertijd waar en onwaar kunnen zijn. Lijkt logisch, maar dit wordt natuurlijk betwist door een deel van de logici. Wat te denken van bijvoorbeeld de bewering “Alles wat op dit blog beweert wordt is onzin”. Betekent dat dan dat ook deze bewering onjuist is? Maar dan zou de rest dus geen onzin zijn. Of is alleen deze bewering onjuist en de rest inderdaad onzin? Kortom niet duidelijk. Volgens Graham Priest kunnen beweringen tegelijkertijd zowel waar als onwaar zijn, dit heet ‘dialetheisme’. Dit lijkt mij een gevolgtrekking die je gemakkelijk uit de vaak tegenstrijdige werkelijkheid van alledag kunt afleiden: in Picarta komen 13 titels voor waaraan zowel het trefwoord “waarheid” als “liegen” is toegekend. Filosofen kunnen er een heel boek over schrijven, maar voor een trefwoordensysteem is het volkomen normaal. Dialetheisme heeft als consequentie dat het bijna onmogelijk is om iets te beweren wat niet waar is, vandaar dat ik dit laatste zonder blikken of blozen kon beweren.

Boek gekocht!

15 May, 2008 (20:20) | Bibliotheek, Boeken | By: brughagedis

Het is nauwelijks te geloven, maar toch echt waar. Ik heb een BOEK gekocht! En dan niet zo’n computerboek in de ramsj voor een paar euro of een romannetje dat momenteel iedereen moet lezen. Nee, een echt boek, een studieboek zowaar en de prijs was enkele tientallen euro’s. Zonder dat ik een boekenbon kon inzetten. Om welk boek gaat het dan en vanwaar deze dwaasheid?

Introduction to Bioinformatics Het gaat om: Introduction to Bioinformatics van Arthur M. Lesk (3e editie uit 2008 uitgegeven door Oxford University Press) en ik ga het lezen omdat het me heel overzichtelijk lijkt, uptodate is en er een boel leuke dingen in staan. O.a. een  hoofdstuk over wetenschappelijke literatuur met informatie over Open Access, traditionele en digitale bibliotheken, de informatie explosie, databases, programmeertalen op het web en het verwerken van natuurlijke taal. Allemaal dingen waar ik het over kan hebben tijdens de bibliotheekcurssussen die we in juni weer gaan houden. Bovendien passeren de belangrijkste systemen waarin gegevens voor eiwitsequenties en genexpressie verwerkt worden de revue. Daar was ik al enige tijd grotendeels de weg in kwijt, dus ik hoop nu eindelijk te lezen hoe het allemaal werkt. Er staan ook aardige wetenswaardigheden in; wist u bijvoorbeeld dat de gemiddelde levensduur van een website vergelijkbaar is met die van een menselijke erythrocyt oftewel een rood bloedlichaampje? De levensduur van een erythrocyt bedraagt 120 dagen. Dus ongeveer zolang als de Spoetnik-cursus duurt.

Dat ik zo’n boek koop vind ik vrij normaal. Misschien dat ik eens per jaar op deze manier een boek tegenkom dat ik graag wil hebben. Als je ziet hoeveel informatie ik er daarna vaak uit kan gebruiken vind ik de uitgave geheel verantwoord. Ik vond het dan ook  vreemd dat vorig jaar een kleine rel ontstond tussen een aantal docenten en de bibliotheek omdat wij een aantal exeplaren van een veelgebruikt boek uit onze studiecollectie hadden uitgeleend aan studenten, zodat het niet beschikbaar was voor docenten terwijl ze er les uit moesten geven. Let wel wij wisten niets van afspraken hieromtrent en het lag dat moment gewoon te koop bij het filiaal van Selexys even verderop in de Roeterstraat voor ongeveer 50 euro. Koop het dan gewoon!

Maar de docenten vonden dat wij het boek niet aan studenten hadden moeten uitlenen omdat die het zelf moesten kopen en verplicht waren het altijd bij zich te hebben. Die regel achtten ze niet op zichzelf van toepassing. Misschien arbeidsrechtelijk correct, maar ik vind het de omgekeerde wereld. Uiteindelijk is het allemaal gelukkig gesust, maar ik vind het wel getuigen van een enorme krenterigheid van de kant van de docenten. Het rare van een bibliotheek is dat die het eigenlijk nog tot de kerntaken beschouwt om hierin mee te gaan. Gelukkig behoort het maar tot een heel klein percentage van de dienstverlening zodat er geen verdergaande conclusies aan verbonden hoeven te worden. Zelf koop ik sinds ik ooit begonnen ben met studeren de meeste verplichte literatuur en soms ook wat er omheen. Die bewaar ik dan vaak ook nog. Zou ik dan toch een beetje een bibliofiel zijn?

Baliewerk

7 May, 2008 (20:55) | Bibliotheek | By: brughagedis

Het is hier even een paar dagen wat rustig geweest. De voornaamste reden was natuurlijk de zes vrije dagen die nu helaas weer voorbij zijn. De verleiding was te groot om weer even uit te proberen hoe het ook alweer was zonder al dat geblog en gespoetnik ‘s avonds tot na twaalven. Ik vond het leuk hoor, maar het was ook erg veel werk. Ik behoorde tot de 24,3 % uit Laika’s enquete die uren, nee dagen met Spoetnik bezig was en geen eigen leven meer had. Maar de belangrijkste reden was een andere, nl. dat ik even wat tijd heb besteed aan het afvoeren van een aantal computers en alles wat daarmee samenhing. Zo eens in de zoveel tijd moet je je huis een beetje opruimen en bij mij is dat vaak als ik vrij heb. En het neemt meestal meer tijd in beslag dan je verwacht. Bij elkaar heb ik zo’n 120 kilo afgevoerd: twee servers, een zware laserprinter en een Powermac. Er blijken dan natuurlijk altijd problemen met de computers die je als opvolger had gedacht en die moeten ook opgelost. Het uit elkaar slopen zelf vind ik een heerlijk rustgevende bezigheid, die ik soms ter ontspanning doe. Voorlopig heb ik nog voldoende voorraad…

Proliant in staat van ontbinding

Eigenlijk had ik me voorgenomen om op het werk weer wat over onderwerpen voor het bloggen na te denken, maar door omstandigheden is het er nog niet zo van gekomen. Dat komt misschien doordat ik nu al weer twee dagen de hele dag baliewerk doe. Je bent dan vrij veel tijd kwijt met het oplossen en beantwoorden van vragen en problemen van anderen en je hebt minder tijd voor je eigen bezigheden. De tijd om even wat op internet op te zoeken of over iets na te denken ontbreekt. Aan de andere kant betrap ik me er ook wel op dat baliewerk mogelijkheden biedt om in je eigenlijke werk een beetje te pauzeren. Als je even geen zin hebt om na te denken ga je gewoon even het papier in de printer bijvullen, je zet wat boeken terug in de kast of je gaat wat kletsen met collega´s. Teveel afleidingsmogelijkheden dus eigenlijk.

Maar is baliewerk daarom slecht voor de creativiteit? Nee hoor, ik doe er telkens ook weer inspiratie op door de contacten met studenten, medewerkers en andere bezoekers. In zekere zin komt daar ook dit verhaaltje misschien ook weer uit voort. Maar het beste is als je de verschillende werkvormen in de bibliotheek een beetje met elkaar kunt combineren. Dat kan bij ons gelukkig nog steeds.

Bier

29 April, 2008 (11:03) | Bibliotheek | By: brughagedis

Heel toepasselijk met het oog op morgen gaat de eerste scriptie die ik in UvA Scripties Online heb ingevoerd over Bubbels in Bier. Zou het onderwijsinstituut dit zo hebben uitgekozen?

Databases

28 April, 2008 (21:19) | Bibliotheek, Technopraat | By: brughagedis

Samen met een collega heb ik vandaag de bibliotheek open gehouden. Het was vrij rustig, in totaal kwamen er denk ik zo’n 50 studenten langs om op de studieplekken te werken of te studeren en enkele medewerkers en studenten met vragen over ibl en het aanvragen van een lenerspas. Een groot deel van de tijd kon ik mij dan ook met mijn databases bezighouden, want daarin moeten de recente gegevens van de collectie Logica worden toegevoegd. Het gaat in totaal om ongeveer 2600 titels waar het afgelopen jaar zo’n 12 nieuwe zijn bijgekomen, zo’n 20 zijn verwijderd en waarvan een deel van de signaturen is aangepast. Met het toevoegen van dat vrij geringe aantal mutaties ben ik nu alweer een paar dagen bezig. Dat komt niet alleen omdat de uitdraai van de centrale UB eerst vertaald moet worden in bruikbare gegevens, maar ook doordat alle gegevens het hele proces van invoeren in het eerste bestand tot en met uitvoer naar de diverse werkbestanden moeten doorlopen. Het is alsof je voor het doorsmeren van de auto eerst de motor uit elkaar moet halen, dan pas een blik olie in het carter kunt gieten en vervolgens de moter weer onderdeel voor onderdeel in elkaar moet zetten. Dat begint nu een beetje onhandig te worden. Het probleem ontstaat doordat je niet alleen nieuwe gegevens wilt toevoegen, maar ook de oude het liefst wilt bewaren. Dat betekent dat je velden voor elk jaar moet herhalen. Als de tabellen in zo’n database dan uit 25 of meer velden bestaan, worden dat er al snel erg veel. Om dit op te lossen is het relationele database model uitgevonden, waarin alle gegevens zijn opgenomen in tabellen die zijn opgebouwd uit rijen en kolommen. Elke rij bevat de feitelijke gegevens van een onderdeel (bijvoorbeeld een boek) of record en de kolommen geven de verschillende soorten gegevens (titel, auteur, isbn, uitleningen) aan. Door elke rij een uniek identificatienummer te geven kunnen gegevens uit verschillende tabellen met elkaar worden gecombineerd. Op dit moment zijn mijn tabellen gerelateerd middels het unieke exemplaar produktie nummer (epn) en worden verder onderverdeeld volgens de selectiecriteria en de afzonderlijke collecties. Voor elk nieuw jaar maak ik gewoon een nieuwe database, of eigenlijk een verzameling databases. Maar het kan waarschijnlijk intelligenter door binnen elk bestand voor elk jaar afzondelijke tabellen met gegevens  te maken.

Relaties

Een tweede probleem is dat de tabellen in de verschillende databases niet gelijk opgebouwd zijn en de namen van de kolommen soms verschillen. Dat is tijdens het bouwen zo ontstaan. Maar dit blijkt nu lastig bij het overbrengen van gegevens van het ene bestand naar het andere waardoor veel handmatige aanpassingen nodig zijn. Waarschijnlijk is de enige oplossing hiervoor alle tabellen nog eens goed te bekijken en ze zoveel mogelijk gelijk maken.

Omdat het direct aanpassen van het systeem de boel enorm zou vertragen moet ik bekijken of ik deze verbeteringen geleidelijk kan doorvoeren. De ervaring leert dat als je er eenmaal aan begint het vaak vrij snel gaat. Dus dat hoop ik dan maar.

AV-perikelen

15 April, 2008 (21:07) | Bibliotheek, Onderwijs | By: brughagedis

De zaal waar wij gisteren de biblibliotheek instructie gaven blijkt dus te beschikken over een zeer geavanceerde nieuwe AV-ICT-voorziening die vorig jaar zomer in 61 collegezalen is aangelegd. In dergelijke collegezalen bevindt zich een mediakast met een dvd/cd-speler, videorecorder, microfoonaansluiting, pc (met standaard software en internetverbinding) en aansluiting voor laptop. Daarnaast zijn in alle zalen met een mediakast standaard een beamer en een groot projectiescherm geïnstalleerd. In de mediakast is een remote control panel waarmee via de intercom contact opgenomen kan worden met het facilitair centrum om problemen op te lossen. Er is zelfs een filmpje (alleen zichtbaar binnen uva-domein) over de bediening van de mediakast.

Instructiekaart

Dit alles is ons dus geheel en al ontgaan. De pc zonder beeldscherm met zijn te korte toetsenbordsnoer werd al snel gediskwalificeerd als onbruikbaar. Daarom haalde ik uit de bibliotheek een laptop die gelukkig beeld gaf op de beamer. Behalve dat hij na vijf minuten automatisch updates begon te installeren en moest worden herstart, ging dat allemaal goed. De docent gebruikte zijn eigen Powerbook. Ik gebruikte de laptop voor mijn verhaal over Web of Science, waarbij ik via wireless live kon zoeken. Ik vind dat altijd wat levendiger dan alleen een powerpoint. Het ging dus goed tot ik bij het laatste onderdeel EndNote wilde laten zien hoe je het Ris-filter uit de Digitale Bibliotheek kunt toevoegen, toen bleek EndNote niet op de laptop geïnstalleerd. Vervolgens ontstond er een soort samenspraak voor twee heren waarin achtereenvolgens alle mogelijkheden werden uitgeprobeerd. De studenten keken toe, gaven advies en werden steeds luidruchtiger. Geen van de drie uitgeprobeerde laptops was goed, of hij gaf geen beeld, of hij had geen endNote of geen netwerkverbinding. Inloggen op de pc in de mediakast lukte niet, mogelijk door een verouderde login. Ik besloot dan ook maar EndNote te laten vallen en met de studenten naar een andere ruimte te gaan voor het maken van opdrachten. Maar ik had wel de pee in.

Achteraf gezien waren er toch wel mogelijkheden geweest om een presentatie over EndNote te doen, waaronder de demo uit de DB te gebruiken. Die had ik zelfs van tevoren gedownload. Maar op het moment zelf ben je zo gefixeerd op de oplossing van zo’n computerprobleem dat het gewoon niet in me opgekomen is. Dat is dan ook een beetje het probleem; wij geven zo onregelmatig les dat je nooit echt in een routine komt en we hebben geen vaste ruimte. Het is elke keer wat anders. Daarom kun je het beste toch een eigen laptop meenemen waarop van tevoren alles is uitgeprobeerd. Maar eigenlijk is dat wel vreemd, want er is vast heel veel geinvesteerd in die apparatuur. Kennelijk is het dan toch nog mogelijk dat we dat niet herkennen. Ik moest wel enorm lachen toen ik daar vanmiddag achter kwam…

Droog repeteren

13 April, 2008 (17:46) | Bibliotheek, Onderwijs | By: brughagedis

Sinds een paar dagen oefen ik weer elke avond hardop mijn gedeelte van de bibliotheekinstructie staande voor een computer thuis. Ik vertoon de presentatie en verricht ik alle zoekhandelingen die ik in de echte presentatie wil laten zien. Dat werkt bij mij goed, want daardoor kom ik zwakke onderdelen op het spoor en kan ik een goede manier bedenken om dingen te zeggen. Ook leer ik het daardoor een beetje uit het hoofd en verloopt het denk ik vlotter als ik het echt moet doen. Maar het kost alleen wel veel tijd. Samen met het maken van je presentatie, het bedenken van de opdrachten en een soort informatieblad ben je er zoveel tijd aan kwijt dat het misschien ten koste gaat van de inhoudelijke voorbereiding. Dus misschien moet ik het er een keer op wagen, iets zonder voorbereiding te doen. Gisteren hoorde ik Harry Mens op de radio zeggen dat hij voor de uitzending alleen maar de stukken geconcentreerd leest en dan komt het er op het moment zelf vanzelf uit. En in het Bureua las ik dat de hoofdrolspeler verbaasd is over wat er vanzelf allemaal in hem opkomt als hij iets en plein publiek moet zeggen. Maar ik heb een paar ervaringen waarin dit grondig mis is gegaan, vandaar dat ik nog maar blijf oefenen.

Voor de computer Voor de computer

Nadat ik deze foto’s had gemaakt, bleek de digitale camera het plotseling begeven te hebben. Kortsluiting met de USB-hub? Het is een HP Photosmart M22 en op het web wemelt het van de slechte ervaringen met dit type. Hij was erg goedkoop en maakte vrij goede plaatjes (4 Mp), maar koop hem nooit! Ander modellen van HP zijn waarschijnlijk wel goed, hoor. Een tochtje naar de Paradigit op zondagmiddag leverde voor 10 euro een MSI StarReader op waarmee de geheugenkaart kon worden uitgelezen. En zo kon ik de foto’s toch nog plaatsen. Ik vraag me alleen af waarom de dingen die je nodig hebt altijd stuk gaan en de dingen die je nooit gebruikt het eeuwige leven lijken te hebben?

Mijn presentatie heb ik geplaatst op http://www.slideshare.net/. Dan kun je hem zelfs embedden in een blog. Alleen ik kon hem niet volledig uploaden omdat er dingen uit de handleiding van ISI Thompson in verwerkt zijn, die ik er maar uit heb gehaald i.v.m. copyright. Daardoor is de presentatie nu erg kreupel. Het is wel erg leuk dat Web 2.0, maar als je echt een Web 2.0 mens wilt zijn moet je alles zelf doen: tekst, foto’s, cartoons, alles weten  en nu ook nog powerpoints. Dat vergt veel van je creativiteit. Maar voor een volgende keer is shareslide zeker een ontdekking.

 

Stopwoordenlijsten

8 April, 2008 (21:01) | Bibliotheek, Onderwijs | By: brughagedis

Net als Laika ben ik bezig met een stopwoordenlijst, nl. die van Web of Science. Voor de bibliotheekinstructie probeer ik daarmee een opdracht te maken met voor de hand liggende zoektermen, waar dan gek genoeg niets uitkomt. Daar ben ik op gekomen tijdens een bijeenkomst met de vertegenwoordiger van ISI Thompson vorig jaar toen hij uitleg kwam geven over de nieuwe versie. We wilden toen de publicaties zoeken van een bekende sterrenkundige aan de UvA die heel veel gepubliceerd heeft en die van der Heuvel heet, maar we  vonden niks. Tot Derrick (of hoe hij ook alweer heette)  zich realiseerde dat der een stopwoord is. Je kunt op van der heuvel zoeken met van * heuvel in het author-veld. Toen kregen we meer treffers, en bleek hij van den Heuvel te heten. Lag dus niet aan de stopwoordenlijst, maar aan een foutieve zoekterm. Toch moet er iets te verzinnen zijn wat leuk is om aan studenten te demonstreren. Helaas zit er niet zoiets moois in als abortion in het POPLINE van Laika, whatever that me be? Maar ik zou bijvoorbeeld als zoektermen studies about discussion making kunnen nemen. Dan vind je geen treffers. Als je in het adres-veld Amsterdam erbij zet krijg je meer dan 5000 treffers. Hoe kan dat? Worden dat soort studies allen in Amsterdam gemaakt? Nee alle termen in de zoekstring zijn stopwoorden. Door Amsterdam erbij te zetten krijg je alle treffers van titels uit Amsterdam, maakt niet uit over welk onderwerp. De stopwoordenlijst van Web of Science is heel omvangrijk en zit een beetje verscholen in de Help-functie. De meeste andere databases hebben ook stopwoordenlijsten en in blogs kunnen stopwoorden van de tagcloud uitgesloten worden. Ook zoekmachines negeren bepaalde veel voorkomende woorden vaak omdat ze de zoekopdracht vertragen, terwijl ze niets bijdragen aan een beter zoekresultaat. Via de Wikipedia-bladzijde over stopwords kwam ik ook op de website van het Snowball-project met een demo-applicatie waarmee je Engelse woorden kunt inkorten tot hun stamvorm. Bestaat kennelijk al heel lang, maar nooit eerder gezien. Met dit soort lijsten optimaliseren zoekmachines hun zoekresultaten doordat ze automatisch ook varianten van een term meenemen.


View Stats