donderdag 3 februari 2011

Metadata: belang, inleiding en hoe ermee om te gaan

Wanneer binnen een organisatie al gebruik wordt gemaakt van een echt Document Management System, zullen de eindgebruikers al gewend zijn aan het gebruik van meta gegevens. Anders is het wanneer een organisatie gewend is aan documenten op te slaan op een gezamenlijke fileserver. Gebruikers zullen in het laatste geval weleens geconfronteerd zijn met "Document eigenschappen" (Document Properties) binnen Office documenten, en wellicht zijn deze document properties gevuld en gebruikt om binnen het betreffende document velden van waarde te voorzien.

Het belang van metagegevens gaat echter veel verder dan het vullen van documentvelden, en dat heeft alles temaken met vindbaarheid van documenten. Vindbaarheid van documenten is namelijk heel belangrijk en wordt binnen organisaties steeds lastiger.

Wat is namelijk het geval?
De "hoop" documenten die organisaties produceren wordt namelijk in en steeds groter tempo groter. Daarbij veranderen organisaties steeds sneller, denk hierbij aan fusies, splitsingen, interne reorganisaties, maar ook aan personeelswisselingen, projecten en programma's (de laatsten zijn tijdelijke organisaties). Iedere organisatorische verandering laat zijn sporen (lees: documenten en documentatie standaarden) achter. En de juiste versies van (vooral oudere) documenten vinden, gebruiken, aanpassen en uiteindelijk weggooien, wordt dan ook steeds lastiger. Gebruikers willen hun werk gedaan krijgen en in dat streven wordt het hogere belang van vindbaarheid van documenten voor de organisatie in zijn geheel nog weleens uit het oog verloren.

Een paar voorbeelden:
- Een kopie van een document met oude metadata gebruiken in plaats van een officieel sjabloon met nieuwe metadata;
- Mappen met oude documenten niet verwijderen omdat onzeker is of de documenten nog in gebruik zijn;
- Geen afspraken maken over documenteren (sjablonen, mappenstructuren, et cetera), maar het wiel in ieder project, afdeling, et cetera, opnieuw uitvinden.

Naast deze toenemende "hoop" documenten worden de eisen die gesteld worden aan de kwaliteit van de informatie, en aan de werkzaamheden die met ondersteuning van deze documenten gedaan moeten worden, steeds hoger. Denk hierbij aan toenemende ambities en dynamiek van organisaties, maar ook van de toenemende hoeveelheid en zwaarte van richtlijnen en standaarden (compliancy).

Bovengenoemde ontwikkelingen zorgen voor een toenemende eis om documenten doeltreffend (juiste versie van het juiste document) en doelmatig (zo min mogelijk zoekstappen) terug te vinden.

Zoekstrategieen
Grofweg kunnen de volgende zoekstrategieen naar documenten worden onderscheiden:
Zoeken via een vaste structuur: documenten zijn opgeslagen in een vaste, van te voren afgesproken, structuur (b.v. mappenstructuur op een fileserver);
Zoeken van woorden de gehele tekst van documenten (zogenaamde Free Text Search of Full Text Search, b.v. "HansR" in de gehele tekst van artikelen);
Zoeken op basis van metagegevens: zoeken van documenten door te zoeken op waarden van metadata velden (b.v. auteur = "HansR on the Web".

Zoeken via een vaste structuur
Hiervoor zijn goede afspraken nodig om de structuur op te zetten, te onderhouden en te gebruiken. Wanneer een vaste structuur wordt gebruik voor bijvoorbeeld projecten, met vaste mappen voor plannen, dan zullen eindgebruikers de juiste documenten relatief gemakkelijk terug kunnen vinden. Wanneer geen duidelijke en/of gedragen afspraken zijn gemaakt voor het gebruik van een dergelijke structuur, of als de structuur niet gebruiksvriendelijk (lees: te diep, groot, dynamisch, inconsequent opgebouwd) genoeg is, zal een vaste structuur er niet voor zorgen dat documenten doeltreffend en doelmatig gevonden kunnen worden.

Zie Mappen in lijsten en documentbibliotheken: wel of niet gebruiken? voor meer informatie over het gebruik van mappen binnen SharePoint.

Free Text Search of Full Text Search
Bij deze vorm van zoeken wordt naar zoektermen gezocht in de gehele documenten. Hierbij wordt geen rekening gehouden met context (wat is de betekenis van een woord in een zin), taal, synomiemen, homoniemen, et cetera. Deze vorm van zoeken levert
vaak (veel) meer irrelevante documenten op dan gewenst en vormt daarom vaak een ondoelmatige manier van vinden.

Zie Wikipedia: Free Text Search voor meer informatie.

Zoeken op basis van metagegevens
Dit is de meest doelmatige en doeltreffende vorm van zoeken. Bij deze vorm van zoeken wordt gezocht op waarden van metadata velden, waarbij duidelijk is wat ieder veld betekent en welke waarden het mag bevatten. Hierbij zal ieder document moeten worden voorzien van een goede omschrijving, in de vorm van een aantal metadata velden: de metadata set (b.v. Auteur, Titel, DatumUitgifte, Status).

Zie ook: Wikipedia: Metadata.

Op basis van een goede set meta gegevens kunnen zoekstructuren gegenereerd worden. Denk hierbij bijvoorbeeld aan een boomstructuur van documenten, eerst gegroepeerd op auteur, daarna op datum, daarna op titel.

In SharePoint (2007, 2010) worden metadatasets "ContentTypes" genoemd. Binnen SharePoint zijn een aantal ContentTypes gegeven (b.v. Dublin Core, zie: Wikipedia: Dublin Core), welke aangevuld kunnen worden met eigen ContentTypes.
In SharePoint 2010 kunnen, op organisatieniveau, taxonomieen worden gedefinieerd die als basis kunnen dienen voor keuzevelden.

Uitdagingen in het gebruik van metadata velden (sets) zijn:
- Goede afspraken gemaakt moeten worden over welke metadatavelden (set) nodig is om een bepaald document voldoende te beschrijven;
- Metadata velden vaak handmatig moeten worden toegevoegd aan documenten. Soms kan dit echter automatisch (b.v. het aantal pagina's in een document) gebeuren.

Conclusie tot nu toe: metadatering is van groot belang voor het doeltreffend en doelmatig kunnen terugvinden van documenten, maar kent een aantal uitdagingen.

Bovenstaande uitdagingen zijn reeel, er zal actief en continu over nagedacht moeten worden om documenten vindbaar te maken en te houden.

Hieronder een aantal tips en valkuilen:

Vaststellen van metadatasets is een kwestie van afspraken maken. Wanneer een organisatie al standaarden op dit gebied heeft is het verstandig hier al gebruik van te maken. Wanneer sprake is van meerdere standaarden of geen standaarden is het van belang te beginnen met een gedragen, praktische, minimale set van metadata velden. Een simpel voorbeeld van het voordeel van een gedragen set: gebruik van een vaste lijst met organisatie onderdelen voor bijvoorbeeld een metadata veld dat beschrijft in welk onderdeel een document is gemaakt. Een ander voorbeeld: de documentstatus (draft, concept, final).

Na vaststellen van een metadataset zal deze ook onderhouden moeten worden. Lijsten met veldwaarden zijn zelden hetzelfde tot in de eeuwigheid. In het bovenstaande voorbeeld zal een lijst met organisatieonderdelen na reorganisatie aan verandering onderhevig zijn. Zaak is dus het onderhoud van bijvoorbeeld dergelijke lijsten goed te beleggen: in goed overleg aanpassen en deze lijsten zo gemakkelijk mogelijk herbruikbaar te maken. Let hierbij ook op de gevolgen van deze veranderingen in bestaande documenten, de gevolgen voor (lopende) werkstromen (worden deze beinvloed door wijzigende metagegevens?) en communicatie over de veranderingen aan de eindgebruikers.

Zie hiervoor ook bijvoorbeeld de praktische tips in: Keuzelijsten in metadata velden.

Metadateren kost minimaal "extra werk", maar kan ook een cultuurverandering zijn binnen een organisatie
Het rucksichtlos "dumpen" van bestanden en folders vanaf de fileserver in SharePoint bibliotheken, zonder metadatering, is onverstandig. Niet alleen is het voor eindgebruikers in SharePoint lastiger te navigeren in een een bibliotheek dan in de vertrouwde filemappen structuur, de kracht van SharePoint zit 'm erin dat door gebruik te maken van metadata velden, meerdere weergaven op dezelfde documenten mogelijk is. Hierdoor kan de eindgebruiker sneller de documenten "uitfilteren" die hij nodig heeft. Daarnaast kunnen goed gemetadateerde documenten doeltreffender en doelmatiger via de SharePoint zoekmachine teruggevonden worden.

Zie Mappen in lijsten en documentbibliotheken: wel of niet gebruiken? voor meer informatie over het gebruik van mappen binnen SharePoint.

Metadateren kost echter extra moeite, die de eindgebruiker wellicht niet gewend is te besteden of niet wil besteden. Van belang is dus daaraan belang te hechten (organisatie breed belang), hiervoor tijd voor te reserveren en dit in te bedden in de vaste handelingen hoe met documenten wordt omgegaan (b.v. in de vorm van werkinstructies, training). Dat laatste is van het grootste belang: toevoegen van kwaliteit moet onderdeel zijn van het dagelijks werk.

Wat betreft deze kwaliteit en de training die daarbij hoort is het ook van belang te realiseren dat het het metadateren van documenten een zekere mate van interpretatie kent: wanneer is een document draft en wanneer een concept? Van welke trefwoorden zou een artikel voorzien moeten worden?

Conclusie: metadateren is van groot belang, maar kost wellicht meer moeite dan gedacht. Deze moeite kan gezien worden als investering in een betere vindbaarheid van documenten en een betere samenwerking (en hieruit volgende standaardisatie) op het gebied van Document Management. En dat laatste wordt, gezien de toenemende aandacht aan compliancy, de komende jaren steeds belangrijker.

Meer lezen?
De onderstaande links verwijzen naar aanvullende en gerelateerde onderwerpen.

Content Types en kolommen in Site Collecties en Subsites: hoe werkt het, en valkuilen, tips en truuks
Keuzelijsten in metadata velden: keuzelijsten, externe lijsten of standaard lijsten?
Mappen in lijsten en documentbibliotheken: wel of niet gebruiken?


Geen opmerkingen:

Een reactie plaatsen