Välkommen. Den här bloggen är ett pågående projekt att skapa en effektiv handbok i hur man kan använda internet som demokratiskt verktyg. Klicka här för senaste nytt.

lördag 6 december 2008

Boolesk söklogik

Hur hittar man egentligen på internet? För ovana användare kan mängden information som uppenbarar sig när man använder en sökmotor inge en vilja att ge upp och bara somna på tangentbordet. Det är inte annorlunda för en van internet-användare om denne dristar sig till att göra en enkel sökning.

Det är då detta sökmotorernas mirakel Booleska operatorer kommer in.

Vad är booleska operatorer då? Det är termer och tecken som kan användas till att göra en sökning betydligt mer specifik. Dessa är i sin enklaste form utformade som ord som definierar sitt syfte. And (och) Not (inte) och Or (eller). Jag tar ett exempel från min egen inlärningstid på internet, när jag precis att hade börjat utforska detta informationsstinna medium.

Jag tycker kattdjur är vackra, just då var svarta pantrar favoriten. Så jag sökte med orden svarta och pantrar. Allt jag hittade var information om någon organisation som kallas Svarta pantrarna och som sysslar eller sysslade med färgades rätt i USA, samt sida efter sida om ishockeylag, basketlag, bandylag och så vidare. Det var först när jag lärde mig om Booleska operatorer som jag hittade bilderna jag eftertraktade på de vackra kattdjuren. Booleska operatorer låter mig nämligen tvinga sökmotorerna att inkludera eller exkludera ord. När jag sökte på Svarta Pantrar, lade till operatoren som motsvarade NOT i just den sökmotorn och därefter skrev Sport så blev mina sökningar mycket mer lyckade. Operatoren NOT framför ordet Sport gör alltså så att ingen sida som innehöll ordet Sport kom med bland sökresultaten. AND tvingar in ordet och OR innebär att man får träffar som innehåller ett av orden, men inte båda. En sökning med mer än ett sökord och avsaknad av operatorer ger alltså träffar på alla dokument som innehåller ett eller flera av orden. Om man söker med orden kanin, huggtänder, helig handgranat, får man alltså upp alla sidor som innehåller endast ordet helig, alla som innehåller helig och handgranat, alla som innehåller ordet kanin, och så vidare. En himla massa sidor med andra ord. (För alla som inte sett Monthy pytons Jakten på den heliga Gralen så är det bäst att jag påpekar att "Helig handgranat" syftar på kungaäpplet som Kung Arthur använder i sagda film för att skrämma bort en galen mördarkanin med, och inget annat.)

Nu använder inte de flesta sökmotorer Booleska operatorer i sin grundform.

Google använder plustecken direkt framför sökordet utan mellanslag för att tvinga in ett ord, plustecken ersätter AND. Minustecken ersätter NOT. Man kan även söka efter dokument med ord i sekvens genom att använda sig av citationstecken. Att skriva "Svarta pantrar" ger således bara träffar där orden svarta och pantrar står intill varandra. Detta går dessutom att använda i kombination med plus och minus. -"Svarta pantrar" filtrerar således ut alla träffar där svarta och pantrar står bredvid varandra, men släpper igenom dokument där orden förekommer var för sig.

Så skriver du såhär: +"svarta pantrar" -ishockey reservat, så kommer då att få träffar där orden Svarta pantrar står bredvid varandra som inte handlar om ishockey och som både saknar och innehåller ordet reservat. Träffar som innehåller ordet reservat brukar i regel hamna högst upp i listan över träffar, dock.

Ett ytterligare trick som man kan använda är att använda * när man inte är säker på ett helt ord eller vill få träffar som inte begränsas av ordets böjning. Om jag söker på Pant* så kommer jag få träffar på dokument som innehåller orden Panter, pantrar, pantrarna och så vidare. Nackdelen är att jag även kommer få träffar på sidor om underkläder (panties) byxor (pants) och flaskåtervinning (panta), med mera.

Google har utöver booleska operatorer ett sätt att söka bara i en (1) hemsida. Om du vill söka på alla dokument på sidan www.exempel.com skriv till exempel; site:www.exempel.com Sökelisökord +Etttillsökord -Osöktsökord. Om du skriver site:www.exempel.com först i sökningen kommer google alltså söka igenom alla dokument på www.exempel.com och bara dokument på www.exempel.com. Om du vill använda denna funktion på den här bloggen skriver du site:detdemokratiskaverktyget.blogspot.com, men om man bara söker på ett ord som förekommer som titel i indexet kommer dock alla sidor på bloggen att visas, eftersom indexet syns bredvid alla inlägg och kapitel.

Booleska operatorer är ett kraftigt verktyg, men det kräver ofta att man pusslar lite med användningen och orden. Det är lättare att hitta information om ett ämne om man sätter sig in i ämnets terminologi. Man ska också vara medveten om att man kan missa saker som är intressanta när man tvingar sökmotorn att ignorera vissa ord.

Dokumentsökmotornwww.riksdagen.se använder OCH, INTE , NÄRA, citationstecken på samma sätt som Google och * som Booleska operatorer. Operatorerna är självbeskrivande och måste skrivas med stora bokstäver, man ska ha mellanslag mellan operatorn och ordet. NÄRA ser till så att man bara får träffar där orden som man använt NÄRA mellan i sökningnen är högst sex ord från varandra. Är man dessutom osäker på stavningen av namn eller liknande kan man ersätta en bokstav med ett frågetecken. (?) Om man till exempel är osäker på om ett namn stavas med ett eller två s så är det bättre att skriva *. Ex: Johan*on.


Sökmotorer <<< Föregående kapitel
Innehållsförteckning
Nästa kapitel >>> Terminologi

0 kommentarer: