Sökmotor

Synnerligen intressant om Sökmotor


Sökmotormarknadsföring

Sökmotormarknadsföring är aktiviteter som syftar till att synliggöra ett företag på sökmotorer. Sökmotoroptimering innefattar processer och aktiviteter som får hemsidan synas bland de organiska resultaten – alltså att sökmotorn anser att företagets sidan är den mest relevanta för en given sökning. Sökmotorannonsering innebär å andra sidan att man köper annonsplats för att synliggöra företaget på sökmotorer. Detta betalas t.ex. per klick (PPC) eller per tusen visningar (CPM).

Söktjänst

En söktjänst (sökmaskin) är en tjänst som kan söka igenom innehåll på bland annat internet med hjälp av enstaka ord, en fras eller en fråga. Söktjänsterna använder sökmotorer, även kallade sökrobotar, för att upptäcka, hämta in och indexera webbsidor. Den första sökmotorn hette "Archie", kort för arkiv på engelska, och skapades 1990 av Alan Emtage. Ofta kallas söktjänsterna för sökmotorer, men år 2007 uppmanade Svenska datatermgruppen till att skilja på begreppen. Sökmotorn är en väsentlig del av varje söktjänst, men en välbesökt söktjänst lägger mer resurser på att besvara sökfrågor än på att samla in webbsidor. Söktjänster kan användas för att söka efter webbsidor, nyheter, meddelanden i diskussionsgrupper, skrivna dokument av andra typer (vanligen PDF, Microsoft Word, Powerpointpresentationer och liknande) och bilder. I en söktjänst kan användaren mata in ett eller flera sökord, en fras och ibland även en fråga i sökfältet, varvid söktjänsten presenterar resultatet av sökningen. Resultatet visas oftast i form av en lista över de filer eller sidor som innehåller eller beskrivits med sökordet eller sökorden, oftast tillsammans med dokumentets titel och en del av innehållet eller en miniatyrbild. Söktjänsten kan även hänvisa användaren direkt till det första dokumentet i resultatlistan. Det finns också sökmotorer som är specialiserade på att söka efter nyheter, video, bilder och ljud. Nyhetssöktjänster såsom Google News sammanställer nyhetsartiklar från tusentals nyhetsmedier världen över. Google Bilder och Picsearch är specialiserade på sökning efter bilder. Sociala söktjänster drar nytta av användarbasen för att finna svar. Ett exempel på en numera nedlagd social söktjänst är Aardvark. Rekommendationssystem förutsäger vad användaren borde uppskatta i stora informationsmängder, baserat på vad systemet vet om användaren. Denna typ av informationsfiltrering hjälper användaren att hitta intressant information, ofta utan att en explicit sökning behöver göras. Söktjänsterna använder internt en sökmotor eller sökrobot för att upptäcka, hämta in och indexera webbsidor. Sökningen utförs sedan i detta index, ungefär som när man slår upp ett ord i det alfabetiska registret baktill i en bok. Det skulle nämligen bli alldeles för långsamt att söka direkt i de berörda webbsidorna. Det första verktyget för att indexera innehåll på Internet var FTP-sökmotorn Archie. Archie utvecklades 1990 av Alan Emtage, en student vid McGill University i Kanada. 1992 och 1993 kom därefter två sökmotorer för Gopher-protokollet, Veronica respektive Jughead. Den första webbsöktjänsten var "Wandex", ett nu icke-existerande sökindex samlat av WWW Wanderer, en sökmotor som utvecklades 1993 av Matteus Gray vid MIT. En annan tidig sökmotor, Aliweb, framträdde likt Wandex också 1993 och finns kvar. Yahoo! startade sin söktjänst 1994, året innan det blev ett företag. Det var den första stora sök­bara för­teckningen över webb­sidor. Förmågan att upptäcka och indexera alla webbsidor har uppfattats som svårigheten med uppbyggnaden av webbsöktjänster. Flera gånger har det föreslagits att webbutvecklarna själva skulle bidra till processen genom att anmäla sina webbplatser och nya webbsidor och förse dem med "metadata" som beskriver innehållet. Den första söktjänst som strävade efter att omfatta hela webben var Altavista som lanserades 1996 och senare övertogs av före detta konkurrenten Yahoo!. Altavista började som en webbkatalog och portal men utvecklades till en ledande söktjänst. Söktjänsten Google lanserades 1998 och växte snabbt till att bli den dominerande söktjänsten för webbsidor. Microsofts Bing, som 2009 ersatte Microsofts tidigare söktjänst Live Search, har däremot inte fått det genomslag som mjukvarujätten hoppats på. Från 2009 levererar Bing även sökresultat till Yahoos söktjänst. En rad mindre generella, lokala eller specialiserade söktjänster finns också tillgängliga.

Språkteknologi

Språkteknologi, datorlingvistik eller datalingvistik, ibland även NLP (engelska: natural language processing (NLP)), är ett tvärvetenskapligt forskningsområde som omfattar utveckling av datorprogram för att analysera, förstå eller generera mänskligt språk, och även modellering och simulering av mänskligt språkligt beteende med hjälp av datorer. Målet med språkteknologi är att förenkla och förbättra kommunikationen mellan människor och mellan människor och datorer. I detta ingår också alla hjälpmedel som ett datorsystem erbjuder en skribent för att uttrycka sig bättre i tal eller skrift, liksom en del verktyg som hjälper människor att prata med eller skriva till varandra via en dator. Språkteknologi utgörs av både tekniker och språkresurser (olika slags data- och textsamlingar, t.ex. korpora eller korpusar, enspråkiga eller flerspråkiga lexikon, ordböcker, termbanker, taldatabaser osv). Teknikerna tar form som programvara, medan resurserna är den information som programvaran utnyttjar. Språkteknologi bygger på kunskaper inom lingvistik, fonetik, datavetenskap, statistik, artificiell intelligens och kognitiv psykologi. På senare år har ämnet influerats starkt av statistiska metoder och maskininlärning. Intresset för multimodal kommunikation där gester, icke-språkliga symboler och bilder finns tillsammans med text eller tal eller kompletterar den språkliga signalen har också ökat. Denna processmodell finns i olika varianter, där inte nödvändigtvis alla delar ingår. Dessa områden överlappar delvis – många av dem använder liknande tekniker och komponenter. att föra in material i datorn, med hjälp av tal eller text, eller manuellt vid ett tangentbord. att tolka det införda materialet, uppdela det i exempelvis enskilda ord, eller koda materialet i symbolisk form. att förstå materialet, anpassat till behovet i den enskilda tillämpningen. att bruka denna förståelse till att t.ex. överföra tal till text, rättstava och avstava, översätta, eller leta efter information. att presentera resultatet på en bildskärm, i en högtalare eller på papper. informationshantering omfattar informationssökning med hjälp av mänskligt språk, både lokalt i t.ex. ett register, på Internet eller på stora textdatabaser. Hit räknas både problem som har att göra med hur frågor ställs, hur informationen lagras, hur sökning sker och hur svaren presenteras. Informationssökning innebär att information i datorlagrad form söks ut med hjälp av olika tekniker, verktyg (sökmotorer) och teknologier (söktjänster). Söktjänsterna använder sökmotorer, även kallade sökrobotar, för att upptäcka, hämta in och indexera webbsidor och gör det möjligt att söka efter innehåll på Internet. textanalys handlar om hur datorn kan tolka texter, förstå vilka grammatiska och kontextuella funktioner olika ord fyller och representera en texts innebörd på ett internt format. Hit hör teknologier som informationsextraktion eller informationsutvinning, textsammanfattning och textgenerering: informationsextraktion som innebär att ur en text plocka ut och strukturera de viktigaste innehållselementen enligt på förhand givna regler så att innehållet kan läggas i en databas eller i formulär. informationsutvinning som innebär att från stora mängder text och andra data aggregera återkommande mönster och samband. textsammanfattning som innebär att från en eller flera texter formulera en läsbar text som är en sammanfattning av innehållet. åsikts-, värderings- eller attitydanalys. talteknologi handlar om att datorn läser upp en text eller förstår talat språk för t.ex. diktering eller för att lyssna på kommandon eller för att kunna tolka talat mänskligt språk till text eller annan användbar information, till exempel i talsvarssystem eller telefontaltjänster. dialogsystem innefattar datorprogram som gör att man föra en mer eller mindre naturlig dialog med en dator, på svenska, engelska eller annat naturligt språk.

Skärmsläckare

En skärmsläckare, engelska screensaver, är ett datorprogram som startar automatiskt då en dator inte använts under en tid. Programmets uppgift är att förhindra att skärmen tar skada av att visa samma bild under lång tid, så kallad inbränning. Ju ljusare färger i bilden, desto större är risken för att skärmen slits. Särskilt stor var den risken på de gamla CRT-skärmarna. Skärmsläckare har oftast någon rörlig figur av mer eller mindre fantasifull utformning på en i övrigt mörk skärm, detta för att minska slitage på skärmen men även för att visa att datorn är igång. De flesta skärmsläckare har en valbar funktion för lösenordsskydd så att obehöriga inte kan använda datorn om ägaren gått ifrån den påslagen. Idag har de flesta datorskärmar ett energisparläge som kan styras från datorn, datorn kan alltså stänga av skärmen efter en stunds inaktivitet. Detta gör att skärmsläckarens betydelse har minskat och är numera huvudsakligen en kosmetisk detalj. Sökfrasen free screensaver (svenska "gratis skärmsläckare") anses vara den farligaste på sökmotorn Google. Risken för att sökträffarna leder till skadligt material, såsom datorvirus och trojanska hästar, är så hög som 64 procent.

Bittorrent

Bittorrent (formellt BitTorrent, av "bit" och engelska "torrent" = strid ström, störtflod, skur) är ett filöverföringsprotokoll. Den överföringsmodell som det ursprungliga programmet (BitTorrent) använder har namngivits efter programmet och sedan implementerats av många andra program. Det effektiviserar nedladdningar av stora och populära filer genom att låta alla nedladdare hjälpa varandra i ett slags P2P-nätverk. Effektiviteten kommer av att den del av den totala datamängden en användare laddat ner distribueras vidare till andra användare som inte fått just denna del. BitTorrent använder sig av kryptografiska kontrollsummor (SHA-1) för att säkerställa att datamängden inte blir korrupt. BitTorrent skapades ursprungligen av den amerikanske programmeraren Bram Cohen. Bram Cohen skapade år 2001 ett protokoll som möjliggjorde distribution av filer mellan flera användare, tillsammans med en klient med samma namn (BitTorrent). Senare startade Cohen även företaget BitTorrent, Inc. tillsammans med Ashwin Navin. BitTorrent, Inc. är de som ansvarar för underhållet av BitTorrent-protokollet. Bittorrentprogrammet ser filen man vill göra en torrentfil av som flera lika stora delar, oftast är delarna mellan 64kB och 4 MB, men delar under 512kB rekommenderas för att upprätthålla hastigheten. Till varje del skapas det en checksumma, den skapas genom att programmet använder sig av en algoritm som heter SHA-1. Det är en hashingalgoritm som ger ifrån sig en 160 bitar lång kontrollsumma, som läggs in i torrentfilen. Torrentfilen laddas sedan upp till en tracker, en server som lagrar torrentfiler som användare kan ladda ner. Genom att bittorrentprotokollet i sig inte erbjuder någon tjänst att söka efter filer så använder användaren vanligtvis en torrentsökmotor. Det finns dock både sökmotorer som är trackers i sig och så finns det sökmotorerna som länkar vidare till tracker-servrar där de hämtar .torrent-filen ifrån. På sökmotorerna söker användaren efter den filen de vill ladda ner, när filen har hittats så trycker användaren på filen och hämtar hem .torrent-filen från trackern. Torrentfilen innehåller inte information om vilka som har filen, seeders eller vilka som håller på att ladda ner filen, peers, vilket är ett vanligt missförstånd, utan länkar till trackers, servrar som kopplar ihop olika peers i en svärm. När användarens bittorrentprogram får denna information från trackern så skickar användarens program multipla förfrågningar till peers och seeders i svärmen om slumpmässiga delar av filen, så man laddar olika delar från olika användare i svärmen. För att sedan maximera distributionen och göra det så effektivt som möjligt så använder sig bittorrent av flera principer. En av dessa principer kallas "mest-sällsynta-först", det fungerar som följande. I svärmen jämförs alla delar av filen, säg att m st kopior finns det av de delar det är minst av i svärmen. Alla delar det finns m st av skrivs upp på en lista, mest sällsynta först på listan, listan uppdateras så fort någon del antingen läggs in på den eller dras bort från den. I svärmen väljer då peers/leechers slumpmässigt olika delar av den listan att ladda ner, för att på det sättet distribuera de mest sällsynta olika delarna så fort som möjligt. Ett alternativ till torrent-filer som sökmotorer erbjuder är magnetlänkar (eng. magnet links). Största skillnaden mellan torrent-filer och magnetlänkar är att i de senare fallet identifierar och länkar magnetlänkar till innehåll. Dessa länkar har ökat i popularitet på senare tid och erbjuds av allt fler sökmotorer. En av de mest populära klienterna för Windows är µTorrent. Ursprungligen tillverkat av ett svenskt bolag, sedan 2006 uppköpt av BitTorrent, Inc. Svärm (Swarm) - Flera bittorrent-användare som antingen vill ladda ner en och samma fil eller som delar med sig av en och samma fil. Jämlike (Peer) - Bittorrent-användare, en dator som cirkulerar i svärmen. Index - En sökmotor för filer.

Kommentarspam

Kommentarspam eller bloggspam (vanliga engelska uttryck är comment spam, blog spam och wiki spam) är oönskad reklam eller ovidkommande kommentarer som postas till exempelvis bloggar, wikiwebbplatser, gästböcker, diskussionsforum eller kontaktformulär som är öppna för vem som helst att skriva i. Även om kommentarspam ibland postas manuellt, står webbrobotar eller "botar", som är programmerade att söka upp webbformulär och posta oönskat innehåll, för den överväldigande delen. Webbapplikationer som accepterar och visar hyperlänkar är särskilt utsatta. Länkar som pekar på spammarnas (eller deras uppdragsgivares) webbplatser syftar primärt till att öka dessa webbplatsers popularitet hos söktjänsterna genom s.k. sökmotoroptimering, så att spammarnas webbplatser hamnar längre upp på sökresultatlistorna, vilket indirekt ökar antalet besökare och betalande kunder. Kommentarspam ingår därmed i det batteri av metoder som används för att försöka manipulera sökmotorerna. En sammanfattande engelsk term för det senare är spamdexing. Den allmänna uppfattningen är att kommentarspam är ett missbruk som behöver motverkas. Uppsättningen av möjliga motåtgärder utvecklas kontinuerligt i takt med att spammarna tar till olika knep för att kringgå åtgärderna. Hos engelska Wikipedia listas några åtgärder mot kommentarspam i artiklarna Spam in blogs och Forum spam. En teknik, som bland annat används på Internetuppslagsverket Wikipedia, är att förse publicerade hyperlänkar med tillägget rel="nofollow", vilket uppmanar sökmotorerna att inte låta länkarna påverka målsidornas popularitet. Då merparten av botarna använder sig av öppna proxyservrar, är en effektiv - men kontroversiell - metod att neka öppna proxyservrar åtkomst till webbformulär.


Sökmotor