Klasifikacija internetskih tražitelja (4 vrste)



Poredak tražilice Internet se može podijeliti na hijerarhijske tražilice, direktorije, hibridne tražilice i meta tražilice.

Tražilice su softverski sustav dizajniran za pronalaženje informacija na World Wide Webu. Koriste ključne riječi za pretraživanje dokumenata koji se odnose na te riječi, a zatim stavljaju rezultat prema redoslijedu relevantnosti za temu koja je tražena.

Internet tražilice nastoje izvući informacije koje vaš korisnik zahtijeva; To je moguće zbog velike baze podataka koja je dostupna na internetu. 

Oni su postali alat svakodnevne upotrebe za pronalaženje informacija. Zahvaljujući tome, sada je vrlo lako pronaći informacije s tražilicama kao što su Google, AOL, Yahoo i Bing..

Postoje tisuće različitih tražilica dostupnih na Internetu; svaki od njih ima svoje različite sposobnosti i karakteristike.

Prva razvijena tražilica nazvana je Archie i korištena je za traženje FTP datoteka; prva tražilica utemeljena na tekstu zove se Veronica.

Korisnici mogu pristupiti tražilici putem preglednika na računalu, pametnom telefonu, tabletu ili bilo kojem drugom elektroničkom uređaju.

Klasifikacija vrsta internetskih tražilica

1 - Hijerarhijski tražitelji (Spider)

Ova vrsta tražilica koristi 'pauk' za pretraživanje weba na internetu. Ovaj pauk ulazi u pojedinačne web stranice, izvlači ključne riječi i zatim dodaje stranice u bazu podataka internetskih tražilica.

Prednosti ove vrste tražilica su da sadrže veliki broj stranica i da su jednostavne za korištenje. Zbog toga je vrlo uobičajeno da korisnik s njom stvara poznavanje i da ga više puta koristi..

S druge strane, nedostaci su u tome što su, zbog toga što izvlače toliko podataka, vrlo moguće imati previše informacija.

Većina popularnih tražilica na Internetu su hijerarhijski, kao što su Google, Bing, Yahoo, Baidu i Yandex.

Svi hijerarhijski internetski preglednici koriste bot (pauk) za pretraživanje i indeksiranje novog sadržaja u bazi podataka pretraživanja.

Postoje četiri osnovna koraka koje svaka hijerarhijska tražilica slijedi prije prikazivanja bilo koje web-stranice u rezultatima pretraživanja:

gmizati

Tražilice kliziti preko Interneta pronaći dostupne web stranice. To se radi pomoću softvera koji se zove pauk; učestalost između klizišta može potrajati danima.

indeksirano

To je proces identificiranja riječi i izraza koji najbolje opisuju web stranicu. Identificirane riječi nazivaju se ključne riječi i stranica je dodijeljena identificiranim riječima.

Izračunajte relevantnost

Tražilica uspoređuje lanac pretraživanja u lancu zahtjeva s indeksiranim stranicama baze podataka.

Budući da je vjerojatnije da više od jedne stranice sadrži niz za pretraživanje, tražilica počinje izračunavati relevantnost svake od stranica u indeksu pomoću niza za pretraživanje.

Postoji nekoliko algoritama za izračunavanje relevantnosti. Svaki od ovih algoritama ima različite relativne težine za uobičajene čimbenike kao što su gustoća ključnih riječi ili veza.

Zato svaka od tražilica daje različite stranice rezultata za isti lanac pretraživanja.

Često tražilice mijenjaju svoje algoritme.

Dohvatite rezultat

U osnovi to je jednostavno prikazivanje rezultata u pregledniku; beskonačne stranice rezultata pretraživanja koje su razvrstane od najrelevantnijih do najmanje važnih.

2 - Katalozi

Imenici su tražilice koje ovise o ljudskim aktivnostima za svoje unose: web-stranica se prikazuje u imeniku i njezino uključivanje mora odobriti urednički tim.

Taj se postupak odvija na sljedeći način:

1-Vlasnik web-mjesta daje kratak opis vaše web-lokacije u imenik zajedno s kategorijom u kojoj bi trebao biti naveden.

2-Poslane stranice pregledavaju se ručno. Tada se može dodati odgovarajućoj kategoriji ili se može odbaciti za unos. Web-lokacija s dobrim sadržajem vjerojatno će biti dodana u usporedbi s web-stranicom sa slabim sadržajem.

3-Ključne riječi unesene u okvir za pretraživanje bit će uparene s opisom web-stranice. To znači da se promjene sadržaja sadržaja ne uzimaju u obzir, jer samo opis istih pitanja.

Prednost je da se svaka stranica preispituje zbog njezine relevantnosti i sadržaja prije uključivanja. Mnogo puta manje rezultata znači da možete brže pronaći ono što vam je potrebno.

Međutim, format i izgled nisu prikladni za većinu ljudi i mogu imati problema s manje uobičajenim pretraživanjima. Drugi nedostatak je da postoji kašnjenje u izradi web stranice i njeno uključivanje u imenik

Neki od poznatih direktorija uključuju Open Dictionary Project, Internet Public Library i DMOZ, nedavno zatvoreni.

3 - Hibridni tražilice

Ove tražilice koriste i hijerarhijske tražilice i direktorije za popisivanje web stranica u rezultatima pretraživanja.

Većina tražilica pauka, kao što je Google, u osnovi koriste hijerarhijske tražilice kao primarni mehanizam, a ručno praćenje kao sekundarni mehanizam.

Ponekad je korisniku dana mogućnost pretraživanja weba ili direktorija. U drugim prilikama, korisnik može primiti i rezultate koje ljudi liječe i hijerarhijske rezultate u istom pretraživanju; kada je to slučaj, obično se prvo nabrajaju ljudski rezultati.

Google i Yahoo su dvije glavne tražilice koje spadaju u ovu kategoriju, iako je svaka od njih više tražilica koja migrira na ovaj sustav.

4 - Metraženje motora

Ove internetske tražilice su one koje pretražuju u drugim tražilicama u isto vrijeme, a zatim kombiniraju rezultate u jedan popis.

Prednost je u tome što se dobiva više rezultata, ali njihova relevantnost i kvaliteta mogu znatno patiti.

Primjeri meta tražilica uključuju Dogpile, Metacrawler i Clusty.

reference

  1. Koje su različite vrste tražilica (2016). Oporavio se od webnotes.com
  2. Pretraživanje Interneta: vrste tražilica. Preuzeto s libguides.astate.edu
  3. Vrste tražilica (2008). Preuzeto sa zeald.com
  4. Tražilice i njihove vrste (2015.). Dobavljeno iz slideshare.com
  5. Tražilica (2017). Oporavio se od computerhope.com