Klasyfikacja poszukujących Internetu (4 typy)

Klasyfikację wyszukiwarek internetowych można podzielić na hierarchiczne wyszukiwarki, katalogi, wyszukiwarki hybrydowe i meta-wyszukiwarki.

Wyszukiwarki to system oprogramowania przeznaczony do wyszukiwania informacji w sieci WWW. Używają słów kluczowych do wyszukiwania dokumentów związanych z tymi słowami, a następnie umieszczają wynik w kolejności odpowiadającej poszukiwanemu tematowi.

Wyszukiwarki internetowe starają się wyodrębnić informacje wymagane przez użytkownika; Jest to możliwe dzięki dużej bazie danych dostępnej w Internecie.

Stały się narzędziem codziennego użytku do wyszukiwania informacji. Dzięki temu bardzo łatwo jest znaleźć informacje w wyszukiwarkach takich jak Google, AOL, Yahoo i Bing.

W Internecie dostępne są tysiące różnych wyszukiwarek; każdy ma swoje różne zdolności i cechy.

Pierwsza opracowana wyszukiwarka nazywała się Archie i była używana do wyszukiwania plików FTP; pierwsza wyszukiwarka tekstowa nazywała się Veronica.

Użytkownicy mogą uzyskać dostęp do przeglądarki za pomocą przeglądarki na komputerze, smartfonie, tablecie lub innym sprzęcie elektronicznym.

Klasyfikacja typów wyszukiwarek internetowych

1- Hierarchiczne Poszukiwacze (Pająk)

Ten typ wyszukiwarek wykorzystuje „pająka” do przeszukiwania sieci w Internecie. Ten pająk wchodzi na poszczególne strony internetowe, usuwa słowa kluczowe, a następnie dodaje strony do bazy danych wyszukiwarki internetowej.

Zaletami tego typu wyszukiwarek jest to, że zawierają dużą liczbę stron i są łatwe w użyciu. Z tego powodu bardzo często użytkownik zna się na nim i używa go wielokrotnie.

Z drugiej strony, wady obejmują to, że ponieważ wyodrębniają tak dużo danych, bardzo możliwe jest posiadanie zbyt wielu informacji.

Większość popularnych wyszukiwarek internetowych jest hierarchicznych, takich jak Google, Bing, Yahoo, Baidu i Yandex.

Wszystkie hierarchiczne przeglądarki internetowe wykorzystują bota (pająka) do wyszukiwania i indeksowania nowych treści w bazie danych wyszukiwania.

Istnieją cztery podstawowe kroki, które wykonuje każda hierarchiczna wyszukiwarka przed wyświetleniem dowolnej strony internetowej w wynikach wyszukiwania:

Slip

Wyszukiwarki przesuwają się po Internecie, aby znaleźć dostępne strony internetowe. Dokonuje tego oprogramowanie zwane pająkiem; Częstotliwość osuwisk może trwać kilka dni.

Indeks

Jest to proces identyfikacji słów i wyrażeń, które najlepiej opisują stronę internetową. Zidentyfikowane słowa są określane jako słowa kluczowe, a strona jest przypisana do zidentyfikowanych słów.

Oblicz trafność

Wyszukiwarka porównuje ciąg wyszukiwania w łańcuchu wymagań ze zindeksowanymi stronami bazy danych.

Ponieważ jest bardziej prawdopodobne, że więcej niż jedna strona zawiera ciąg wyszukiwania, wyszukiwarka rozpoczyna obliczanie trafności każdej ze stron w indeksie wraz z wyszukiwanym ciągiem.

Istnieje kilka algorytmów do obliczania trafności. Każdy z tych algorytmów ma różne względne wagi dla typowych czynników, takich jak gęstość słów kluczowych lub linków.

Dlatego każda wyszukiwarka daje różne strony wyników dla tego samego łańcucha wyszukiwania.

Od czasu do czasu wyszukiwarki zmieniają swoje algorytmy.

Pobierz wynik

Zasadniczo po prostu pokazuje wyniki w przeglądarce; nieskończone strony wyników wyszukiwania, które są sortowane od najbardziej odpowiednich do najmniej ważnych.

2- Katalogi

Katalogi są wyszukiwarkami, które zależą od działalności człowieka dla ich aukcji: strona internetowa jest prezentowana w katalogu, a jej włączenie musi zostać zatwierdzone przez zespół redakcyjny.

Ten proces przebiega następująco:

1-Właściciel strony przedstawia krótki opis Twojej witryny do katalogu wraz z kategorią, w której powinien być wymieniony.

2-Przesłana strona jest sprawdzana ręcznie. Następnie może zostać dodany do odpowiedniej kategorii lub może zostać odrzucony dla aukcji. Witryna z dobrą zawartością jest bardziej prawdopodobna w porównaniu ze stroną o niskiej zawartości.

3-Słowa kluczowe wprowadzone w polu wyszukiwania zostaną sparowane z opisem strony internetowej. Oznacza to, że zmiany dokonane w treści strony nie są brane pod uwagę, ponieważ tylko opis tych samych spraw.

Zaletą jest to, że każda strona jest sprawdzana pod kątem jej trafności i zawartości, zanim zostanie dołączona. Wiele razy mniej wyników oznacza, że ​​można szybciej znaleźć potrzebne rzeczy.

Mimo to format i układ nie są przyjazne dla większości ludzi i mogą mieć problemy z mniej popularnymi wyszukiwaniami. Kolejną wadą jest opóźnienie w tworzeniu strony i jej włączenie do katalogu

Niektóre znane katalogi to Open Dictionary Project, Internet Public Library i DMOZ, niedawno zamknięte.

3- Hybrydowe wyszukiwarki

Te wyszukiwarki używają zarówno hierarchicznych wyszukiwarek, jak i katalogów do wyświetlania stron internetowych w wynikach wyszukiwania.

Większość wyszukiwarek pajęczych, takich jak Google, w zasadzie korzysta z hierarchicznych wyszukiwarek jako podstawowego mechanizmu i ręcznego monitorowania jako mechanizmu dodatkowego.

Czasami użytkownik ma możliwość przeszukiwania sieci lub katalogu. W innych możliwościach użytkownik może otrzymać zarówno wyniki wyleczone przez ludzi, jak i wyniki hierarchiczne w tym samym wyszukiwaniu; gdy tak jest, zazwyczaj wyniki ludzkie są wymienione jako pierwsze.

Google i Yahoo to dwie główne wyszukiwarki należące do tej kategorii, chociaż każda z nich jest bardziej wyszukiwarką, która migruje do tego systemu.

4- Silniki metasearch

Te wyszukiwarki internetowe to te, które wyszukują w innych wyszukiwarkach w tym samym czasie, a następnie łączą wyniki w jedną listę.

Zaletą jest to, że uzyskuje się więcej wyników, ale ich trafność i jakość mogą znacznie ucierpieć.

Przykłady meta-wyszukiwarek obejmują Dogpile, Metacrawler i Clusty.