Darbo paieškos sistemos

Daugelis pradedančiųjų žiniatinklio valdytojų ir tik interneto naršyklių gerbėjai yra susiję su klausimu: kaip veikia paieškos sistemos? Pagrindiniai paieškos sistemų principai šiandien svarstys Tarybų šalį.
Šiuolaikinė paieškos sistema yra visas kompleksas, sudarytas iš sudėtingiausių programų ir algoritmų, kurie veikia su nuostabiu greičiu. Įsivaizduokite, nauja paieškos algoritmas "Google" kofeinas sugeba apdoroti informaciją, lygiavertę 3 km A4 lapams per 1 sekundę!
Visose paieškos sistemose programinės įrangos komponentai gali būti suskirstyti į penkias pagrindines grupes:
- "Vorai"
- "Keliaujantys vorai"
- indeksatoriai
- duomenų bazės
- rezultatų sistemos
Vorai - vorai (vorai) savo darbo algoritmu primena naršykles, bet neturi vizualiųjų komponentų. "Voras" įkelia puslapio html kodą naudodamas http protokolus.
Roboto užklausa serveryje apima komandą"Get / path / document" ir kai kurias kitas http prašymo komandas. Prašymu voras gauna atsakymą iš serverio kaip teksto srautą, kurį sudaro slaptos informacijos apie dokumento ir pačiame dokumente. Žmogus yra paieškos variklių indeksavimo modulio dalis.
"Kelioninis voras" - skaitytuvas - tai dar vienas komponentasindeksavimo modulis. Vikšrinė automatiškai naršia visas hipersaitus, kuriuos rado voras puslapyje, ir taip ieškoti dokumentų, kurie dar nėra žinomi paieškos sistemai.
Robotas-indeksavimo priemonė (indeksavimo priemonė) veikia tiesiogiai su vorinių robotų įkeltų puslapių turiniu. Indeksuotojas praleidžia morfologinius, leksikos analizės puslapius, kad juos į atskiras dalis.
Duomenų bazės (duomenų bazė) yra speciali programinė įranga, skirta suskirstyti ir indeksuoti indeksuotus dokumentus pagal komponentus.
Paieškos rezultatų variklis - rezultatų paskelbimo sistema yra viena iš svarbiausiųpaieškos sistemos komponentai. Tai yra išvesties sistema, su kuria susiduria galutinis vartotojas, kuri užklausą įveda į paieškos eilutę. Rezultatų išvesties sistema, paremta daugiau kaip dviem šimtais skirtingų kriterijų, atrenka rezultatus, labiausiai tenkinančius paieškos tikslus.
Tokio pasirinkimo algoritmas paprastai vadinamas algoritmu arba reitingavimo mechanizmas. Siekiant išvengti žiniatinklio valdytojų sukčiavimo, kad galėtų įtakoti išdavimo rezultatus, tikslūs paieškos algoritmų paieškos algoritmai yra laikomi griežčiausiame paslaptyje.
Nepaisant to, yra keletas žinomų kriterijų, į kuriuos atsižvelgiama paieškos sistemoje, optimizuojant tai, ką žiniatinklio valdytojas gali "teisiškai" įtakoti paieškos rezultatus. Pavyzdžiui, Analizuojant puslapį atsižvelgiama į paieškos variklį:
- ar yra puslapio pavadinimo raktinis žodis (antraštė)
- Ar raktinis žodis rodomas puslapio URL?
- ar antraštėse H1-H6 yra raktinis žodis, pažymėti STRONG, B, EM, I
- koks yra raktinių žodžių talpumas puslapyje (tankis)
- Ar raktinis žodis egzistuoja meta žymeles: raktinius žodžius, aprašymą
- Ar puslapyje yra vidinių ir išorinių nuorodų?
Vartotojas sąveikauja su paieškos sistema per paieškos serverį. Gauta paieškos užklausa iš vartotojoServeris apdoroja ir perduoda reitingavimo modulį kaip parametro įvestį. Savo ruožtu, modulis atlieka dokumentų, kurių informacija saugoma paieškos sistemos duomenų bazėje, tvarkymą, ir įvertina puslapius, atitinkančius vartotojo užklausą.
Be to, sistema generuoja fragmentą - tekstinę informaciją, kuri vartotojui pateikiama SERP (paieškos rezultatų puslapio) forma - paieškos rezultatų puslapiai.
Taigi net trumpas pagrindinio aprašymaspaieškos sistemų principai parodo, ar visi sistemos programinės įrangos komponentai yra tarpusavyje sujungti, ir kaip gerai paieškos sistema turi veikti ir aiškiai veikti, kad vartotojas galėtų pateikti sparčiausiai ir patikimiausią informaciją apie jo paieškos užklausą.














