Kereső-adatbázisok nagysága és profilja
Nemzetközi keresőadatbázisok mérete
http://searchenginewatch.com/reports/article.php/2156481
A Search Engine Watch cikke a kereső-adatbázisok méretének alakulásáról 1995-től napjainkig, közvetlen eléréssel az aktuális állapotról szóló elemzéssel.
Magyar weblapok a kereső-adatbázisokban
Az elmúlt évben viszonylagos rendszerességgel, háromhavonta vizsgáltam a magyar nyelvű keresés szempontából legfontosabb kereső oldalakat. Ezt tükrözik az alábbi diagramok: a SzóSzablya projekt által kimutatott leggyakoribb húsz magyar szóra rákeresve az alábbi eredményeket kaptam.
Google kereső
A diagramon jól látszik, hogy a kapott találatok számának profilja változatlan, tehát az adatbázis összetételében és a keresőprogram működésében nem történt gyökeres változás. A találatok folyamatos növekedése mutatja, hogy egyre több és több magyar nyelvű oldal szerepel a Google indexében.
[vizsla.origo.hu]
Jól látszik, hogy az első mérést követően lecserélték a használt keresőmotort: az alltheweb helyett már a Yahoo! kereső! adatbázisát használják. Ez logikus folyománya volt annak, hogy a Yahoo! kereső! a tulajdonában levő különböző keresőtechnológiák közül egyet szeretne csak továbbfejleszteni és azt partnereinek eladni.
Yahoo! kereső
2004. februárjában nem vizsgáltam a Yahoo! kereső!-t még, mivel az egy az egyben a Google adatbázisát használta, ezért most csak beillesztettem az akkor a Google oldalain mért eredményeket. Jól látszik, hogy a saját fejlesztésű adatbázisban történő keresés hol több, hol kevesebb találatot adott az év folyamán. Ez jelentheti egyrészt azt, hogy a Yahoo! kereső! algoritmusain továbbra is sokat finomítottak az év folyamán, illetve hogy csak az egyes különböző nyelvű oldalak megállapításában történt változás (tehát annak módja, ahogyan a kereső megállapítja egy oldalról, hogy magyar nyelvű-e avagy sem.)
goliat.hu
Alighanem a goliat háza táján változott a legtöbb dolog az év folyamán, amit plasztikusan érzékeltet ez a diagram. Hol sokkal több, hol sokkal kevesebb találatot mutatott ki az oldal. Bíztató, hogy azért ki lehet venni a növekvő tendenciát.
heureka.hu
Tavaly ősszel nem is vizsgáltam az oldalt, mivel a kereső adatbázisa február és április között gyakorlatilag semmit sem változott. Azóta viszont –mint az a diagramon is látható– közel megduplázódott az adatbázis.
SZTAKI kereső
Novemberben pontosan ugyanannyi találatot jelzett ki, mint februárban. Sajnos ez azt mutatja, hogy csak látszólag indult el a szolgáltatás.
A „Kereső adatbázisok mérete (2004.)” című bejegyzést 2005. 02. 06. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 07. 09., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.