Felismerik-e a keresők a ragozott alakokat?
Ha például az „egér” kulcsszóra keresünk, egyes keresők csak az „egér” kulcsszó előfordulása alapján állítják össze a találatokat, míg a magyar szavak szótövezésére képes keresők akár az „egerek”, „egérfélék”, „egérrel”, stb. alakokat is figyelembe veszik.
A SZTAKI Kereső volt a legelső, mely képes volt a szótövezésre már 2004 évvégi indulásakor. Hosszú ideig ez volt az egyetlen szótövezésre képes kereső, mindaddig, amíg 2006 elején meg nem jelent a tango.hu, majd pár hónappal később a PolyMeta kereső. Az alábbi képernyőképeken a szótövezés működésére láthatóak példák az egyes keresők esetén:
Magyar keresőprogramok
SZTAKI kereső
A SZTAKI kereső találati listáiban gyakran tűnnek fel a ragozott alakok, a szótövezés funkció pedig szükség esetén ki- vagy bekapcsolható:
PolyMeta metakereső
A PolyMeta a MorphoLogic technológiájával szótövez; ez a funkció nem kapcsolható ki:
tango.hu kereső
A tango.hu is szótövez, azonban az ékezetek kezelésében nem a legjobb: az első találati oldalak szinte kizárólág Eger városához kapcsolódó találatokkal vannak tele.
Nemzetközi keresőprogramok
A Google kereső 2003 vége óta képes egyszerű szótövezésre angol nyelven, például az egyes szám – többes szám eltéréseket tudja kezelni. Ezt egyrészt nem nehéz megcsinálni, mert az angol csak relatív kevés szót toldalékol, másrészt pedig a legnagyobb piac kedvéért minden bizonnyal bonyolultabb esetben is megcsinálták volna. Majd’ két és fél évet kellett várni, míg 2006 márciusában felbukkantak a magyar nyelvű szótövezés első jelei. Például a „kereső optimalizálás” Kereső-kifejezésre nemcsak a „kereső” kulcsszó, hanem a „keresés” kulcsszó is kiemelve jeleniki meg a Találati rangsorban. Hasonló módon a „keresés optimalizálás” kifejezés esetén a „kereső” kulcszó is kiemelve jelenik meg. A jelenség nem érhető egykönnyen tetten akkor, ha pusztán a „keresés” vagy a „kereső” Kulcsszavakat használjuk.
Úgy tűnik, a Google Inc. egyelőre csak kísérletezik a szótövezéssel, mindenesetre az esetek többségében nem figyelhető meg a jelenség, lásd például a fent használt „egér” kulcszót. A kivonatokban feltűnik pl. az „egerek” forma, azonban a Google nem emeli ki azt.
Olvasók tapasztalatai:
2006. április Még elég kevés ragot ismer fel a Google (igazán biztosan a többesszám jelét, ritkábban az -a/-e, -on/-en); illetve néhol az eltérő szófajt (kereső – keresés). Ezekre elég könnyen elő lehet hozni példákat, ha olyan kifejezést írsz be, melynek egyértelműen az alternatív (vagyis toldalékolt/-atlan, egyes/többesszámú) megjelenéseit találja relevánsabbnak a kereső.
Például az alábbiakra egyaránt tapasztalható:
- autók szerelés (ahol ugye az autó szerelés kombináció előfordulása jellemzőbb)
- szlovák szótárak (itt az igazán fontos találatok inkább a „szótár” szót tartalmazzák)
- sztaki keresés (helyett logikusabb: sztaki kereső)
- vasút menetrend (nyilván: vasúti menetrend)
- nemzet bank, budapesti főváros, műszaki egyetemen, friss hír (hasonló logika mentén…)
- ablakok zsiráf (magyarázni sem kell :-))
A Google a „nagykereskedés” és a „nagykereskedelem” közti kapcsolatot is látja (ld. keresés: „sport nagykereskedés”) 🙂
2006. júniusHa például beírjuk, hogy intenet, akkor az elírt változatok jelennek meg találatként, de ha egy legalább két szóból álló kifejezésre keresünk, mint pl. magyar intenet, akkor már a „magyar internet” kifejezésnek megfelelő találatok jelennek meg, és furcsa módon ennek tényéről nem is tájékoztat a Google.
A „Szótövezés” című bejegyzést 2006. 04. 16. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 10. 27., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.
Archivált hozzászólások
fózólap
2007. 10. 27. 06:24 ·
Helló!
Ma találtam a statbanindukciós fózólapÉs tényleg a google főzőlapnal látja.Fantasztikus, de kiírja így?
NT
Re: fózólap
2007. 10. 27. 06:52 ·
Fekete Pákó? 🙂
Re: fózólap
2007. 10. 27. 07:36 ·
Vagy valaki félreütött: az ő és az ó egymás mellett van a billentyűzeten.
Ez elég buta
2007. 07. 28. 06:22 · Névtelen hozzászóló →
A „mí” szóra rákeresve megmutatja „A mítoszok vége” című oldalt, kiemelve a title-ben a „mí”-t 🙂