Nyílt forráskódú kereső program

május 5, 2005

Miért kellene a nyílt forráskódú kereső?

A Fontos keresők algoritmusai titkosak, tehát senki sem tudja, hogy az oldalak rangsorolása pontosan milyen szabályok szerint történik. Egyesek úgy gondolják, hogy sokkal keveseb „keresőoptimalizáló” tudna a zavarosban halászva visszaélni a Kereső rendszerek működése gyenge pontjaival, ha teljesen nyilvános lenne működésük. Például a Web spam egy újabb formájának megjelenése esetén, – vagy akár általánosságban az algoritmusok tökéletesítése céljából – bárki javasolhatna változtatást, emellett az weboldalak készítői is tisztában lehetnének a rangsorolás kritériumaival, ezzel kiszámíthatóbbá lehetne tenni a keresőkre építő üzleti modelleket. Természetesen egy nyílt forráskódú (és ingyenes) kereső program még önmagában nem képes arra, hogy egy másik aggasztó jelenségnek, a Google kereső kvázi-monopóliumának (vagy a Fontos keresők oligopóliumának) véget vethessen, hiszen az egész web Felgöngyölítésére, egy naprakész adatbázis fenntartására, a nagyszámú látogató kiszolgálására óriási erőforrásokra lenne szükség (pl. hardver oldalról: tárolókapacitás, processzoridő, sávszélesség, stb.) Mindezek ellenére az open source alernatívák hosszú távon hozzájárulhatnak a webes keresés színvonalának emelkedéséhez, akárcsak az egyéb szoftverek esetében.

nutch és Lucene

http://lucene.apache.org/

Nyílt forráskódú keresőrendszer, melynek fejlesztése 2003 augusztusában indult abból a célból, hogy szabadszavas keresésre nyújtson alernatívát. Akár az egész web kereshető vele, de egyes weboldalakon, intraneten, stb. való keresésre is, végsősoron Saját kereső létrehozására is. Már indulásakor is számos ismert arc bábáskodott, régebben a Yahoo! kereső és az Internet Archive (lásd: Wayback Machine) is támogatta a projektet, jelenleg az Apache inkubátor projekjének résztvevője, azonban a nagyobb áttörés még várat magára.

A „Nyílt forráskódú kereső program” című bejegyzést 2005. 05. 05. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2006. 12. 20., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások