Projekt a magyar webkorpusz létrehozására
http://mokk.bme.hu/projektek/szoszablya
A SzóSzablya BMGE GTK Szociológia és Kommunikáció Tanszéke Média Oktató és Kutató Központjának egy igen izgalmas projektje volt, mely 2003 márciusában indult, az alábbi célokkal:
- Magyar Webkorpusz: egy minden korábbinál nagyságrenddel nagyobb méretű magyar nyelvű; tokenizált szöveggyűjtemény
- ez alapján készülő Szószablya Gyakorisági Szótár,
- szabadon elérhető (LGPL licencű)
- hunmorph morfológiai elemző,
- hunstem szótövező,
- hunspell helyesírás-ellenőrző
- a programok által használt hunlex magyar helyesírási és morfológiai szótár.
Idézet a projekt honlapjáról
A projekt egy szabad felhasználású morfológiai elemző program kifejlesztését, illetve az ehhez szükséges intelligens, web gyakorisági szótár (SzóSzablya Szótár) felépítését tűzte ki célül. A projekt lezárása után nemcsak a kifejlesztett szoftvereket, hanem a szótárt is szabadon hozzáférhetővé tesszük bárki számára. A projekt résztvevői mindezt annak a meggyőződésnek a tudatában teszik, hogy egy szabadon módosítható és bővíthető morfológiai elemző léte nélkülözhetetlen a magyar nyelv digitális korszakban való életképességének megőrzéséhez, a magyar nyelvű digitális archívumok hosszútávú fenntartásához, a digitális kultúra lehetőségeinek a kihasználásához, az intelligens kereső és navigációs szolgáltatások továbbfejlesztéséhez
A webes gyakorisági szótárak letölthetőek az ftp.szoszablya.hu oldalról.
A „SzóSzablya” című bejegyzést 2004. 11. 04. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 06. 05., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.