SzóSzablya

november 4, 2004

Projekt a magyar webkorpusz létrehozására

http://mokk.bme.hu/projektek/szoszablya

A SzóSzablya BMGE GTK Szociológia és Kommunikáció Tanszéke Média Oktató és Kutató Központjának egy igen izgalmas projektje volt, mely 2003 márciusában indult, az alábbi célokkal:

  • Magyar Webkorpusz: egy minden korábbinál nagyságrenddel nagyobb méretű magyar nyelvű; tokenizált szöveggyűjtemény
    • ez alapján készülő Szószablya Gyakorisági Szótár,
  • szabadon elérhető (LGPL licencű)
    • hunmorph morfológiai elemző,
    • hunstem szótövező,
    • hunspell helyesírás-ellenőrző
    • a programok által használt hunlex magyar helyesírási és morfológiai szótár.

Idézet a projekt honlapjáról

A projekt egy szabad felhasználású morfológiai elemző program kifejlesztését, illetve az ehhez szükséges intelligens, web gyakorisági szótár (SzóSzablya Szótár) felépítését tűzte ki célül. A projekt lezárása után nemcsak a kifejlesztett szoftvereket, hanem a szótárt is szabadon hozzáférhetővé tesszük bárki számára. A projekt résztvevői mindezt annak a meggyőződésnek a tudatában teszik, hogy egy szabadon módosítható és bővíthető morfológiai elemző léte nélkülözhetetlen a magyar nyelv digitális korszakban való életképességének megőrzéséhez, a magyar nyelvű digitális archívumok hosszútávú fenntartásához, a digitális kultúra lehetőségeinek a kihasználásához, az intelligens kereső és navigációs szolgáltatások továbbfejlesztéséhez

A webes gyakorisági szótárak letölthetőek az ftp.szoszablya.hu oldalról.

A „SzóSzablya” című bejegyzést 2004. 11. 04. napján publikáltam, az azóta már bezárt webni.innen.hu oldalon. Ezt az írást és az innen hivatkozott régi tartalmakat a Webni! Archívum oldalán gyűjtöttem össze. Mivel az utolsó módosítás dátuma: 2007. 06. 05., ezért az itt olvasható információk már részben vagy teljes egészében elavultak lehetnek.

Archivált hozzászólások