Musutelsa je multidokumentový sumarizátor textů založený na latentní sémantické analýze. Vznikl a je dále vyvíjen v rámci diplomové práce na Katedře informatiky a výpočetní techniky na Fakultě aplikovaných věd Západočeské univerzity v Plzni. Vedoucím projektu je Josef Steinberger, diplomantem Martin Křišťan.
[9. května 2007] Vystavení průběžné verze dokumentace.
[22. dubna 2007] Zprovoznění stránek projektu, umístění zdrojových kódů a dokumentace.
Veškeré zde zveřejněné materiály jsou veřejně přístupné ke shlédnutí. Jejich využití pouze se svolením autora!
verze 1.3.006, zip [aktualizováno 14.05.2007]
Přidány nové parametry do nastavení (cosreduce a sigmapow). V programu byla mimo jiné vylepšena metoda pro výběr vět do extraktu.
dtd vstupních dat, txt [aktualizováno 22.04.2007]
menší corpus (duc2002.xml) s testovacími daty, xml [aktualizováno 22.04.2007]
slovník se stop slovy, txt [aktualizováno 22.04.2007]
lematizační slovník, určen pro duc2002, txt [aktualizováno 22.04.2007]
Na stránkách je vždy zveřejněna poslední verze [nyní 1.3.003]. Pokud máte zájem o starší verzi, napište si o ni na martin.kristan@tiscali.cz.