This page is not created by, affiliated with, or supported by Slack Technologies, Inc.
2015-08-14
Channels
- # admin-announcements (20)
- # beginners (8)
- # boot (90)
- # cider (19)
- # clojure (31)
- # clojure-czech (2)
- # clojure-italy (8)
- # clojure-japan (6)
- # clojure-russia (9)
- # clojurescript (165)
- # clojurex (3)
- # cursive (2)
- # events (3)
- # hoplon (2)
- # ldnclj (3)
- # luminus (2)
- # melbourne (2)
- # off-topic (8)
- # onyx (5)
- # reagent (2)
- # testing (2)
Где не совпадает - всегда сумма выше, чем языки отдельно. Значит всякие мейкфайлы-иксэмэлы не включены в табличку.
@kirillov по поводу mystem - я его использовал года так 3-4 назад и могу сказать, что он выполняет очень неплохой морфологический анализ для русского языка, особенно если в тексте встречается нестандартное слово - фамилия или вообще отсутствующее по каким-то причинам в словаре слово. Его результаты были настолько неплохи, что на его основе я написал минимальный синтаксический анализатор и примитивный извлекатель шаблонов-фактов. Есть два момента, первый - это действительно только морфоанализатор, дающий много неоднозначностей (например, в определении падежа), поэтому на этапе синт. анализа пришлось часть неоднозначости снимать. Второй момент - я вызывал этот файл как процесс и скармливал ему порядка 8 Кб текста за раз. Не знаю, есть ли сейчас такие ограничения, все-таки много времени прошло, но тогда они лечились параллельным запуском нескольких экземпляров mystem и очередями на процессинг текста.