|
Комментарии к зачетным работам - 2
|
Те, кто делал Лаб 2 (GEOBASE) пришли сами к понятию стоп-словарь. Это те слова, которые отбрасываются сразу и не анализируются программой. Напрмер - артикли. Но стоп-словарь не один для всех систем обработки ЕЯ. Так - частица "of" не во всех NLP системах входит в стоп-словарь. Напрмер - как доложил нам Трощенко - в GEOBASE эта частица бывает важна - она указывает отношения между понятиями, выраженными номинативными группами (NP), между которыми она стоит.
Это так называется процесс приведения слова к исходной (словарной) форме. Если существительное - то к номинативу (именительному падежу), если глагол - то к неопределенной форме и т.д.
Пока брали вопросы по семиотике. Можно порекомендовать статью О.А. Сычева о рекламе для выделения правил ОФ. А потом можно сделать и второй вопрос - по этим правилам построить такой же текст о применении правил ОФ для построения WEB-сайтов.
ВР
Английская грамматика в Интернете - популярно Noun Phrase (NP), VP и т.д.
Еще одна красиво оформленная грамматика - более обшего характера
Composition (как часть риторики) - вплоть до того как писать диссертацию
|