Блок задач

8. Проекты-1

Сложность 7

Задача «Генератор сниппетов»

Справка

Сниппеты в поисковых системах

Входные данные

Большой файл с текстом (например, "Война и мир")

Задача

Ситема должна получить от пользователя на вход некоторый запрос (как в поисковике) и выдать наиболее подходящий сниппет, основанный на тексте из входного файла. Длина сниппета должна быть задаваемым параметром.

Краткий алгоритм генерации сниппета:

Для каждого слова, основываясь на тексте из файла, можно определить частоту вхождений и рассчитать некоторый "вес" слова, обрабтно пропорциональный кол-ву вхождений. Соответсвенно, чем вес больше, те слово важнее. Далее, основываясь на весах слов из запроса и количестве вхождений этих слов в предполагаемый сниппет, можно выбрать наиболее подходящий вариант.

Более подробный алгоритм появится позже (либо обсужден со студентом устно).