Большой файл с текстом (например, "Война и мир")
Ситема должна получить от пользователя на вход некоторый запрос (как в поисковике) и выдать наиболее подходящий сниппет, основанный на тексте из входного файла. Длина сниппета должна быть задаваемым параметром.
Краткий алгоритм генерации сниппета:
Для каждого слова, основываясь на тексте из файла, можно определить частоту вхождений и рассчитать некоторый "вес" слова, обрабтно пропорциональный кол-ву вхождений. Соответсвенно, чем вес больше, те слово важнее. Далее, основываясь на весах слов из запроса и количестве вхождений этих слов в предполагаемый сниппет, можно выбрать наиболее подходящий вариант.
Более подробный алгоритм появится позже (либо обсужден со студентом устно).