Недавно столкнулся с одной задачей. Есть набор фактов, каждый факт - это текстовое выражение, от одного до 10 предложений. Есть еще картинки и таблицы. Факты свалены в кучу в виде плоского текста с вкраплениями картинок и таблиц. Чтобы эффективно работать с фактами, необходимо все их пометить тегами,