Что такое суммирование?
Резюме текста - это просто процесс обобщения блока текста с целью сделать его короче.
Генеративные модели ИИ, такие как GPT-5, GPT-4, LLaMA 3, Yi 34B и Mixtral 8x7B, очень хорошо справляются с резюмированием текста.
Допустим, у вас есть следующий блок текста:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Это техническое описание довольно длинное, и, возможно, не все эти детали необходимы обычному читателю, чтобы понять общую идею. Поэтому мы хотим использовать машинное обучение, чтобы автоматически обобщить этот кусок текста.
Модель обобщения будет выдавать что-то вроде этого:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Интересно, не правда ли? Как видите, общая идея сохранилась, но тонны деталей были удалены. В результате текст стал вдвое меньше своего первоначального размера!
Существует несколько типов подведения итогов. Например, "генерация заголовков" - это создание очень короткого предложения, идеально подходящего для заголовка блога или новости. "Резюме диалога" - это преобразование целого диалога в сжатую версию. "Извлечение резюме" означает, что резюме состоит только из предложений исходного текста, в то время как "абстрактное резюме" означает, что в резюме может быть создано новое содержание.