Czym jest podsumowanie?
Podsumowywanie tekstu to po prostu proces streszczania bloku tekstu w celu jego skrócenia.
Modele generatywnej sztucznej inteligencji, takie jak GPT-5, GPT-4, LLaMA 3, Yi 34B i Mixtral 8x7B, bardzo dobrze radzą sobie z podsumowywaniem tekstu.
Załóżmy, że masz następujący blok tekstu:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Ten opis techniczny jest dość długi i być może nie wszystkie te szczegóły są potrzebne zwykłemu czytelnikowi do zrozumienia ogólnej idei. Chcemy więc wykorzystać uczenie maszynowe do automatycznego podsumowania tego fragmentu tekstu.
Model podsumowujący zwróciłby coś takiego:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Interesujące, prawda? Jak widać, ogólna idea nadal istnieje, ale mnóstwo szczegółów zostało usuniętych. To sprawia, że tekst jest o połowę mniejszy!
Istnieje kilka rodzajów podsumowań. Na przykład "generowanie nagłówków" polega na generowaniu bardzo krótkich zdań, idealnie nadających się na tytuł bloga lub wiadomości. "Podsumowanie dialogu" polega na przekształceniu całego dialogu w skondensowaną wersję. "Streszczenie ekstrakcyjne" oznacza, że podsumowanie składa się wyłącznie ze zdań z oryginalnego tekstu, podczas gdy "streszczenie abstrakcyjne" oznacza, że w podsumowaniu można tworzyć nowe treści.