Was ist eine Zusammenfassung?
Bei der Textzusammenfassung wird ein Textblock einfach zusammengefasst, um ihn zu verkürzen.
Generative KI-Modelle wie GPT-5, GPT-4, LLaMA 3, Yi 34B und Mixtral 8x7B sind sehr gut in der Textzusammenfassung.
Nehmen wir an, Sie haben den folgenden Textblock:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Diese technische Beschreibung ist recht lang und vielleicht sind nicht alle Details notwendig, damit ein gewöhnlicher Leser die allgemeine Idee erfassen kann. Deshalb wollen wir nun maschinelles Lernen nutzen, um diesen Text automatisch zusammenzufassen.
Ein Zusammenfassungsmodell würde etwa Folgendes ergeben:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Interessant, nicht wahr? Wie Sie sehen können, ist die allgemeine Idee immer noch da, aber eine Menge Details wurden gestrichen. Der Text ist nur noch halb so groß wie am Anfang!
Es gibt verschiedene Arten von Zusammenfassungen. Bei der "Schlagzeilengenerierung" geht es zum Beispiel darum, einen sehr kurzen Satz zu generieren, der sich perfekt für einen Blog- oder Nachrichtentitel eignet. Bei der "Dialogzusammenfassung" geht es darum, einen ganzen Dialog in eine komprimierte Version umzuwandeln. "Extraktionszusammenfassung" bedeutet, dass die Zusammenfassung nur aus Sätzen des Originaltextes besteht, während "abstrahierende Zusammenfassung" bedeutet, dass neue Inhalte in der Zusammenfassung erstellt werden können.