Wat is samenvatten?
Tekst samenvatten is eenvoudigweg het proces van het samenvatten van een blok tekst om het korter te maken.
Generatieve AI-modellen zoals GPT-5, GPT-4, LLaMA 3, Yi 34B en Mixtral 8x7B zijn erg goed in het samenvatten van tekst.
Laten we zeggen dat je het volgende blok tekst hebt:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Deze technische beschrijving is vrij lang en misschien zijn niet al deze details nodig voor een gewone lezer om het algemene idee te begrijpen. Daarom willen we nu gebruik maken van machine learning om dit stuk tekst automatisch samen te vatten.
Een samenvattingsmodel zou zoiets als dit opleveren:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Interessant, nietwaar? Zoals je kunt zien, is het algemene idee er nog steeds, maar zijn er tonnen details weggelaten. Het maakt de tekst de helft kleiner!
Er zijn verschillende soorten samenvattingen. Bijvoorbeeld "headline generation" gaat over het genereren van een zeer korte zin, perfect geschikt voor een blog- of nieuwstitel. "Dialoog samenvatten" gaat over het omzetten van een hele dialoog in een beknopte versie. "Extraction summarization" betekent dat de samenvatting alleen bestaat uit zinnen uit de oorspronkelijke tekst, terwijl "abstractive summarization" betekent dat er nieuwe inhoud in de samenvatting kan worden gecreëerd.