Kaj je povzemanje?
Povzemanje besedila je preprosto postopek povzemanja dela besedila, da bi ga skrajšali.
Generativni modeli umetne inteligence, kot so GPT-5, GPT-4, LLaMA 3, Yi 34B in Mixtral 8x7B, so zelo dobri pri povzemanju besedil.
Recimo, da imate naslednji blok besedila:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Ta tehnični opis je precej dolg in morda vse te podrobnosti niso potrebne, da bi običajni bralec razumel splošno idejo. Zato želimo uporabiti strojno učenje, da bi samodejno povzeli to besedilo.
Model povzemanja bi vrnil nekaj takega:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Zanimivo, kajne? Kot lahko vidite, je splošna zamisel še vedno prisotna, vendar je bilo odstranjenih veliko podrobnosti. Besedilo je tako za polovico manjše od prvotne velikosti!
Obstaja več vrst povzetkov. Na primer, "generiranje naslovov" pomeni generiranje zelo kratkega stavka, ki je popolnoma primeren za naslov bloga ali novice. Pri "povzemanju dialogov" gre za pretvorbo celotnega dialoga v zgoščeno različico. "Izvlečno povzemanje" pomeni, da je povzetek sestavljen samo iz stavkov iz izvirnega besedila, "abstraktno povzemanje" pa pomeni, da je mogoče v povzetku ustvariti novo vsebino.