Vad är sammanfattning?
Textsammanfattning är helt enkelt processen att sammanfatta ett textblock för att göra det kortare.
Generativa AI-modeller som ChatGPT, GPT-3.5, GPT-4, LLaMA 3, Yi 34B och Mixtral 8x7B är mycket bra på att utföra textsammanfattningar.
Låt oss säga att du har följande textblock:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Denna tekniska beskrivning är ganska lång och kanske är inte alla dessa detaljer nödvändiga för att en vanlig läsare ska förstå den allmänna idén. Därför vill vi nu utnyttja maskininlärning för att automatiskt sammanfatta denna text.
En sammanfattningsmodell skulle ge något i den här stilen:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Visst är det intressant? Som du kan se finns den allmänna idén kvar, men massor av detaljer har tagits bort. Det gör texten hälften så stor som den var från början!
Det finns flera olika typer av sammanfattningar. Till exempel handlar "headline generation" om att generera en mycket kort mening, perfekt lämpad för en blogg- eller nyhetstitel. "Dialogsammanfattning" handlar om att omvandla en hel dialog till en komprimerad version. "Extraherande sammanfattning" innebär att sammanfattningen endast består av meningar från originaltexten, medan "abstraherande sammanfattning" innebär att nytt innehåll kan skapas i sammanfattningen.