Kas ir apkopojums?
Teksta apkopošana ir teksta bloka apkopošanas process, lai to saīsinātu.
Ģeneratīvie mākslīgā intelekta modeļi, piemēram, GPT-5, GPT-4, LLaMA 3, Yi 34B un Mixtral 8x7B, ļoti labi veic teksta apkopošanu.
Pieņemsim, ka jums ir šāds teksta bloks:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Šis tehniskais apraksts ir diezgan garš, un, iespējams, ne visas šīs detaļas ir nepieciešamas, lai lasītājs saprastu vispārējo ideju. Tāpēc tagad mēs vēlamies izmantot mašīnmācīšanos, lai automātiski apkopotu šo teksta fragmentu.
Apkopojuma modelis dotu kaut ko līdzīgu:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Interesanti, vai ne? Kā redzat, vispārējā ideja joprojām ir saglabājusies, taču ir izņemtas daudzas detaļas. Tādējādi teksts ir uz pusi mazāks par sākotnējo izmēru!
Ir vairāki kopsavilkumu veidi. Piemēram, "virsrakstu ģenerēšana" ir saistīta ar ļoti īsa teikuma ģenerēšanu, kas ir lieliski piemērots bloga vai ziņu virsrakstam. "Dialoga kopsavilkuma veidošana" ir saistīta ar visa dialoga pārvēršanu saīsinātā versijā. "Ekstrakcijas kopsavilkums" nozīmē, ka kopsavilkums tiek veidots tikai no teikumiem no oriģinālā teksta, savukārt "abstraktā kopsavilkuma veidošana" nozīmē, ka kopsavilkumā var izveidot jaunu saturu.