Kas yra apibendrinimas?
Teksto apibendrinimas - tai tiesiog teksto bloko apibendrinimo procesas, siekiant jį sutrumpinti.
Generatyviniai dirbtinio intelekto modeliai, tokie kaip GPT-5, GPT-4, LLaMA 3, Yi 34B ir Mixtral 8x7B, labai gerai atlieka teksto apibendrinimą.
Tarkime, turite tokį teksto bloką:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Šis techninis aprašymas yra gana ilgas ir galbūt ne visos šios detalės yra būtinos, kad paprastas skaitytojas suprastų bendrą idėją. Todėl dabar norime pasinaudoti mašininio mokymosi priemonėmis, kad galėtume automatiškai apibendrinti šį tekstą.
Apibendrinimo modelis pateiktų maždaug tokį rezultatą:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Įdomu, ar ne? Kaip matote, bendra idėja išliko, tačiau buvo pašalinta daugybė detalių. Dėl to tekstas tampa perpus mažesnis nei pradinis!
Yra kelios apibendrinimų rūšys. Pavyzdžiui, "antraštės generavimas" - tai labai trumpo sakinio, puikiai tinkančio tinklaraščio ar naujienos pavadinimui, generavimas. "Dialogo apibendrinimas" - tai viso dialogo pavertimas sutrumpinta versija. "Ekstrakcinis apibendrinimas" reiškia, kad santrauka sudaroma tik iš originalaus teksto sakinių, o "abstrakcinis apibendrinimas" reiškia, kad santraukoje galima sukurti naują turinį.