Ce este sumarizarea?
Rezumatul textului este pur și simplu procesul de rezumare a unui bloc de text pentru a-l face mai scurt.
Modelele generative de inteligență artificială, precum GPT-5, GPT-4, LLaMA 3, Yi 34B și Mixtral 8x7B, sunt foarte bune la realizarea rezumatelor de text.
Să spunem că aveți următorul bloc de text:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Această descriere tehnică este destul de lungă și poate că nu toate aceste detalii sunt necesare pentru ca un cititor obișnuit să înțeleagă ideea generală. Prin urmare, dorim acum să folosim învățarea automată pentru a rezuma automat acest text.
Un model de rezumare ar returna ceva de genul următor:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Interesant, nu-i așa? După cum puteți vedea, ideea generală este încă acolo, dar au fost eliminate tone de detalii. Textul devine astfel la jumătate din dimensiunea inițială!
Există mai multe tipuri de rezumate. De exemplu, "generarea de titluri" se referă la generarea unei propoziții foarte scurte, perfect potrivită pentru titlul unui blog sau al unei știri. "Rezumatul dialogului" se referă la convertirea unui întreg dialog într-o versiune condensată. "Rezumatul prin extracție" înseamnă că rezumatul este alcătuit doar din propoziții din textul original, în timp ce "rezumatul abstractiv" înseamnă că în rezumat se poate crea un conținut nou.