Τι είναι η περίληψη;
Η περίληψη κειμένου είναι απλώς η διαδικασία της περίληψης ενός τμήματος κειμένου προκειμένου να γίνει συντομότερο.
Τα μοντέλα γεννητικής τεχνητής νοημοσύνης, όπως τα GPT-5, GPT-4, LLaMA 3, Yi 34B και Mixtral 8x7B, είναι πολύ καλά στην εκτέλεση περιλήψεων κειμένων.
Ας υποθέσουμε ότι έχετε το ακόλουθο μπλοκ κειμένου:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Αυτή η τεχνική περιγραφή είναι αρκετά μεγάλη και ίσως δεν είναι απαραίτητες όλες αυτές οι λεπτομέρειες για να κατανοήσει ο απλός αναγνώστης τη γενική ιδέα. Έτσι, θέλουμε τώρα να αξιοποιήσουμε τη μηχανική μάθηση προκειμένου να συνοψίσουμε αυτόματα αυτό το κομμάτι κειμένου.
Ένα μοντέλο σύνοψης θα επέστρεφε κάτι τέτοιο:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Ενδιαφέρον δεν είναι; Όπως μπορείτε να δείτε, η γενική ιδέα εξακολουθεί να υπάρχει, αλλά έχουν αφαιρεθεί πολλές λεπτομέρειες. Το κείμενο γίνεται το μισό του αρχικού του μεγέθους!
Υπάρχουν διάφοροι τύποι περιλήψεων. Για παράδειγμα, η "παραγωγή τίτλων" αφορά τη δημιουργία μιας πολύ σύντομης πρότασης, που ταιριάζει απόλυτα για τον τίτλο ενός ιστολογίου ή μιας είδησης. Η "περίληψη διαλόγου" αφορά τη μετατροπή ενός ολόκληρου διαλόγου σε μια συμπυκνωμένη έκδοση. Η "περίληψη με εξαγωγή" σημαίνει ότι η περίληψη αποτελείται μόνο από προτάσεις από το αρχικό κείμενο, ενώ η "αφαιρετική περίληψη" σημαίνει ότι μπορεί να δημιουργηθεί νέο περιεχόμενο στην περίληψη.