Mitä on tiivistäminen?
Tekstin tiivistäminen on yksinkertaisesti tekstilohkon tiivistämistä sen lyhentämiseksi.
Generatiiviset tekoälymallit, kuten GPT-5, GPT-4, LLaMA 3, Yi 34B ja Mixtral 8x7B, ovat erittäin hyviä tekstin tiivistämisessä.
Oletetaan, että sinulla on seuraava tekstilohko:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building, and
the tallest structure in Paris. Its base is square, measuring 125 metres (410 ft) on each side.
During its construction, the Eiffel Tower surpassed the Washington Monument to become the tallest
man-made structure in the world, a title it held for 41 years until the Chrysler Building in New
York City was finished in 1930. It was the first structure to reach a height of 300 metres. Due to
the addition of a broadcasting aerial at the top of the tower in 1957, it is now taller than the
Chrysler Building by 5.2 metres (17 ft). Excluding transmitters, the Eiffel Tower is the second
tallest free-standing structure in France after the Millau Viaduct.
Tämä tekninen kuvaus on melko pitkä, eivätkä kaikki nämä yksityiskohdat ehkä ole tarpeellisia, jotta tavallinen lukija ymmärtäisi yleisen ajatuksen. Haluamme siis hyödyntää koneoppimista, jotta voimme automaattisesti tiivistää tämän tekstinpätkän.
Yhteenvetomalli palauttaisi jotain tällaista:
The tower is 324 metres (1,063 ft) tall, about the same height as an 81-storey building. Its
base is square, measuring 125 metres (410 ft) on each side. During its construction, the Eiffel
Tower surpassed the Washington Monument to become the tallest man-made structure in the world.
Eikö olekin mielenkiintoista? Kuten huomaatte, yleisidea on edelleen olemassa, mutta yksityiskohtia on poistettu. Se tekee tekstistä puolet alkuperäisestä koosta!
Tiivistelmiä on useita erilaisia. Esimerkiksi "otsikoiden tuottaminen" tarkoittaa hyvin lyhyen lauseen tuottamista, joka sopii täydellisesti blogin tai uutisen otsikoksi. "Dialogin tiivistäminen" tarkoittaa kokonaisen dialogin muuttamista tiivistetyksi versioksi. "Uuttamalla tiivistäminen" tarkoittaa, että tiivistelmä koostuu vain alkuperäisen tekstin lauseista, kun taas "abstrahoiva tiivistäminen" tarkoittaa, että tiivistelmään voidaan luoda uutta sisältöä.