Áttekintés terjedelmes dokumentumokról

Nem kell vacakolni ezer oldalakkal, kiolvassa a lényeget egy szoftver

A jövőben szoftvermegoldás fogja segíteni a felhasználókat hosszú szövegek, például gyakran ezer oldalt is meghaladó ajánlati felhívások jobb elemzésében.

2014.08.04 03:34ma.hu
Fotó: Bayerische Staatsbibliothek / H.-R. Schulz

A Siemens globális kutató részlege, a Corporate Technology olyan kereső funkciót fejlesztett ki, amely a felhasználók számára lehetővé teszi, hogy egyidejűleg kulcsszavakat és szövegrészeket keressenek egy ajánlati felhívás valamennyi dokumentumában anélkül, hogy ténylegesen meg kellene nyitniuk bármely fájlt. Ez rendkívül meggyorsítja a keresést, úgyhogy mindössze néhány milliszekundum múlva a felhasználó már olvashatja is a dokumentumokban a keresés eredményeit. A szakértők olyan komponenst is kifejlesztettek, amely azt vizsgálja, hogy hogyan változtak a követelmények egy adott szöveg korábbi verzióihoz képest. A végső cél olyan szemantikus szoftver megalkotása, amely összefüggéseket ismer fel releváns információk megtalálása érdekében.

A Corporate Technology a szoftvert eredetileg egy megvalósíthatósági tanulmány részeként fejlesztette ki, amely Németország valamennyi telekkönyvének digitalizálására irányul. Olyan rendszerre volt szükség, amely az elmúlt 50 év mintegy 500 millió pdf oldalnyi telekkönyvéből automatikusan rögzít a tulajdonosokra, telekméretre, vagy jelzálog-terhelésre és más mutatókra vonatkozó információkat. A szoftvernek képesnek kellett lennie a kívánt információk rögzítésére a dokumentum-struktúra segítségével. Ugyancsak működőképesnek kellett lennie gépelt oldalak rossz minőségű másolatainak vagy többszörösen javított dokumentumoknak az esetében.

A szoftver ipari ajánlati felhívásokra való továbbfejlesztésében a CT kutatói szorosan együttműködnek a Siemens különféle üzleti területeit képviselő kollégáikkal. Ennek alapján a kutatók karakterisztikus kereső algoritmusokat fejlesztenek, amelyek révén a felhasználók bizonyos témákat – pl. biztonság, környezetszennyezés ellenőrzése – érintő minden információt megtalálnak egy adott dokumentumban.

Mivel egy projekt lefutása során az ajánlati felhívásokat ismételten módosítják, a szoftver egy második lépésben azonosítja és kijelzi a felhasználó számára a dokumentum előző verzióihoz képest beállt változásokat. Egy harmadik lépésben a szoftver analógiákat keres korábbi, hasonló ajánlati felhívásokhoz, miáltal a felhasználó láthatja, hogy bizonyos követelményeket hogyan értékeltek annak idején. Nagy terjedelmű dokumentumok szemantikus kiértékelése végül is időt takarít meg, elkerüli a hibákat, és a felhasználóknak egyszerűbbé teszi korábban rövid határidővel tett módosítások integrálását és elemzését.

Figyelem! A cikkhez hozzáfűzött hozzászólások nem a ma.hu network nézeteit tükrözik. A szerkesztőség mindössze a hírek publikációjával foglalkozik, a kommenteket nem tudja befolyásolni - azok az olvasók személyes véleményét tartalmazzák.

Kérjük, kulturáltan, mások személyiségi jogainak és jó hírnevének tiszteletben tartásával kommenteljenek!

Amennyiben a Könyjelző eszköztárába szeretné felvenni az oldalt, akkor a hozzáadásnál a Könyvjelző eszköztár mappát válassza ki. A Könyvjelző eszköztárat a Nézet / Eszköztárak / Könyvjelző eszköztár menüpontban kapcsolhatja be.