Készül a történelmi dokumentumok Google-ja
2009. szeptember 4. 08:33
Izraeli kutatók egy olyan speciális számítógépes programot fejlesztettek ki, amelynek segítségével a korábban megfejthetetlen szövegek is olvashatóvá válnak, és ami egy Google-hoz hasonló kereső megszületését hozhatja magával a történelmi szövegek világában.
A most kifejlesztett program egy olyan speciális mintafelismeréssel dolgozik, amelyet az igazságügyi és bűnüldöző szervek korábban az ujjlenyomatok azonosításához és összehasonlításához használtak. Ebben az esetben azonban a program betűket, szavakat és kézírási stílusokat elemez - ezzel pedig megkönnyíti a történészek és nyelvészek munkáját, akiknek ez a tevékenység korábban hosszú óráit és napjait vette el.
A hasonló minták elemzésével az algoritmus azokat a szövegrészeket is kitölti, amelyek elhalványultak az évszázadok folyamán, vagy azokat is képes megtalálni, amelyekre később más szöveget írta - számolt be minderről a negevi Ben-Gurion Egyetem kutatója, a program egyik tervezője, Itaj Bar-Joszif. Elmondása szerint az algoritmus minél több szöveget elemez, annál pontosabb és megbízhatóbb lesz majd.
A számítógép a szövegek digitális változatával dolgozik, és pixelenként elemzi a képet, és azok sötétségével határozza meg, hogy ott szöveg van-e; miután azt elkülönítette a háttértől, képes meghatározni az egyes betűket és szavakat is.
A kutatók egyelőre ókori héber szövegekkel dolgoztak, de szerintük a program minden más nyelvvel is képes megbirkózni - ehhez Bar-Joszif szerint még két évre van szükségük. Szerintük ahogy a könyvtárak folyamatosan digitalizálják gyűjteményüket, az ő vívmányukkal a kézírásos szövegek adatbázisát is elkészíthetik, így a szakemberek korábban több évig tartó munkája mostantól alig pár percre rövidülhet.
A kutatók az erről szóló tanulmányt a Pattern Recognition című szakfolyóirat online számában tették közzé.