Tavaly év végén már az mfor.hu is beszámolt arról a Chicago Innovációs díjat nyert szoftverről, mely algoritmusokkal a kiválasztott adatokból egy teljes szöveget rak összeg. A szoftver fejlesztője, Kristian Hammond most a Wired magazinnak beszélt a Narrative Science (NS) várhatóan fényes jövőjéről.
Idén 1,5 millió robot-cikk
Hammond a lapnak elárulta, a tavalyi évben már 400 ezer robot-cikk született meg. A cikkekről ráadásul meg sem lehet mondani, hogy robot írta volna őket. Szemléltetésként álljon itt egy rövidhír, melyet a téma miatt eredeti nyelven közlünk:
"Friona fell 10-8 to Boys Ranch in five innings on Monday at Friona despite racking up seven hits and eight runs. Friona was led by a flawless day at the dish by Hunter Sundre, who went 2-2 against Boys Ranch pitching. Sundre singled in the third inning and tripled in the fourth inning … Friona piled up the steals, swiping eight bags in all …"
Azt maga Hammond is elismeri, hogy nem olyan, mintha egy elismert sportriporter írta volna, de kevésbé jelentős sportesemények esetében, melyekre amúgy költségtakarékosság miatt nem is küldenek riportereket a lapok, teljesen alkalmas tudósító az NS szoftver. A társalapító és fejlesztő tavaly egy újságíróknak tartott konferencián úgy nyilatkozott: a következő 15 évben a hírek 90 százaléka készülhet majd a szoftver segítségével. 2012-re pedig "mindössze" másfél millió cikket prognosztizált, mely a Narrative Science által készülhet.
Hammond ugyanakkor meg is nyugtatja azokat az újságírókat, akikben ez a jövőkép félelmet keltene: ez a "robothír-cunami" nem fogja elmosni a szakmában dolgozókat. Most legalábbis még biztosan nem. Ehelyett olyan feladatokat láthat el, az adatelemzésektől kezdve a trendek vizsgálatán át az eseménybeszámolókig, melyekre az újságírók feladatköre már nem tud kiterjedni. A robotoknak így hát jelentős szerepe lesz a jövő újságírásában. Nemrég azonban szembesítették Hammondot egy korábbi nyilatkozatával, mely szerint egy számítógép 20 éven belül Pulitzer-díjat is nyerhet az írásával. Ma ezzel a fejlesztő már nem ért egyet. "Ez fog történni, de 5 éven belül" - mondta.
Több lépéses működés
Az NS motorja több lépésből áll - ismertette Hammond a folyamatokat - először is kiváló minőségű adatokat kell felhalmozni, melyek egyaránt kötődhetnek a sporthoz, vagy a pénzügyekhez. Ezek azért fontosak, mert például a meglévő adatokból akár meccs közben is a megfelelő algoritmuson keresztül le lehet vezetni, hogy egy-egy fontos pillanat után melyik csapatnak mennyi lesz az esélye a győzelemre. Majd mindezek mögött szükséges egy olyan információs háttér, mely alapján a szoftver tudja, hogy például a legtöbb hazafutással nyerte meg egy csapat a játékot. A szoftver fejlesztői így egy sor vállalati jövedelmekhez, vagy sporteseményekhez kapcsolódó szabályt építettek be a rendszerbe. És hogyan lesz mindebből egy teljes szöveg?!
Az NS csapata több képzett újságírót bérelt fel, hogy megírják a sablonokat, ugyanakkor együttdolgoztak a mérnökökkel is, hogy a számítógép majd beazonosíthassa az adatokhoz illeszkedő szöveget: ki nyerte a játékot, hatalmas győzelem volt, vagy csúnya vereség? Egy játékosnak az adott esemény kiemelkedő teljesítmény volt-e, vagy átlagon aluli? Majd az algoritmusok kiválasztják a megfelelő szavakat, és mondatokat alkotnak a sémák szerint.
Nemcsak a médiában hasznos
Miután a narratív tudomány elsajátította a sport- és pénzügyek világát, a fejlesztőcég felismerte, hogy a programban sokkal több rejtőzik az egyszerű cikkírásnál. A felhalmozott nagymennyiségű adatok kezeléséből mások is hasznot húzhatnának, így például azok, akik rengeteg adattal dolgoznak nap mint nap, és sokszor rengeteg idejük elmegy arra, hogy a kulcsfontosságú részeket megtalálják az esetlegesen zavaró információk mellett.
Jelenleg azonban elsősorban az újságírásra fókuszálnak a fejlesztők. Hammondék azt szeretnék elérni, ha egy-egy sportesemény már olyan nem számszerű információkkal is ki lenne bővítve, mint például a játékos sérülések, vagy a jogi problémák. A pénzügyi területen pedig szeretnék, ha a szoftver össze tudná kapcsolni például a részvények árfolyamának változását olyan információkkal, mint például a csoportos leépítés, vagy korszerűsítés, hiszen ezek mind befolyással vannak a tőzsdei árakra.
Hammond szerint az első lépés a rövidhír volt, a történetek fejlődésén keresztül pedig eljutnak majd a részletes, hosszabb formában megírt anyagokig, ráadásul a folyamatosan bővülő adatbázis révén egyre kevesebb korlát marad.
mfor.hu