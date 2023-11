Tech

A mesterséges intelligencia azt is kitalálja, hol élünk és mennyit keresünk

A GPT-4-hez hasonló nagy nyelvi modellek képesek voltak azonosítani az emberek személyes adatait a közösségi médiában közzétett bejegyzéseik elemzésével. 2023.11.01 14:39 ma.hu Kinyomtatom + Nagyobb betűméret - Kisebb betűméret

A GPT-4-hez hasonló nagy nyelvi modellek (LLM) akár 85 százalékos pontossággal képesek azonosítani egy személy korát, lakóhelyét, nemét és jövedelmét pusztán a közösségi médiában közzétett posztjainak elemzésével - írta a Newscientist.



Robin Staab és Mark Vero, a svájci ETH Zürichben kilenc LLM-mel fésültettek át egy Reddit-posztokból álló adatbázist, hogy a felhasználók írásmódjából azonosító információkat szedjenek ki.



Staab és Vero véletlenszerűen kiválasztotta 1500 olyan felhasználó profilját, akik aktívak voltak a platformon, majd ezeket leszűkítették 520 olyan felhasználóra, akiknél biztosan azonosítani tudták az olyan jellemzőket, mint a születési hely, a jövedelmi helyzet, a nem és a lakóhely, akár a profilban, akár a posztokban.



Miután a felhasználók bejegyzésinek előzményeit betöltötték az LLM-nek, néhány egyből nagy pontossággal azonosítani tudtott a fenti attribútumok közül sokat. A GPT-4 érte el a legmagasabb általános pontosságot 85 százalékkal, míg az LlaMA-2-7b, egy viszonylag kis teljesítményű LLM, 51 százalékkal volt a legkevésbé pontos modell.



"Ez azt mutatja, hogy sok személyes adatunkat adjuk ki az interneten anélkül, hogy belegondolnánk" - mondja Staab. "Sokan nem feltételeznék, hogy az írásmódjukból közvetlenül következtetni lehet a korukra vagy a tartózkodási helyükre, de az LLM-ek igenis képesek erre."



Néha kifejezetten személyes adatok szerepeltek a posztokban. Például egyes felhasználók a pénzügyi tanácsadással foglalkozó fórumokon teszik közzé a jövedelmüket. De a mesterséges intelligencia finomabb jeleket is felfogott, például a helyspecifikus szlenget, és a felhasználó szakmájából és tartózkodási helyéből meg tudta becsülni a fizetések nagyságrendjét is.



Összességében, néhány jellemzőt könnyebben felismertek a mesterséges intelligenciák, mint másokat. A GPT-4 97,8 százalékos pontossággal találta ki a nemet, de csak 62,5 százalékos pontossággal a jövedelmet.



"Még csak most kezdjük megérteni, hogyan befolyásolhatja a magánéletet az LLM-ek használata" - mondja Alan Woodward, a brit Surrey Egyetem munkatársa.