Što objave na društvenim mrežama govore o nama
Istraživači Sveučilišta u Pennsylvaniji u suradnji s istraživačima Sveučilišta u Cambridgeu proučavali su više od 700 milijuna riječi i izraza koje je na Facebooku objavljivalo 75 tisuća dobrovoljaca. Cilj je bio otkriti može li računalna analiza jezika na društvenim mrežama ponuditi istu razinu uvida u osobnost pojedinca kao klasične psihološke metode poput anketa, testova, upitnika i sličnoga.
Istraživanje je omogućilo stvaranje računalnog modela koji je predviđao dob, spol i osobnost volontera na temelju njihovih riječi i izraza. Sama su se predviđanja pokazala neočekivano preciznima: istraživači su u čak 92 posto slučajeva pogađali spol ispitanika na temelju njihovih objava na Facebooku. Ne zaboravimo pritom da u engleskom jeziku razlike između gramatičkih rodova zapravo ne postoje pa se spol može iščitati tek iz nekoliko zamjenica (he/she, him/her…) ili pojedinih riječi (mother/father, daughter/son...). Dob su, unutar raspona od tri godine, pogađali u više od 50 posto slučajeva, dok su u pogađanju osobnosti bili slabiji, ali u usporedbi s klasičnim testovima gotovo jednako precizni.
Znanstvenici naglašavaju da istraživanje nije bilo usredotočeno na izraze i teme o kojima su najčešće govorili muškarci odnosno žene, nego na izraze koji su ih najviše razlikovali. Jezik koji su upotrebljavali muškarci i jezik koji su rabile žene pokazali su se gotovo jednakima i da riječi u oblačićima (kao na ilustraciji) pokazuju apsolutnu učestalost, oblačići bi bili gotovo identični. No ovo se istraživanje usredotočilo na razlike u jeziku jer su zapravo one važne za razvoj računalnog modela uz čiju bi se pomoć moglo najtočnije odrediti je li netko primjerice muškarac ili žena.
Iako je dakle jezik muškaraca i žena gotovo jednak, upravo su se razlike pokazale iznimno stereotipnima. Primijetilo se tako da muškarci češće razgovaraju o sportu, videoigrama i ratu te da češće upotrebljavaju psovke i vulgarne izraze. Žene češće razgovaraju o kupnji i kosi, ali i češće upotrebljavaju prvo lice jednine. Vrlo je zanimljiva usporedba upotrebe posvojne zamjenice moj (moja): muškarci je upotrebljavaju češće kada govore o svojoj djevojci ili supruzi nego što je upotrebljavaju žene kada govore o svojem dečku ili suprugu.
Raščlanjivanje riječi prema dobi očekivano je pokazalo da školarci češće od ostalih govore o školi, a studenti o fakultetskim temama (ali ih dobrano začinjaju psovkama). Ispitanici u dvadesetim godinama nešto se više brinu oko posla, piva i vjenčanja, dok su stariji ispitanici usredotočeniji na svoju djecu i obitelj.
Što se tiče određivanja osobnosti, ispostavilo se da ekstroverti više vole govoriti o zabavama i suprotnom spolu te da upotrebljavaju duže riječi, dok introverte više zanimaju računala, internet i japanski mediji (anime, mange), a i skloni su upotrebi „japanskih” emotikona (ˆ_ˆ). Primijetilo se i da ispitanici koji žive na višim nadmorskim visinama češće upotrebljavaju riječ „planina”, dok neurotični ljudi često spominju izraze „mučno” i „depresivan”. No vjerojatno nitko nije očekivao da je emocionalna stabilnost u uskoj vezi s ljubavlju prema košarci. Naravno, iz ovoga se ne smije zaključivati da bavljenje sportom utječe na smanjivanje neuroze (iako bi ovu mogućnost valjalo detaljnije proučiti), naime moguće je da ljudi koji pate od neuroze jednostavno izbjegavaju sport.
Iako je ovo prvo veliko istraživanje ove vrste, autori su zaključili da model osobnosti koji se temelji na jeziku društvenih mreža može pomoći znanstvenicima u radu: umjesto da traže milijune volontera da ispunjavaju ankete, u budućim će istraživanjima možda biti dovoljno imati volontere koji će dopustiti da se anonimno analiziraju njihove javne objave na Facebooku ili Twitteru.
Izvor: Personality, Gender, and Age in the Language of Social Media: The Open-Vocabulary Approach, PLOS ONE