Nu poti sa te ascunzi de Twitter

Conform unei cercetari realizate de catre Mitre Corporation, “Discriminating Gender on Twitter“, ce va fi prezentata la Conferinta privind metodele empirice de procesare a limbajului natural (conferinta ce va avea loc saptamana aceasta in Scotia, un computer care ruleaza un algoritm de identificare a limbajului isi poate da seama daca un anumit tweet este scris de o femeie sau de un barbat.

Baza de utilizatori pe care a fost testat algoritmul a constat in proportie de 55% din femei si 45% din barbati, pastrand intr-un mod relativ proportionalitatea utilizatorilor Twitter.

Astfel, plecand de la faptul ca in 55% din cazuri cei care scriu pe Twitter sunt femei, doar prin examinarea numelui si a prenumelui, rata de detectie corecta a genului a ajuns la 89% din cazuri.

Cautand insa doar in tweet-uri, fara a tine cont de numele si prenumele utilizatorului, computerul a putut sa nimereasca in proportie de 75.8% in mod corect genul persoanei.

Chiar si prin analiza unui singur tweet, computerul si-a putut da seama in proportie de 65.9% cui apartine.

Mitre a constatat faptul ca daca un tweet contine anumite caractere sau combinatii de caractere, atunci computerul poate alege mult mai usor genul utilizatorului. De exemplu, daca un tweet contine un semn de exclamare sau o fata zambitoare cel mai probabil, acel tweet a fost dat de o femeie.

Iata lista cuvintelor utilizate in mod frecvent de barbati si de femei:

De asemenea, daca un utilizator foloseste in tweet-urile sale expresii de genul: “my nigga”, “my zipper”, “my wife”, “my jeep”, atunci cel mai probabil este ca acesta sa fie barbat.

In cazul femeilor, cele mai utilizate expresii sunt: “my yogurt”, “my yoga”, “my husband” etc.

Va invit sa cititi articolul complet aici.

Discussion

    • Razvan
    • Razvan

Leave a Reply