Tavaly negyedévente csaknem kétmilliárd kamuprofilt távolított el a Facebook, nemrég pedig arról is beszéltek, hogyan hívják ehhez a feladathoz segítségül a gépi tanulás folyamatát. A hamis profilokat leggyakrabban spamek küldésére, adathalászathoz és csalásokhoz használják illetve vírusokat küldenek szét a felhasználók között.
Egyébként két részre oszthatók a kamuprofilok. Az egyik részbe tartoznak azok, amiknek gyakorlatilag oldalnak (page) kellene lenni, mégis természetes személyként vannak feltüntetve. Néhány vállalkozás csinálja ezt, illetve ide sorolhatóak mondjuk a kisállatok profiljai is. Ez még egyszerű, mert csak átkonvertálják oldallá, és a probléma megoldódott. A másik csoport viszont már veszélyesebb. Ezek azok a személyes profilok, amiket adathalászatra, spammelésre és bármi olyan dologra használnak, amik megsértik a felhasználási szabályzatot. Ezeket még károkozás előtt el kell tüntetni az oldalról.
A Facebook annyira komolyan veszi ezt, hogy egyenesen az a célja, hogy az ilyen oldalakat még az előtt kiszűrje, hogy aktiválnák, ehhez pedig az kell, hogy már az oldal készítése közben jelezzenek az algoritmusok. Miután egy profil elkészül, ezek az algoritmusok elkezdik mélyen elemezni a személyt, ezt hívja a Facebook úgy, hogy Deep Entity Classification (DEC).
Ez a DEC elemzi a felhasználó kapcsolati rendszerét, mivel teljesen máshogy néz ki egy valós és egy kamuprofil kapcsolatainak szerkezete, illetve ezen kívül is több mint 20 ezer szempont szerint karakterizálják a profilokat, majd ezek alapján szűrik ki a nem valós személyeket.
Azt írja a Facebook, hogy mióta ezt csinálják, azóta öt százalék alatt van a kamuprofilok aránya. Egyébként ha ezt számra váltjuk, még így is rengeteg, ugyanis az öt százalék még mindig havi 125 millió aktív kamuprofilt jelent. Ezért a jövőben valahogy keverni szeretnék a fentebbi gépi tanulást és a valós emberi beavatkozást.
Mi csak szurkolni tudunk ennek.