Las filtraciones de datos, ya sea a través de hackeos o errores humanos, se suelen producir cada pocos meses en todo tipo de plataformas online y redes sociales. Ahora, las que se han visto afectadas han sido Instagram, TikTok y YouTube, con casi 235 millones de cuentas que han aparecido en una base de datos.
La base de datos pertenece a la empresa Social Data, la cual vende datos de influencers de redes sociales a empresas. Entre esos datos, por suerte, no hay contraseñas u otro tipo de información que permita un no autorizado a esas cuentas, pero sí que hay multitud de datos sensibles.
Social Data: recopilando nombres, emails, teléfonos y toda información pública
Entre ellos, encontramos el nombre completo,
Instagram, la más afectada por el scraping de Deep Social
El scraping consiste en recopilar información de páginas web de manera automática. Aunque la información que tiene Social Data es pública, hacer esto va contra los términos y condiciones de uso de redes sociales como Facebook, Instagram, TikTok y YouTube. Es muy difícil distinguir a un bot que está realizando scraping frente a la actividad de un normal.
Los investigadores afirman que no saben cuánto tiempo estuvieron los datos expuestos previo a su descubrimiento el pasado 1 de agosto. Según las pruebas que han hecho ellos mismos en el pasado, los hackers suelen descubrir este tipo de bases de datos tan sólo unas horas después de estar expuestas.
En total, los datos filtrados son los siguientes:
- 96.714.241 registros de Instagram
- 95.678.713 registros de Instagram
- 42.129.799 registros de TikTok
- 3.955.892 registros de YouTube
El scraping se sigue haciendo, a pesar de estar prohibido
En torno a uno de cada cinco registros contenía una dirección de correo electrónico o un número de teléfono, los cuales son bastante sensibles porque pueden lanzarse ataques de phishing personalizados. También pueden usar las fotos para suplantar la identidad de s, crear bots con identidades falsas, o usarlos para entrenar sistemas de reconocimiento facial.
Así, aunque Facebook y otras redes sociales prohíban el scraping, éste sigue ocurriendo en la actualidad, ya que no pueden bloquear a los bots que van pululando por la red. Es tan sencillo como coger un perfil e ir buscando entre sus amigos y amigos de amigos, almacenando toda la información disponible de cada uno de los perfiles públicos.
Deep Social afirma haber tenido como clientes a empresas como Samsung, Heineken, L’Oreal, Unilever, Walmart, Amazon, Disney y Booking.com, y cumplir con las normas de la RGPD. La compañía cerró en 2018, mientras que Social Data se lanzó en agosto de 2019, realizando la misma actividad que la anterior.