Question à l'expert: Est-il vrai que les réseaux sociaux nous surveillent?
Dmitry Kurkin
RÉPONSES À LA MAJORITÉ DE QUESTIONS DES ÉTATS-UNIS nous avions l'habitude de rechercher en ligne. Dans la nouvelle série de documents, nous posons de telles questions: brûlantes, inattendues ou généralisées - à des professionnels de divers domaines.
Le flash mob du Défi de 10 ans, lancé sur les réseaux sociaux au début de l’année, a non seulement donné lieu à des théories du complot selon lesquelles l’objectif de la campagne était de collecter des photos des utilisateurs et de les former à reconnaître le système de reconnaissance faciale, mais aussi de leur faire réfléchir à nouveau sur ce qu’ils savent de nous. les réseaux sociaux et les tiers qui travaillent avec eux (des sociétés commerciales aux agences gouvernementales).
Le fait que des géants de la technologie collectent et analysent quotidiennement les traces dites numériques laissées par des milliards d'utilisateurs n'est un secret pour personne. Et cette prise de conscience suscite un nouveau type de peur du «grand frère»: les réseaux sociaux en savent beaucoup sur nous, mais que faire s'ils en savent trop sur nous? Peut-on utiliser les mégadonnées pour connaître tous les liens, les goûts, les habitudes d’une personne, son passé et son présent? Et si oui, quel mal peut nous causer notre désir de socialiser en ligne, dans le but de partager volontairement des informations sur nous-mêmes,?
Nous avons interrogé des experts sur le traitement des données utilisateur par les grandes entreprises et sur le danger d'héritage sur les réseaux sociaux.
Liliya Zemnukhova
Chercheur au Centre de recherche scientifique et technologique de l'Université européenne de Saint-Pétersbourg
Une empreinte numérique contient tous les types de données possibles - textes, images, enregistrements audio et vidéo, géolocalisation et beaucoup de métadonnées (par exemple, modèle de gadget, opérateur mobile, système d'exploitation, dynamique et durée des visites, etc.). Et ce n’est pas seulement nous qui reconstituons notre empreinte numérique. Les réseaux sociaux nous forment en tant qu'utilisateurs à l'aide de trois sources de données: le fait que nous rendions compte de nous-mêmes; que d'autres parlent de nous; et ce qui se passe le plus souvent à notre insu. Surtout opaque dernier. En règle générale, nous ne lisons pas les contrats d'utilisation ni les politiques relatives à la collecte et à l'utilisation de données personnelles. Nous notons seulement que cette "boîte noire" influence en quelque sorte notre expérience utilisateur: publicité ciblée, suggestions d'amis, recommandations pour la musique, procédure de lancement des nouvelles ... Nous construisons nous-mêmes une petite partie de cette expérience, lorsque nous construisons manuellement le fil d'actualités, mais principalement des algorithmes effectuer les fonctions intégrées dans les profils par défaut. C'est pourquoi nous ne nous débarrasserons jamais de la publicité contextuelle ou des suggestions intrusives de groupes ou d'amis (non). En tant que sociétés, les réseaux sociaux utilisent les données relatives à leurs utilisateurs à des fins commerciales, offrant ainsi leur plate-forme pour la vente de contenu ciblé. Et en cours de route, ils continuent à collecter des données nous concernant: par exemple, si vous avez payé la publicité au moins une fois, les données de la carte bancaire et de la transaction restent également à la société. Les données peuvent également être fournies aux agences gouvernementales lorsque le besoin s'en fait sentir: par exemple, Facebook collabore régulièrement avec des agences gouvernementales américaines, conformément à sa politique de transparence.
Outre la politique interne des réseaux sociaux, il existe un autre détail important: les comptes peuvent être associés à des centaines de milliers d'autres applications et fonctions. C’est par exemple la raison des grandes discussions qui ont eu lieu l’année dernière sur l’accès des tiers aux données des utilisateurs. Une tentative importante de réglementation de la liberté des développeurs a été réalisée dans l'Union européenne - le règlement général sur la protection des données (RGPD) est entré en vigueur l'année dernière. Il a décidé de ne pas transférer les problèmes de données, mais a attiré l'attention des utilisateurs sur cette question. Cela ne nous oblige pas à lire tous les contrats d'utilisation, mais cela nous oblige à réfléchir et au moins à être plus responsables de nos empreintes numériques et à respecter les règles élémentaires de l'hygiène numérique.
Valeria Karavaeva
Data Scientist chez Spiking
Parfois, nous ne pensons pas au nombre de pistes que nous laissons sur le Web ni à la mesure dans laquelle cela aide plus tard les entreprises, pas seulement les réseaux sociaux - bien que les réseaux sociaux également. Les réseaux sociaux collectent des données non seulement pour eux-mêmes, mais aussi pour les vendre. Je le sais, car je travaillais dans une agence de publicité et nous achetions des données sur Facebook. Et le plus souvent, nous, les utilisateurs, donnons notre consentement sans le savoir. Les gens passent la moitié de leur vie sur les réseaux sociaux et donnent beaucoup d’informations sur eux-mêmes.
Mais il était possible de collecter des données auparavant - alors pourquoi avez-vous commencé à parler du big data récemment? Tout d'abord, parce que la puissance de calcul augmente et, par conséquent, devient moins chère. Le problème principal du Big Data n’est pas de savoir comment collecter des données - en principe, chacun de nous peut aujourd'hui collecter et stocker des téraoctets d’informations - mais comment les utiliser. La plupart des données obtenues à partir des réseaux sociaux (texte, voix, images, vidéo) ne sont en aucune manière structurées. Par conséquent, sans apprentissage automatique, le big data est inutile. Maintenant que la puissance et la mémoire sont devenues moins chères, la demande de réseaux de neurones et d’apprentissage en profondeur a augmenté - nous avons finalement appris à traiter de grandes baies de données.
Prenez, par exemple, des images - et il s’agit vraiment de données volumineuses, elles peuvent donner beaucoup d’informations. Il y a des millions de photos, mais que faire avec elles? Quels avantages peuvent en être extraits? Quels modèles vous ont-ils laissé savoir? En fait, l’apprentissage automatique n’a pas encore disparu. Ce n’est pas un processus aussi simple qu’il semble: il n’existe pas de pression sur un bouton ni de calculs complets en une semaine.
L'apprentissage automatique est directement précédé de tâches plus complexes. Les mêmes images doivent d’abord être traitées correctement (par exemple, des photos recadrées et centrées; c’est important pour l’apprentissage) - c’est la première étape, qui prend généralement beaucoup de temps. La deuxième étape consiste à choisir une architecture de réseau adaptée à la résolution du problème. En gros, vous construisez dix réseaux de neurones différents et ils donnent dix résultats différents. Ensuite, vous devez en quelque sorte évaluer les résultats. Et après cela, avec une forte probabilité, vous revenez à la première étape. Il est impossible de créer un réseau universel pour une tâche donnée: vous le construisez à partir de zéro ou vous en modifiez un déjà existant. La reconnaissance des visages est une tâche, la reconnaissance des chats en est une autre.
Dans le processus d’apprentissage automatique, nous participons également, sans le savoir. Par exemple, en introduisant captcha sur des sites: à l’aide de captcha, Google a formé des réseaux de neurones à la numérisation de livres.
Nous devons comprendre que les entreprises qui collectent des données volumineuses ne sont pas intéressées par nos profils personnels. Ils ont besoin de données sur un grand nombre de personnes différentes qui s'intéressent à quelque chose de spécifique. En ce qui concerne les services spéciaux, je pense qu'ils peuvent collecter des données sans recourir aux réseaux sociaux. Je pense que nos craintes d'être surveillés disparaîtront bientôt. C'est le nouveau monde: il est possible de ne pas hériter du Web, mais c'est difficile. Il est plus facile de ne pas apparaître sur le Web du tout.
PHOTOS: antonsov85 - stock.adobe.com