Aller au contenu principal

Nan Zhao, nouveau docteur en informatique

10 septembre 2015

Le vendredi 4 Septembre 2015 a eu lieu la soutenance de la thèse de Nan Zhao. Cette thèse intitulée « Study and Measurement of Digital Culture Goods over Internet » (Étude et Mesure des Biens Culturels Numériques sur Internet) était co-encadrée par Hadopi et l’école Telecom ParisTech.

Nan Zhao a soutenu sa thèse le 4 septembre 2015 dans les locaux de Télécom ParisTech, devant un jury présidé par monsieur Nace, professeur à l’Université de Technologie de Compiègne, membre du Laboratoire Heudiasyc et composé de membres de Télécom ParisTech, de l’Hadopi, du CNAM, de la faculté d’économie de Montpellier et de l’Ecole Pratique des Hautes Etudes de Paris.  Le travail conduit lors de cette thèse et réalisée durant trois années au sein des locaux de l’Hadopi, a initié un nouveau champ de recherche, croisant plusieurs domaines dont l’informatique, les statistiques et la sociologie. Ce champ de recherche que les membres du jury ont qualifié  d’« ethnologie du numérique » permet d’offrir une compréhension plus profonde des comportements et consommations des internautes.

Cette thèse s’est concentrée sur trois modes de consommation : les sites de partage de vidéos en streaming, les cyberlockers et les annuaires de liens.

Avec un service en streaming, l’utilisateur n’a pas besoin d’obtenir préalablement une copie de l’œuvre sur son appareil. Il peut profiter des contenus via les lecteurs numériques embraqués sur les navigateurs. Les sites de partage de vidéos en streaming, en plus de permettre de  profiter des contenus, permettent aux utilisateurs d’en publier. Sur ces sites, les utilisateurs peuvent aussi commenter les contenus, suivre les « uploadeurs » et ajouter des avis. Les travaux menés sur YouTube ont notamment fait ressortir  l’existence de trois catégories dominantes sur  cette plateforme. Les médias représentent la part la plus importe, avec 29,51%  (parties ou intégralité d’émission télé, de documentaire, de rencontres sportives, etc.), viennent ensuite les séries avec 25,96% (bande annonce, partie ou intégralité d’un épisode de série) et enfin la musique avec 12,96% (clips musicaux, concerts, etc.). Ces résultats révèlent que YouTube est désormais plus utilisé comme moyen de diffusion d’objets culturels que pour partager des vidéos personnelles. Cette thèse tend également à prouver l’existence de la « longue traine » (Proportionnellement, il existe un nombre relativement petit de vidéos avec de nombreuses vues. La longue traîne composée d’un nombre considérable de vidéos n’ayant que très peu vues.) sur YouTube.

Un cyberlocker est un service permettant de stocker et de télécharger des fichiers. Les fichiers stockés sur un cyberlocker sont accessibles via un lien URL. C’est avec ces liens que les internautes peuvent localiser et télécharger ces fichiers (généralement via le protocole HTTP ou HTTPS). Le travail mené sur Megashares, SpeedyShare, RapidGator et 1Fichier durant cette thèse révèle notamment des différences significatives dans les finalités d’usages réservées à ces différents cyberlockers. En 2013, RapidGator semblait être majoritairement utilisé pour mettre à disposition des biens culturels numériques (essentiellement film, série télé et album de musique). Speedyshare et 1Fichier étaient également utilisés dans ce but, mais l’existence d’usages de ces services à des fins personnelles ont aussi été mis en avant. Megashares, quant à lui, est utilisé pour mettre à la fois à disposition des biens culturels mais est également utilisé à des fins professionnels (échanges de documents).

Une des particularités des cyberlockers est de ne pas fournir de moteur de recherche avec leur service de stockage. Afin de combler ce manque, des sites, permettant de regrouper et de mettre en avant les biens culturels numériques et les ressources stockés sur les cyberlockers, sont apparus. Ce sont les annuaires de liens. Les annuaires de liens sont des forums, dont chaque fil (thread) pointe vers des pages de description de biens culturels numériques. Ces pages contiennent également des liens de cyberlockers permettant aux utilisateurs de pouvoir télécharger les biens culturels correspondant. Les moteurs de recherche des annuaires de liens permettent ainsi de faire une recherche parmi un sous-ensemble des biens culturels stockés sur les cyberlockers. Cette thèse s’est concentrée sur l’annuaire de liens Wawacity. Ces travaux démontrent notamment l’existence de « big uploaders ». Ceux-ci, au nombre de 10, fournissent à eux seuls 81,03% des liens vers des ressources. La thèse propose aussi la première taxonomie complète des ressources présentes sur cet annuaire de lien (type de biens culturels, nature, taille, popularité).


Cette thèse a donné lieu à cinq publications scientifiques ;

Trois en conférences internationales :

  • Nan Zhao, Loïc Baud and Patrick Bellot. Video Sharing Websites Study Content Characteristic Analysis. Proceeding of 10th IEEE RIVF International Conference on Computing and Communication Technologies, November 2013
  • Nan Zhao, Loïc Baud and Patrick Bellot. Characteristics analysis for the Cyberlockers Files: Study on Rapidgator Speedyshare and 1Fichier. Proceeding of 8th IEEE ICITST International Conference for Internet Technology and Secured Transactions, December 2013
  • Nan Zhao, Soufiane Khoudmi, Loïc Baud and Patrick Bellot. A Bird’s Eye View on Wawacity: Characteristics on Contents and Files. Proceeding of 1st IEEE BigMM International Conference on Multimedia Big Data, April 2015


Deux dans des journaux internationaux à comité de lecture :

  • Nan Zhao, Loïc Baud and Patrick Bellot. Exploring Cyberlockers Content. International Journal Multimedia and Image Processing (IJMIP), February 2014
  • Nan Zhao, Loïc Baud and Patrick Bellot. Exploring Video Sharing Websites Content With Machine Learning. International Journal of Distributed System and Technologies (IJDST), June 2014


Ce vendredi 4 septembre 2015, Nan ZHAO a obtenu le grade de Docteur de Télécom ParisTech.


Le manuscrit de thèse sera publié et rendu disponible  dans quelques mois par l’École Doctorale Informatique, Télécommunication et Électronique (EDITE) de Paris.

Tags :