International Essays

Squid Game domine la scène télévisuelle mondiale selon les tendances de Wikipédia

26 octobre 2021
Vitaliy Kaurov, directeur de l’engagement communautaire
Article original
La nouvelle série télévisée coréenne Squid Game a pris le monde d’assaut et est devenue un phénomène mondial. « Squid Game a officiellement atteint 111 millions de fans, ce qui en fait le lancement de série le plus important de notre histoire ! » a annoncé Netflix, son distributeur. Elle s’est classée en tête des audiences dans 90 pays différents, dont les États-Unis, et a été qualifiée de « sensation mondiale portée par le bouche-à-oreille » qui a envahi l’actualité et les réseaux sociaux.
Squid Game a connu une croissance de son audience si rapide, et si massive, que, peu après sa sortie, la série devait générer près de 900 million de dollars à partir d’un budget de production d’environ 20 million de dollars, selon Bloomberg. Le même rapport mentionne également que Netflix ne divulgue pas les détails de ses différentes mesures de données.
Alors, comment peut-on évaluer objectivement une telle popularité explosive, en particulier par rapport à d’autres séries acclamées et tendance ?
Wikipédia en tant que données Les consultations des pages des articles de Wikipédia constituent une source de données publiques intéressante et indépendante, qui peut servir d’indicateur raisonnable pour détecter les tendances de popularité. Une autre alternative typique est le nombre de requêtes pertinentes sur les moteurs de recherche. Mais celles-ci se mélangent facilement avec les recherches portant sur d’autres sujets similaires, en particulier entre différentes langues.
Les statistiques de consultation des pages de Wikipédia est un projet récent dont les données ne remontent qu’au 1er juillet 2015. Mais il accompagne le seul succès récent de Squid Game que j’essaie de quantifier. Les données de Wikipédia sont également très ciblées : elles comportent à la fois des pages dédiées aux séries télévisées et des pages distinctes par langue, et la qualité encyclopédique du contenu attire et aide à évaluer un lectorat véritablement engagé, une qualité généralement très difficile à trouver.
Pour évaluer la « popularité mondiale explosive » (ou la « viralité » ici), j’utiliserai une métrique simple : le nombre le plus élevé de pages vues générées par une émission de télévision en une seule journée, additionné sur neuf langues différentes correspondant aux principales données démographiques linguistiques des utilisateurs de Wikipédia. Il existe des métriques alternatives, mais celle-ci était la plus intéressante pour moi.
Pourquoi Squid Game est-il populaire ? La réflexion du contexte culturel de Squid Game aide à comprendre sa percée auprès du public du monde entier. Je recommande cet article du New York Times de Jin Yu Young, qui couvre Séoul et offre le point de vue d’une initiée. Comme elle le souligne, la croissance économique historiquement forte de la Corée du Sud dans l’ère de l’après-guerre en a fait l’un des pays les plus riches d’Asie, mais les inégalités de richesse se sont également accrues et ont sapé l’unité culturelle nationale.
« Squid Game met à nu l’ironie entre la pression sociale de réussir en Corée du Sud et la difficulté d’y parvenir », déclare Shin Yeeun dans l’article. « Il est vraiment difficile pour les personnes dans la vingtaine de trouver un emploi à temps plein ces jours-ci. » Elle est une diplômée universitaire de 2020 et a subi une recherche d’emploi difficile et prolongée, aggravée par la pandémie de COVID.
La disparité des richesses est l’un des thèmes centraux de Squid Game, se manifestant à travers le labeur quotidien profondément sud-coréen. En même temps, cela fait étroitement écho aux préoccupations du spectateur moyen à l’échelle mondiale, ce qui a contribué à faire de la série un phénomène international.
La controverse, des visuels artistiques dystopiques, la violence et des éléments de sport et de télé-réalité accentuent l’intensité dramatique de la série. Et vous savez qu’un sujet fait largement parler de lui lorsqu’il fait l’objet d’un sketch au Saturday Night Live et d’un dessin du New Yorker.
Collecte des données L’identification des données les plus pertinentes constitue la première étape essentielle. Il n’existe pas de classements véritablement cohérents et en accès libre pour les séries télévisées, et même des acteurs principaux tels que Netflix et Nielsen, possèdant une longue expérience dans la production d’audiences pour la télévision diffusée, pourraient être en désaccord concernant leurs données et leurs analyses. Grâce à un examen attentif des médias populaires et des classements publiés, j’ai sélectionné manuellement un échantillon test de 10 séries récentes :
◼
  • Squid Game (Netflix)
  • ◼
  • Game of Thrones (HBO)
  • ◼
  • Stranger Things (Netflix)
  • ◼
  • La casa de papel (Antena 3, Netflix)
  • ◼
  • The Mandalorian (Disney+)
  • ◼
  • The Witcher (Netflix)
  • ◼
  • The Handmaid’s Tale (Hulu)
  • ◼
  • Sex Education (Netflix)
  • ◼
  • Bridgerton (Netflix)
  • ◼
  • The Queen’s Gambit (Netflix)
  • Elles ont été signalées comme étant très populaires par leurs réseaux de diffusion et divers médias d’information. Certaines de ces séries appartiennent à un réseau différent de Netflix, par exemple HBO avec Game of Thrones, et certaines ont été créées dans une langue originale autre que l’anglais, par exemple l’espagnol La casa de papel (Money Heist en anglais).
    Chaque chaîne ci-dessous correspond à la fin du lien hypertexte de Wikipédia vers l’article dédié à l’émission de télévision correspondante :
    In[]:=
    titles={"Squid_Game","Game_of_Thrones","Stranger_Things","Money_Heist","The_Mandalorian","The_Witcher_(TV_series)","The_Handmaid's_Tale_(TV_series)","Sex_Education_(TV_series)","Bridgerton","The_Queen's_Gambit_(miniseries)"};
    Pour vérifier un succès mondial, on doit représenter au moins les principaux groupes démographiques mondiaux. Wikipédia possède des éditions en plusieurs langues, où les articles correspondant à un même sujet ne sont pas nécessairement des traductions exactes, mais sont rédigés à partir de zéro par des communautés d’utilisateurs parlant une langue donnée. Selon Wikipédia, ses huit principales éditions ayant les plus grandes communautés d’utilisateurs sont rédigées dans les langues suivantes (et j’ai ajouté le coréen, comme je l’expliquerai) :
    In[]:=
    languages={"English","Spanish","French","German","Chinese","Russian","Portuguese","Italian","Korean"};
    La langue coréenne, qui a un rang beaucoup plus bas, à la 20ème place, a été ajoutée comme neuvième langue, de sorte que toutes les langues originales de toutes les séries (anglais, espagnol, coréen) sont représentées. La fonction
    WikipediaData
    dans Wolfram Language constitue une interface flexible et conviviale vers l’API de Wikipédia. En utilisant le traitement parallèle sur tous les cœurs de mon processeur graphique, j’obtiens la série temporelle pour toutes les séries et langues que nous avons sélectionnées :
    In[]:=
    views=Association[ParallelTable[a->AssociationMap[​​WikipediaData[a,"DailyPageHits",Language{"English"->#}]&,languages],{a,titles}]];
    Il faut être très prudent avec les données issues de projets de production participative tels que Wikipédia. En examinant la série temporelle de Squid Game, j’ai remarqué une ligne étonnamment courte pour la langue chinoise. On pourrait imaginer que les pages asiatiques auraient été créées plus tôt, puisque l’Asie constitue le marché d’origine de la série. Un audit approfondi de l’historique de la page Wikipédia chinoise révèle un changement perturbateur dans l’URL de la page, ayant entraîné la perte de l’accès direct aux données. Je montre la contribution significative des données perdues en noir dans le tracé suivant :
    In[]:=
    DateListPlotMerge"Lost Chinese"->TimeSeries
    Time: 30 Jul 2021 to 18 Oct 2021
    Data points: 81
    ,views["Squid_Game"],Total,ScalingFunctions"Log",
    
    J’ai récupéré ces données manuellement. Définition d’une fonction pour fusionner des séries temporelles :
    In[]:=
    timeSeriesMerge[tsl_,f_]:=TimeSeries[​​List@@@Normal[Merge[Association[Rule@@@Normal[#]]&/@tsl,f]]]
    … Je peux l’ajouter à mes données :
    In[]:=
    views["Squid_Game","Chinese"]=timeSeriesMerge​​views["Squid_Game","Chinese"],​​TimeSeries
    Time: 30 Jul 2021 to 11 Oct 2021
    Data points: 74
    ,Total;
    Visualisation des données La visualisation des données nécessite certaines considérations de conception et un traitement supplémentaire. Tout d’abord, il est utile de voir comment différentes démographies linguistiques contribuent au nombre total de consultations de pages que nous avons collectées (bien que seulement pour les neuf langues). Sans surprise, la page anglaise de Wikipédia arrive en tête dans chaque graphique. La langue anglaise est souvent considérée comme une langue de communication internationale, et de nombreuses personnes dans le monde l’utilisent comme seconde langue importante. Les pages des éditions anglophones de Wikipédia sont également souvent les plus détaillées et les plus développées. Ainsi, en plus de lire un article dans sa langue maternelle, les lecteurs internationaux consultent également sa version anglaise pour obtenir davantage d’informations. Par conséquent, la seule page anglaise pourrait servir d’indicateur du lectorat « global », mais l’ajout d’autres langues représentant des fractions démographiques significatives permet d’améliorer cet indicateur. La suppression des parties superflues des chaînes de caractères aide à rendre les étiquettes des tracés plus lisibles :
    In[]:=
    labels=StringDelete[titles,{"_(miniseries)","The_","_(TV_series)"}]
    Out[]=
    {Squid_Game,Game_of_Thrones,Stranger_Things,Money_Heist,Mandalorian,Witcher,Handmaid's_Tale,Sex_Education,Bridgerton,Queen's_Gambit}
    La fusion de toutes les séries temporelles d’une émission particulière dans les neuf langues peut être effectuée à l’aide de la fonction timeSeriesMerge que j’ai définie précédemment :
    Le nombre maximal de pages vues en une seule journée, les pics les plus élevés, peut être trié afin d’établir un classement des séries télévisées, du moins selon les données de Wikipédia disponibles depuis le 1er juillet 2015. Squid Game l’emporte, dépassant ses rivales les plus proches Game of Thrones, Stranger Things et La casa de papel :
    Game of Thrones a été diffusée pour la première fois sur HBO aux États-Unis le 17 avril 2011, et sa page Wikipédia ainsi que certaines des pages des autres séries ont été créées avant le lancement des statistiques de consultation de Wikipédia. Par conséquent, nous ne pouvons pas garantir qu’aucun pic maximal ne se soit produit avant 2015 pour ces séries. Néanmoins, il est au moins tout à fait probable que tous les pics les plus élevés se soient produits après 2015, puisque toutes ces séries sont très récentes et que leur popularité a probablement augmenté beaucoup plus lentement que celle de Squid Game.
    Par exemple, considérez la série temporelle complète de Game of Thrones pour toute la période disponible :
    Les pics augmentent à mesure que les saisons avancent. Contrairement à l’approche de Netflix consistant à publier tous les épisodes d’une saison en une seule fois, on ne peut pas regarder en rafale une série HBO pendant une saison en cours, car les épisodes sont diffusés chaque semaine. Ainsi, le pic viral le plus élevé pour Game of Thrones a peut-être été atteint lorsque la série a connu son grand final, et que les critiques, les spectateurs et les médias en discutaient avec effervescence. Les fonctions suivantes déterminent le pic le plus élevé dans la série temporelle ainsi que sa date d’occurrence :
    Cela peut être utilisé pour créer un diagramme annoté des points de crête à utiliser dans le tracé principal :
    Enfin, j’ai créé la visualisation de données au début de cet article :
    Un véritable blockbuster Squid Game est en effet un méga succès mondial, comme l’affirment Netflix et les médias, du moins en ce qui concerne les groupes démographiques suffisamment engagés pour lire des informations sur la série sur Wikipédia. Je peux également conclure que les données de consultations des pages de Wikipédia constituent une excellente source d’information. On pourrait envisager différentes métriques, voire des données différentes, mais les tendances générales observées sur Wikipédia ici s’alignent bien avec d’autres classements publiés ainsi qu’avec l’accueil général réservé par le public aux séries analysées.
    Avez-vous déjà vu Squid Game, ou prévoyez-vous de la regarder ? Faites-moi savoir ce que vous en pensez dans les commentaires !
    Je tiens à exprimer mes remerciements particuliers à Jesse Friedman qui a fourni de précieux conseils pour l’identification des données de ce projet.