Corrélation entre la taille d'un article et le nombre de commentaires

Hou-Hou Blog c'est :
857 articles (n'incluant pas celui-ci) ;
4050 commentaires (n'incluant pas mes propres commentaires) ;
Et 4409 commentaires incluant les miens.

Ce qui donne une moyenne commentaires/articles égale à 4,72 sans compter mes propres commentaires, et à 5,14 sinon. Mon blog est donc de catégorie A.

J'ai publié 359 commentaires. Ce qui revient à une moyenne de 0,42
réponses à mes propres articles et aux commentaires des lecteurs. Oui,
on me l'a souvent dit, je suis avare de commentaires sur mon blog.
C'est délibéré. Je pars du principe que mes articles ne m'appartiennent
plus une fois publiées. Ayant exprimé mon opinion dans l'article, je
laisse aux lecteurs le soin d'en débattre sans intervention de ma part.
Je prends souvent une position d'observateur neutre.

Dans le même ordre d'idées, Laurent évoque un point qui me semble intéressant à développer :

J'observe aussi qu'il y a souvent corrélation, enfin relation
inversement proportionnelle, entre la longueur du billet et le nombre
de commentaires.


J'avais aussi remarqué ce phénomène. Intuitivement, plus un article est
long, moins de lecteurs prennent le temps de le lire au complet, les
blogs se consultent en mode de zapping rapide. De plus, je crois qu'un
article long met plus de pression sur le lecteur, qui estimerait que
s'il doit commenter alors il serait obligé de développer sa réponse en
un temps proportionnellement équivalent au temps que l'auteur aurait
mis à rédiger son article. D'où découragement. Je généralise à partir
de mon expérience propre : les articles longs et très bien construits
me découragent à laisser des commentaires.

J'ai voulu vérifier cette hypothèse empiriquement, au niveau de mon blog.

J'ai extrait un ensemble de données composées de la taille de mes
articles, en nombre de caractères (incluant les tags HTML), et du
nombre de commentaires associé à chaque article. J'ai enlevé 3
singularités (1, 2, 3) qui représentent des articles ayant reçu énormément de commentaires pour des raisons circonstancielles.

Naturellement la taille des articles, ainsi que le nombre de
commentaires sont des distributions logarithmiques comme le montre les
graphes suivants :



Ensuite, j'ai construit le graphe de distribution des nombre de commentaires par rapport à la taille des articles :



Ma conclusion : la taille optimale des articles sur mon blog se situe
entre 3000 et 4000 caractères. Ces articles sont susceptibles de
recueillir le maximum de commentaires.
sujets : ,
  • jeudi le 29 décembre 2005 à 17:36

Commentaires

je partage ton avis ainsi que celui delaurent, plus je trouve un post long plus je suis découragé de le lireen entier sauf si l(auteur fait parti de mes favoris.
il n'est pas facile de mettre un commentaire courat sur un articlelong, le commentateur fait le choix de relire le post et de commenter atete reposée:) mais le monde des blogs évolue si vite que lecommentateur fini par laisser tomber!
  • adib
  • à 17:44, jeudi le 29 décembre 2005 #
Mawsa3 belik :))) .. tu as utilisé un outil pour ça ??
  • Infinity
  • à 20:34, jeudi le 29 décembre 2005 #
"la taille optimale des articles sur mon blogse situe entre 3000 et 4000 caractères. Ces articles sont susceptiblesde recueillir le maximum de commentaires."

Dans la mesure où tu n'écris que dans le but de recueillir un maximum de commentaires.

Personnellement, je ne suis pas différent d'un lecteur lambda dans lesens où je commente peu les longs articles (pour les raisons que tu astrès bien exprimées). Ceci dit, j'affectionne pourtant particulièrementces même articles (des auteurs de ma blogroll, évidemment, mais aussi,parfois, de quelqu'un que je n'ai pas l'habitude de lire, juste parceque l'entame est (vraiment) intéressante) : pour une fois sur le net,la personne a pris le temps de construire un raisonnement/jouer avecles mots/etc, etc.

...ceci dit, lorsqu'un auteur ne "pond" que des romans, là ca devient décourageant : on n'a pas toujours le temps de suivre.
  • merriadoc
  • à 04:26, vendredi le 30 décembre 2005 #
Quelle rigueur scientifique !!!!!!!! Chapeau !!!
Mais tu dois être conscient qu'il n'ya pas de terrain aussi glissantque les corrélations : la relation entre tes deux variables pourraitêtre essentiellement due à leurs liens avec une troisiéme à savoir letype de sujet traité et là ton analyse serait biaisée.

Personnellement je ne commente que rarement quand je suis d'accord avecce qui est ecrit. Et pis tu sais trés bien qu'il y a des sujets quisoulevent plus les foules que d'autres , c'est la catégorie sujetsepineux à eviter.

Autre hypothése qui pourrait contredire ta theorie: la possibilité delire en diagonale, le lecteur dispose toujours de cette alternative(psyché mode reviewer trés chiant..lol. )

En tout cas c'est un plaisir de te lire quand tu ne te contente pas d'un lien et d'un comment.
Et la qualité de l'article, sa clareté, la présence ou pas d'images, d'illustrations, le type de sujets abordés … ?
  • Toon-c
  • à 06:34, vendredi le 30 décembre 2005 #
Je trouve ton blog absolument remarquable.Honneteté, rigueur, le disputent à l'intelligence et ont font vraimentune des fiertés du paysage internaute tunisien.
Ce n'est que mon avis, mais je tenais à te le dire.
  • Sana
  • à 09:41, vendredi le 30 décembre 2005 #
Pas mal ton analyse,
D'après ton 3eme Graphe, tu as le tableau des couples [Taille;NbComment]. Si tu veux observer la distribution, il faut des tranches etdes distributions ou moyennes.

Par ex : Taille [ 0; 500[ ; moyenne des Nb comment = 9
[500;1000[ ; moyenne des Nb comment = 8
etc ,,,

Pour ce qui est de la correlation l'enveloppe (les max par tranche) le montre à priori.
  • 2pacs
  • à 15:26, samedi le 14 janvier 2006 #
Désolé, Je viens de mapercevoir que ta courbe est ce que j'ai décrit avant ...

Mais pour ce qui est de mon avis, la correlation est biaisée. C'estcomme les derniers chiffres des accidents de la route : On annonce que70% des accidents concernent des trajets de proximité moins de 30 km dudomicile.

Mais ce qu'on ne dit pas c'est que 90% des trajets font moins de 30 km ...

Ici c'est pareil, c'est parcequ'il y a plus d'article de tel taille qu'il y a plus de chance de trouvé un Nb comment élévé.

Il faut en fait faire une Analyse Factorielle en composante principale.Et pour ça avoir selectionné les parametres influents (et je pense quele theme du sujet y joue pour beaucoup)
  • 2pacs
  • à 15:42, samedi le 14 janvier 2006 #
je ne sais pas si cette "théorie" estgénéralisable...car mon texte qui a enregistré le plus de commentairesest "la pétasserie"...qui est un des textes les plus longs du blog...

Écrire un commentaire