Durant ces dernières semaines je me suis mis à travailler sur une nouvelle version de mon projet de journal social en développement, "www.notreactualite.com", ainsi que sur une autre projet d'agrégateur social spécialisé dans le domaine des technologies et du monde geek que je devrais lancer en mode Alpha dans les prochains jours...
Mon but est de trouver le moyen de combler les faiblesses des sites qui sont basés sur le filtrage social des informations, comme digg.com.
J'aimerais avant de poser mes solutions aux problèmes actuels des sites de diffusion d'information et de filtrage social, revenir sur les principaux problèmes qui affectent les sites digg-like...
Principales faiblesses des digg-like actuels
1- Les sujets "populaires" ont plus de visibilité que les thèmes moins populaires, ce qui crée à la longue un site ou on retrouve toujours sensiblement le même genre d'informations et de liens. Évidemment cela reflète les choix de la "majorité", mais en même temps élimine la possibilité de s'assurer que chaque lecteur a de la facilité a trouver ce qu'il l'intéresse réellement...Nous sommes donc soumis à ce que plusieurs apellent la dictature de la masse, ou du plus bas dénominateur commun.
2- Les sytèmes de Karma et de points font en sorte que certaines personnes qui partcipent beaucoup ont beaucoup d'influence sur le site et peuvent influencer l'évolution du site selon leurs goûts ou leurs intérêts personnels.
Bien que ce genre de système serve à fidéliser les membres de la communauté, cela nuit selon moi au principe de réel filtrage social, encore une fois parce que le site devient avec le temps trop influencé par les membres actifs, au détriment du 90% des lecteurs qui ne cherchent que des infos à lire selon leurs intérêts.
3- L'aspect réellement social de ce genre de site est relativement négligé selon moi...Certes le filtrage se fait par la masse des utilisateurs, mais il est évident que le potentiel social est souvent sous-utilisé. Rares sont les sites qui permettent une interaction sociale qui va plus loin que le simple fait de poster des commentaires sur chaque élément de news. Pensez aux groupes d'intérêts par exemple qui peuvent se proposer du contenu entre eux...directement à partir du contenu sur le site...
4- Les sites de filtrage social de première génération peuvent être facilement manipulables par des groupes organisés qui utilisent leur influence et leur force de frappe afin de promouvoir leurs articles et ceux de leurs amis, tout en essaynt de nuire à leurs concurrents...
5- Il est très difficile de personnaliser ce genre de sites, voire impossible d'aller au delà d'un simple filtrage par catégories. Je pense que les goûts des internautes sont pas mal plus complexes que simplement quelles catégories on aime ou pas...
6- Difficile de faire vivre ce genre de sites: Si on compte sur les membres pour ajouter le contenu au site, on se mets dans une position ou le site aura probablement beaucoup de difficulté à offrir une bonne quantité d'informations, dans le court terme...
Ces quelques problèmes sont selon relativement importants, mais ils ont tous des solutions relativement simples au niveau conceptuel. Voici quelques idées de solutions qui selon moi créraient un système beaucoup plus agréable et surtout utile pour les utilisateurs.
Idées pour le filtrage social de 2e génération
Sans plus tarder, je vous donne mes idées qui je pense seront fondamentales pour en arriver à la prochaine génération de sites axés sur le filtrage social. L'objectif? Se servir de la force de la masse pour en arriver à une réelle personnalisation du contenu. Je m'explique...
Un des problèmes actuellement avec les sites d'informations est évidemment le nombre incroyable de contenu qui est disponible. Quiconque veut passer 30 minutes par jour seulement pour se tenir au courant, cherche évidemment le moyen de maximiser la qualité de l'information qui lui est présentée.
Je ne suis pas le seul à penser qu'il est très difficile de faire une veille technologique convenable sans devenir totalement submergé par la quantité de billets à lire... (voir les commentaires à la fin de ce lien)...
Il semble donc y avoir un besoin de trouver un outil qui est en mesure de classer le contenu disponible selon nos goûts, nos habitudes et nos préférences, mais aussi selon les goûts et les habitudes des gens qu'on considère comme ayant une certain autorité... et dont on valorise l'opinion.
En théorie les sites de filtrage social à la digg étaient une solution potable, mais ils ne semblent pas être adaptées aux grandes communautés, mais plutôt à des thémes très précis (Merci David Jourand pour le lien) ou toute la communauté partage les mêmes intérêts...
Mais comment arriver à utiliser la force d'une communauté généraliste pour créer des recommandations personnalisées? Avec un algorythme de recommandation, c'est évident
...Merci Amazon.com (pour l'inspiration) et surtout Slope One!
Créer un réseau de confiance de manière passive
Il n'y a pas de doute dans mon esprit que le filtrage social est un moyen super efficace de faire ressortir du contenu de qualité. En autant que les gens qui vous recommandent du contenu aient des intérêts qui correspondent de manière plus ou moins large aux vôtres!
Mon ambition est de mettre en place un site qui permettrait de recommander le contenu à chaque membre en le mettant en relation avec des gens qui semblent avoir le même genre de goûts et la même conception de la qualité. Bref, le contenu recommandé ne dependrait pas du tout du nombre de votes qu'a reçu un lien, mais plutôt surtout de 1) qui a voté pour ce lien, 2) quel est le thème du lien et 3) quelle est la source du lien proposé et finalement, 4) qui a proposé ce lien.
1) Qui a voté: Le système de recommandation regarde quels sont les membres qui ont ajouté des points à la même news, et essaie de déterminer des ressemblances dans les habitudes de votes entre les membres. Si par exemple vous votez souvent pour les mêmes liens que les mêmes 4 personnes, éventuellemet quand une de ces personnes votera pour un lien, il vous sera automatiquement proposé...
2) Quel est le thème du lien: SI le système remarque qu'il y a des thèmes que vous appréciez particulièrement, il vous suggèrera les nouveaux liens qui touchent à ce thème...Si des gens qui sont dans votre réseau de confiance ajoutent des liens qui correspondent à plus à vos thèmes favoris, ce contenu sera proposé en priorité sur les autres contenus proposés...
3) La source du lien proposé : Pour chaque vote sur un lien, le système doit savoir de quelle source provient ce lien. Si le système détecte que vous votez régulièrement pour des contenus d'une source en particulier, ils vous proposera éventuellement le contenu de cette source.
Évidemment si le contenu vient d'une source de confiance et à aussi été apprécié par des membres de confiance, le contenu sera présenté en priorité. Aussi, le système analyse quels sont les autres membres qui aiment cette source et essaie de vous proposer les autres sources que ces membres de confiance apprécient aussi et que vous ne connaissez peut-être pas...
4) Qui a posté un lien: Un peu comme pour les points précédents, le système de recommandation prends en considération l'auteur d'un texte que vous aimez, pour essayer de vous proposer le nouveau contenu de ce membre, mais aussi le contenu que cette personne a apprécie!
L'important est donc de voter pour du contenu de qualité, parce que non seulement on participe au filtrage social de base en donnant des points, masi on fournit le site en méta-data importante qui lui permettra, à moyen terme, de faire un filtrage des informations disponibles pour vous, grâce aux autres membres de la communauté, avec qui vous êtes en connexion automatique selon vos habitudes et vos gouts.
Ces méta informations permettent de créer une page de recommandation de contenu qui est toalement différente de la fameuse "home page" qu'on retrouve sur les digg-like. Si avant on avait tous droit à la même une, l'ère des pages d'accueil entièrement personnalisées arrive à grand pas? Intéressant?
Les groupes d'intérêts, pour maximiser l'aspect social
Un autre que je suis en train de mettre en place c'est un système de veille collaborative. Les membres du site peuvent donc se créer des "groupes" et ensuite directement "marquer" des contenus pour qu'ils apparaissent directement sur la page des groupes appropriés.
Cela permets de quitter le monde un peu hermétique du filtrage par catégories et permets d'entrer dans le monde de la veille collective. En principe, chaque item sur le site peut etre "assigné" à un groupe en un seul clic, afin que les membres puissent facilement présenter un contenu aux groupes auxquels ils participent.
Par exemple si je suis membre du groupe des amoureux des macs,
, je pourrai facilement "assigner" des news que je vois sur le site et qui parlent de mac.
En un clic les news qui ne sont pas déjà dans le groupe sont ajoutées sur la page d'accueil du groupe "mac". C'est un peu comme des favoris collectifs, ou tous les membres d'un groupe font la chasse aux news reliés à leur thème et partagent le fruit de leurs recherches...
Cela crée potentiellement des dizaines, voire des centaines de "home pages" différentes, une pour chaque groupe précis...
Bloquer le contenu: personnalisation active
Un élément qui n'existe pas sur la plupart des sites à-la-digg, est la possibilité de bloquer le contenu d'une certaine source, ou qui a été ajouté par un certain membre.
Le fait que les membres puissent rapidement éliminer une source d'informations ou un membre qui les dérange, rends les possibilités de SPAM beaucoup moins grandes, puisque les spammeurs seraient toujours susceptibles de se faire bloquer tout simplement.
Conclusion
Ces différentes suggestions permettraient selon moi de règler les problèmes fondamentaux des systèmes à-la-digg et apporteraient plusieurs avantages:
1) Beaucoup plus difficile de manipuler les résulats, parce que les usagers pourraient se fier à leur page de "liens recommandés" et de "groupes de veille" afin de trouver leurs infos, au lieu de ne se fier qu'a la home page. Il serait donc moins avantageux pour les membres de perdre du temps à manipuler les résultats, si chaque membre à une page d'accueil unique et adaptée à ses besoins et à ses goûts!
2) Beaucoup plus difficile de spammer si tous les membres peuvent facilement bloquer un membre ou une source de contenu afin de ne jamasi voir le contenu de ce membre. Le système pourrait éventuellement effacer unmembre ou une source qui est bloquée par une très grande majorité des membres du site.
3) Il deviendrait beaucoup plus rapide et efficace de faire des revues de presse et des veilles en devenant membres de groupes précis qui sont, comme vous, à l'affût de tout ce qui paraît sur le site dans une thématique donnée...
4) Les membres prolifiques auraient seulement de l'influence par rapport aux gens qui apprécient (votent) pour leur contenu, fini la dictature des membres qui ont plein de karma! Bienvenue au Karma de membre à membre... (Réseau de confiance)
En terminant, merci à David Jourand pour l'inspiration au sujet de quelques améliorations à apporter à ce genre de sites.
J'attends vos commentaires,suggestions et autres idées!
Vous avez apprécié le texte, faites le circuler! scoopeo_url='http://www.encoreungeek.com/nouvelle-generation-digg-like-sites-sociaux-information'
Technorati Tags:
sam, 04/28/2007 - 19:54
Cité deux fois dans ce billet : quel honneur ! Je partage entièrement l'esprit du billet. Je m'intéresses vraiment à ce sujet depuis le mois de novembre, date de début de mission à l'AFP... Je suis maintenant convaincu que l'avenir des digg-like devra suivre ce chemin. Par contre il y a quelques problèmes à résoudre :
Félicitation pour ce billet. Je suis prêt à contribuer à toute initiative allant dans ce sens.
dim, 04/29/2007 - 01:38
C'est déja bien qu'il soit ouvert je vais placer un sujest du digg-like sur mon blog. Merci
dim, 04/29/2007 - 06:14
Salut Aiglestates... Mon digg-like pour les geeks est pas encore lancé, et il se nommera www.geekomatik.com, comment vous trouvez le nom? ;-)
dim, 04/29/2007 - 06:18
@david:
Merci pour le commentaire, toujours aussi pertinents! Je suis aussi très motivé par ce thème, je suis à la recherche d'une solution idéale pour arriver à vraiment pouvoir consulter les actualités en groupe, et non plus tout seuls chacun de notre côté. Il existe bien sur dejà plusieurs manières de le faire, mais aucune qui me semble vraiment simple, pratique et axée sur l'intéraction et la suggestion de contenu.
Au sujet du billet, je sais qu'il est un peu lourd au sujet de l'algo de recommendation de contenu, mais il est très difficile pour moi d'expliquer complètement tout ce qu'il peut faire sans en passer par là. Si tu as des questions ou des conseils à ce sujet je suis tout ouie!
Je reviens commenter les autres points un peu plus tard, je viens de me lever ;)
dim, 04/29/2007 - 14:02
Bon alors après une bonne journée de travail sur mon projet, me revoici... encore plus motivé que jamais ;)
Tu poses des questions intéressantes dans tes commentaires et effectivement ce ne sont pas des questions faciles.
1) la propriété du contenu: Pour ma part je copie le contenu directemnet sur le site, c'est à dire que mon site est un aggrégateur qui se connecte directemnet aux sites sources afin d'en extraire le nouveau contenu. Cela pose certainement quelques problèmes pour les propriétaires de sites, mais cela vient avec le choix de laisser tout son contenu partir dans son fil rss. Pour ma part j'hésite entre deux solutions: soit interdire les moteurs de recherche des pages d'articles sur mon aggrégateur et ne laisser google 'crawler' que sur les pages de 'catégories'; soit mettre en place un système de partage de revenus afin que les webmasters soient compensées du fait que mon site recopie leur contenu intégralement.
2)Bonne question... Pour ma part je me suis fiéau bon vieux modèle de vote +1/-1 comme interface centrale. Pour le reste, si les gens veuleent avoir accès aux détails pour un news, ils peuvent aller voir la page de chaque news et sur cette page, ils peuvent tagger le contenu, bloquer la source originale, ou assigner le contenu à un de leurs groupes.
Sinon je pense que la pge qui présente des recommandations aura sa propre adresse genre perso.geekomatik.com et éventuellement pourra servir de page d'accueil au lieu de la home page normale qui servira éventuellement que pour les users anonymes...
3) Au sujet de l'algorithme, idéalement rien de tout cela ne concerne l'usager... il suffit que les gens sachent que plus ils votent, plus ils permettent au système de leur recommander des items qui leur correspondent... Pour le reste c'est à l'équipe derrière de trouver comment faire ;)
Je suis confiant de pouvoir sortir mon premier béta cette semaine, alors je te tiens au courant, si tu es intéressé à devenir béta testeur pour www.geekomatik.com!
A+
dim, 04/29/2007 - 14:40
J'ai écrit en fonction de celui-ci qui est ouvert
http://www.notreactualite.com/
lun, 04/30/2007 - 06:58
@Alexis :
1/ Ce n'est pas parce que l'auteur d'un site diffuse son contenu via RSS, que ce contenu est librement copiable ! Il vaudrait mieux avoir l'autorisation des auteurs avant d'intégrer un flux...
En ce qui concerne google et le partage des revenus, je n'ai pas compris.
2/ Je posai le problème en termes plus généraux : Y aura-t-il une page générique et une page "personnelle" ou cela sera-t-il mélangé par exemple ?
3/ Souvent la complexité de l'algorithme se voit au niveau de l'ergonomie... Il faut effectivement faire attention à cacher cette complexité.
J'attends avec impatience la sortie de la beta !
lun, 04/30/2007 - 17:38
Salut David,
1) Tu as bien raison, d'ailleurs cela a été un souci que j'ai eu dès le début de ce projet... J'aimerais pouvoir laisser les gens suggérer des sources, mais en même temps je ne suis pas sur que je peux ajouter une source sur le site sans que le "propriétaire" de cette dernière ne soit en accord...
Pour le moment je suggère aux gens d'ajouter leurs propres blogs seulement, mais éventuellement j'aimerais que tout le monde puisse suggèrer des sources, mais cela implique de devoir moi même ensuite contacter chaque source recommandée... ce qui ma foi me semble une tâche titanesque. (Surtout que je veux lancer le site en anglais aussi...) As tu des idées de comment je pourrais gèrer cet élément?
Au sujet de google, je voulais dire que je pouvais essayer d'empêcher les moteurs de recherche de 'crawler' les articles qui sont soumis sur le site. De cette manière les pages de mon site ne peuvent pas "concurrencer" la source originale dans les résultats de recherche. Une autre alternative serait de partager les revenus du site avec les éditeurs, de cette manière malgré que mon site puisse concurrencer la source originale, sela représente une source de revenus supplémentaire pour l'éditeur. (En plus d'une source de visiteurs supplémentaire)
2)Il y aurait normalement une page de recommandations, ainsi qu'une page générique. Éventuellement si le système de recommandation fonctionne aussi bien que je le souhaite, je pourrais faire en sorte que la page de recommandation arrive dès que la personne se connecte au site. La page générique ne serait présentée qu'aux utilisateurs anonymes... Évidemment il faudrait demander l'avis des membres, c'est eux qui décideraient de la voie à suivre dans ce cas...
Merci pour les commentaires et j'apprécie énormément tous les conseils, alors hésite surtout pas!
Alexis
mer, 05/02/2007 - 08:09
@Alexis :
1/ Pas de solution miracle à ce problème... Voir les problèmes de Google News avec les éditeurs belges ou l'AFP !
Pour Google, tu as raison de te soucier de ce problème. Mais je ne suis vraiment pas un spécialiste, et ne pourrai donc pas te conseiller à ce sujet.
2/ Ok.
mer, 05/02/2007 - 09:33
Salut David,
Je serias bien curieux d'entendre tes idées au sujets des alternatives pour pouvoir utiliser le contenu sans avoir trop de problèmes... Tu parlais des frames, mais je ne suis pas certain que cette solution me plait non plus ...
A+
mer, 05/02/2007 - 13:32
Je pensai essentiellement à ce que tu as apparemment mis en place : chacun inscrit son blog. Il faut ensuite une bonne dose de buzz pour attirer toujours plus de monde ! C'est à mon avis la meilleure solution.
Une autre solution, consiste à différencier les sources inscrites par leur auteur des sources inscrites par un lecteur. Seuls les articles des premières peuvent être intégralement repris sur le site. Les articles des secondes sources ne peuvent être présentés qu'aux lecteurs qui se sont abonnés. Il faut alors suggérer la source (pas les articles), et le lecteur peut s'y abonner. C'est le principe d'un agrégateur de flux traditionnel.
Dans ce second cas, il y aura toujours des problèmes de légalité... mais moins épineux.
jeu, 05/03/2007 - 14:18
Salut David, comme tu peux voir j'ai lancé un billet sur ce sujet, je pense que c'est important de prendre le pouls de la communauté. Il semblerait que les gens ne sont pas tous à l'aise avec l'idée de laisser un autre site agréger leur contenu en totalité... Mais cela ne fait-il pas partie de la nouvelle manière de voir le web. Comme on dit, l'important c'est d'avoir 1) les lecteurs 2) les backlinks et 3) le crédit pour le texte... non?
A+
ven, 05/04/2007 - 19:25
Entièrement d'accord avec toi ! Mais ce n'est pas l'avis de tout le monde... et il faut bien en tenir compte.
ven, 05/04/2007 - 19:41
D'ailleurs, il serait préférable de demander l'autorisation avant d'intégrer un blog... Autorisation accordée.
sam, 05/05/2007 - 08:56
Hey salut David... hum je vois que tu as trouvé ton chemin jusqu'a ma version sandbox heh...
je comptais effacer tout le contenu sur le site pour partir à neuf... désolé. Mais bon je me servais de ton blogue comme source test :). ça m'apprendra a laisser mon sandbox en ligne heh..
A+
Alexis
sam, 07/11/2009 - 20:31
Ce qu'il faut pour un digg-like c'est que l'on puisse poster sans s'inscrire comme sur Digg france, un lien direct pour publier:
http://www.digg-france.com/publier
Poster un nouveau commentaire