Newsletter

Newsletter

Liens utiles

WebPlanete.net

Veille d'actualités

Moteur de veille, plus de 400 sources d'informations francophones. [ Cliquez-ici ]

07/07 Deux nouveautés pour la recherche sur Internet

Dans cette news, je vais d'abord vous parler d'un projet d'Adobe qui consiste à permettre aux deux principaux moteurs de recherche de pouvoir indexer et référencer le contenu des animations Flash. Ensuite, un petit tour par la recherche sémantique pour Live Search. Indexer du contenu Flash, maintenant possible Un des principaux problèmes des animations et des sites Web réalisés en Flash est une très mauvaise indexation par les moteurs de recherche. En effet, les robots d’indexation des moteurs de recherche de Google et Yahoo! ne sont pas capables de lire le contenu d’une animation Flash. Consciente de ce problème, Adobe, la société qui développe la technologie Flash a décidé d’agir. Le problème Les robots d’indexation des moteurs de recherche savent parcourir et indexer du contenu texte, et éventuellement des fichiers PDF. Ce n’est pas le cas des animations Flash (fichier SWF), ce qui a toujours rendu le format Flash plutôt hermétique au référencement. Google avait bien commencé à développer des technologies pour tenter de référencer un tel type de contenu, mais ça n’a jamais semblé avoir abouti pleinement. Une solution serait que le robot puisse lire l’animation... et c’est exactement ce à quoi travaillent Adobe, Yahoo! et Google. La solution Adobe a fourni aux deux principaux moteurs de recherche une version spéciale du FlashPlayer, à intégrer à leurs robots d’indexation respectifs de manière à naviguer dans les animations afin de lire et donc de récupérer les textes et les liens hypertextes présents au sein d’une animation Flash et visibles par les utilisateurs. Quelques limitations subsistent toutefois. Par exemple du contenu Flash appelé via JavaScript ne sera pas indexé (JavaScript n’étant pas indexé), ou bien les données externes aux animations comme des fichiers HTML, texte ou XML ne seront pas non plus analysés. Il semble aussi subsister quelques petites problème de lecture avec les écritures qui se lisent de la droite vers la gauche comme l’arabe. Le but du projet Le but du projet, d’après Adobe est bien évidemment de développer les applications RIA, faites en Flash ou en Flex, en les rendant accessibles via les moteurs de recherche. Pour les webmasters désireux de réaliser un site tout en Flash, ils n’auront donc plus besoin de développer un deuxième site ou un site portail en H6TML pour qu’il soit indexé. Un deuxième but, non-avoué, est certainement de contrer la technologie Silverlight de Microsoft, qui se veut une alternative au Flash qui pourrait dans un avenir moyennement proche faire de l’ombre à Flash. Si le contenu Flash est indexé et que celui de Silverlight ne l’est pas, les webmasters seront certainement plus intéressés par Flash. Bien sûr, les moteurs de recherche y trouvent leur compte, à part peut-être Live Search de Microsoft, qui ne fait pas partie du projet. Gageons que Microsoft sera capable d’indexer le contenu Silverlight . Ça change quoi ? Pour les webmasters et les designers, ça ne change strictement rien. Le développement d’applications Flash et Flex reste le même, tout le travail est fait par les moteurs de recherche. Google a déjà mis en place ce nouveau système d’indexation, et se targue déjà de pouvoir indexer des millions de RIA et par extrapolation, toutes les contenus Flash. Yahoo! pour sa part semble attendre une mise à jour de Yahoo! Search pour incorporer ce nouveau système. Vers une recherche plus sémantique Mettons de côté Google et Yahoo! et parlons de Live Serach, le moteur de recherche de Microsoft. Microsoft vient d'annoncer qu'il venait de racheter la start-up Powerset spécialisée dans la recherche sémantique, pour une somme avoisinant cent millions de dollars selon certaines sources. La recherche sémantique ? On appelle une recherche sémantique une recherche effectuée sur base d'une phrase que l'internaute entre, et non sur une série de mots clés. En clair, l'utilisateur entre une phrase, le moteur de recherche l'analyse en lui donnant un sens (d'où l'appellation "sémantique") et retourne des résultats. C'est un peu comme si on posait une question et que le moteur y répondait. Voici d'ailleurs un exemple, avec le moteur de Powerset. La recherche est effectuée sur Wikipedia, version anglaise, et la phrase doit évidemment être écrite en anglais et si possible, bien formulée. Si la phrase ou la question n'est pas claire ou que le moteur ne la comprend pas, il effectue une recherche normale, comme si c'était des mots clés. Image reprise sur Clubic Et donc ? Oui, donc Microsoft s'intéresse fortement à ce système de recherche et projette de l'utiliser pour son moteur Live Search. Ce concept de recherche sémantique est intéressant, mais pas encore vraiment abouti, et ne fonctionne bien que si le moteur est capable de lire la phrase, ce qui implique de ne pas faire de fautes. De plus, pour les grandes questions ça marche plutôt bien, mais pour des questions plus pointues, les résultats de la recherche ne sont pas toujours pertinents (mais ce n'est pas pire qu'avec une recherche normale par mots clés, les résultats cadrent quand même avec ce qui est entré). En considérons ces derniers points, on peut donc prévoir que cette intégration à Live Search ne se fera pas dans les semaines à venir. Une stratégie Live Search est loin de dominer le marché de la recherche en ligne, et si ce système sémantique se révèle efficace, ça pourrait bien évidemment être un plus pour Microsoft dont les parts de marché viennent de baisser ces dernier mois, aux Etats-Unis. Lire la suite sur Siteduzero