Aller au contenu
Accueil » Blog Marketing Digital – SEO – E-commerce & WordPress » Un guide de l’apprentissage automatique dans la recherche : termes clés, concepts et algorithmes

Un guide de l’apprentissage automatique dans la recherche : termes clés, concepts et algorithmes

Mes services

E-commerce et Web

Fort de mes 13 ans d’expérience de e-commercant (+1.5M€ de CA / an), je vous aide à développer votre chiffre d'affaire sur le Web.

En savoir plus >

Marketing Digital

Je vous accompagne dans l’acquisition, la transformation, la fidélisation et l’optimisation continue de vos activités Internet.

En savoir plus >

Système d'Information

Je vous aide à réduire vos coûts, et par conséquent, à augmenter votre marge opérationnelle en automatisant les tâches de vos processus métier.

En savoir plus >

Accompagnement

Je vous accompagne tout au long du projet et assure le SAV.

En savoir plus >

Ils me font confiance

Un guide de l’apprentissage automatique dans la recherche : termes clés, concepts…

Canal » SEO » Guide de l’apprentissage machine à la recherche: Mots clés, concepts et algorithmes Dave Davies le 2 mai 2022 à 6:00 am Quand il s’agit de l’apprentissage machine, il ya quelques concepts et termes larges que tout le monde à la recherche doit savoir. Lisez sur pour mieux comprendre comment l’apprentissage par machine a un impact sur la recherche, ce que font les moteurs de recherche et comment reconnaître l’apprentissage par machine au travail. Ensuite, nous entrerons dans des algorithmes et des modèles d’apprentissage machine. Il ne s’agit pas d’un glossaire complet de chaque terme d’apprentissage par machine. Souvent nous entendons les mots l’intelligence artificielle et l’apprentissage machine utilisé de façon interchangeable. L’intelligence artificielle est le domaine de la fabrication de machines imitant l’intelligence, alors que l’apprentissage machine est la poursuite de systèmes qui peuvent apprendre sans être explicitement programmés pour une tâche. En fait, Microsoft produit quelques percées importantes. Mais notre attention ici est SEO. 61% part du marché américain, nous ne nous concentrerons pas sur cet article alors que nous explorons les technologies populaires et importantes liées à la recherche. Il n’y a littéralement aucun moyen que vous, moi, ou probablement n’importe quel ingénieur de Google pourraient tous les connaître. Pour le contexte, il s’agirait d’algorithmes et de modèles comme : Aucun de ces classements d’impact direct ou mises en page. Maintenant regardons les algorithmes de base et les modèles impliqués dans les classements de Google. Introduit en 2015, l’algorithme RankBrain a été appliqué aux requêtes que Google n’avait pas vues auparavant (contre 15% d’entre eux). À la suite d’énormes avancées comme Hummingbird et le Knowledge Graph, RankBrain a aidé Google à se développer en regardant le monde comme des cordes (mots clés et ensembles de mots et de caractères) aux choses (entités). Après RankBrain, ils ont vu Victoria (C.-B.) comme une entité – peut-être la machine ID (/m/07ypt) – et même s’ils ont frappé juste le mot «Victoria», s’ils pouvaient établir le contexte qu’ils le traiteraient comme la même entité que Victoria (C.-B.). Après tout, quand vous lisez “pizza près de moi” comprenez-vous qu’en termes de trois mots individuels ou avez-vous un visuel dans votre tête de pizza, et une compréhension de vous dans l’endroit où vous êtes? BERT (Représentations d’encodeurs bidirectionnels de transformateurs). Le Google visuel inclus dans leur annonce de leur open-sourcing du modèle BERT en 2018 aide à peindre l’image: Sans entrer dans le détail sur la façon dont les jetons et les transformateurs fonctionnent dans l’apprentissage machine, il suffit pour nos besoins ici de simplement regarder les trois images et les flèches et de penser à comment dans la version BERT, chacun des mots gagne des informations de chaque côté, y compris ces multiples mots loin. Un exemple simple peut être “la voiture est rouge”. De plus, si vous voulez jouer avec BERT, différents modèles sont disponibles sur GitHub. Pour clarifier, quand j’écris “n’a pas encore été déployé” je veux dire “au mieux de ma connaissance”. Cela dit, quand ce sera révolutionnaire. L’accent mis sur LaMDA est essentiellement double: Un échantillon de conversation de Google est: Nous pouvons voir qu’il s’adapte beaucoup mieux que l’on s’attendrait à un chatbot. Mais si nous y réfléchissons, des capacités accrues pour comprendre comment un flux de requêtes fonctionne à un niveau individuel contribueraient certainement à la fois à l’adaptation des plans de résultats de recherche, et à la présentation de sujets et de requêtes supplémentaires à l’utilisateur. Au-dessus, quand nous parlions de RankBrain, nous avons touché les machines ID et les entités. KELM est né de l’effort de réduire les biais et les informations toxiques dans la recherche. Plutôt que d’être un modèle, KELM est plus comme un ensemble de données. Plus intéressant pour nos objectifs ici, c’est qu’il nous parle d’une approche Google prend aux données. Ceci est plus facilement expliqué dans une image: Ceci est alors utilisable par d’autres modèles pour les former à reconnaître les faits et filtrer les informations toxiques. En regardant leur description vous aidera à comprendre comment elle fonctionne et sa structure, si vous voulez plus d’informations. Alors qu’il est révolutionnaire, il est très simple de décrire. Cela signifie qu’il « comprend » différents formats de contenu comme test, images, vidéo, etc. Aside: Ce n’est pas la première utilisation de l’architecture MultiModel. De plus, parce que MUM fonctionne dans les choses et non les chaînes, il peut collecter des informations dans les langues et ensuite fournir une réponse propre à l’utilisateur. L’exemple Google utilise est un randonneur voulant monter Mt Fuji. Une note importante sur MUM est que le modèle comprend non seulement le contenu, mais peut le produire. ) lui-même. Nous avons seulement touché certains des algorithmes clés dont vous aurez entendu parler et que je crois avoir un impact important sur la recherche organique. Toutes ces questions et des centaines de milliers de plus ont la même réponse : Passons maintenant à deux niveaux de supervision d’algorithmes et de modèles d’apprentissage automatique – encadrés et sans supervision. Il suffit de mettre, avec l’apprentissage supervisé, l’algorithme est remis une formation entièrement étiquetée et des données d’essai. Par exemple, l’étiquetage des chemises rouges dans x nombre de photos de personnes portant des chemises rouges.

Nous devrions tous savoir où l’apprentissage automatique est utilisé et les différents types d’apprentissage automatique….

Nous devrions tous savoir où l’apprentissage machine est utilisé, et les différents types d’apprentissage machine qui existent. Ce qui suit est des définitions de certains termes importants d’apprentissage par machine, dont la plupart seront discutées à un moment donné dans l’article. Ils ne sont pas exactement les mêmes. Ainsi sont les réseaux sociaux comme Facebook par Meta AI avec des modèles tels que WebFormer. Google utilise une pléthore d’algorithmes d’apprentissage machine. Mais ils ont un impact sur le succès de Google. En juin 2016, il a été élargi pour inclure toutes les requêtes. Avec cela ils “voir” au-delà de simples mots-clés et de signification, juste nos cerveaux le font. Avec l’introduction d’un modèle BERT dans les algorithmes de Google en 2019, Google est passé de la compréhension unidirectionnelle des concepts, à la bidirectionnelle. Ce n’est qu’après que BERT a été bien compris pour être la couleur de la voiture, car jusqu’à ce que le mot rouge est venu après le mot voiture, et cette information n’a pas été renvoyé. Après tout, nous avons découvert les mois de RankBrain après son déploiement dans les algorithmes. Je vois que LaMDA est mis en œuvre dans l’assistant Google. Eh bien, KELM, qui a été annoncé en mai 2021, l’amène à un tout nouveau niveau. Fondamentalement, il s’agit de données de formation pour les modèles d’apprentissage machine. Google a ouvert le corpus, et il est disponible sur GitHub. MUM est synonyme de Modèle Unifié Multitask et il est multimodal. Il a été présenté pour la première fois par Google en 2017. Certains des meilleurs conseils et informations peuvent être écrits en japonais et complètement inaccessibles à l’utilisateur car ils ne sauront pas comment le surfacer même s’ils pourraient le traduire. Cela peut également être un aspect de cette technologie pour beaucoup, moi-même inclus. Comprendre le type d’algorithme que nous recherchons, et où les chercher, est important. L’apprentissage supervisé est utile dans les problèmes de classification et de régression. Déterminer si quelque chose fait partie ou non d’un groupe. Ils n’ont pas étiqueté manuellement chacune de ces photos. Et quiconque a utilisé Google Photos sait qu’ils vous demandent de confirmer des photos et les gens en eux périodiquement. Vous avez déjà utilisé ReCAPTCHA ? C’est vrai. Les problèmes de régression, d’autre part, traitent de problèmes lorsqu’il y a un ensemble d’entrées qui doivent être cartographiées à une valeur de sortie. Peux-tu penser à tout autre système qui pourrait porter dans un large éventail de caractéristiques/signaux et ensuite avoir besoin d’attribuer une valeur à l’entité (/site) en question? Je pense que nous allons dans des modèles semi-supervisés ici – avec l’étiquetage manuel (think quality raters) étant fait à certains stades et des signaux collectés par système déterminant la satisfaction des utilisateurs avec les ensembles de résultats utilisés pour ajuster et artisanat les modèles en jeu. Aucun but final n’est spécifié. L’apprentissage non conseillé est utilisé lorsque vous avez beaucoup de données, et vous ne pouvez ou ne savez pas à l’avance comment il devrait être utilisé. Google regroupe des nouvelles similaires et aborde également des histoires de nouvelles qui n’existaient pas auparavant (ce sont donc des nouvelles). Les modèles qui ont « vu » le succès ou l’infructueux groupement ou surfaçage antérieurs ont disparu, mais ne sont pas en mesure d’appliquer pleinement cela aux données actuelles, qui n’est pas reconnue (comme les nouvelles précédentes) et de prendre des décisions. Google Translate est un autre bon exemple. Nous l’avons vu avec MUM ci-dessus, mais il existe dans d’autres documents et modèles sont bien. Mes futurs articles ne seront pas seulement sur la façon et l’endroit où l’apprentissage machine peut être trouvé (bien que certains le feront). Ne vous inquiétez pas, dans ces cas j’aurai fait le codage pour vous et généralement fournir un Google Colab facile à utiliser pour suivre, vous aidant à répondre à certaines questions importantes de référence et d’affaires. Mon prochain article vous montrera comment. Les opinions exprimées dans cet article sont celles de l’auteur invité et pas nécessairement Search Engine Land. Faites confiance aux acheteurs de la newsletter quotidienne. 15-16 novembre, 2022 : SMX Suivant (virtual) Découvrez les technologies et les tactiques qui peuvent vous aider à surmonter des défis marketing cruciaux.

Tous les principaux moteurs de recherche utilisent l’apprentissage automatique d’une ou plusieurs façons. RankBrain aide…

Commençons par quelques définitions. Si vous le voulez, Google en fournit un bon ici. Visuellement, vous pouvez y penser comme ceci: Tous les principaux moteurs de recherche utilisent l’apprentissage machine d’une ou de plusieurs façons. Et pendant que Bing est un moteur de recherche, avec un 6. En plus de cela, beaucoup sont simplement des héros non chantés de la recherche, et nous n’avons pas besoin de les explorer pleinement car ils font tout simplement que d’autres systèmes fonctionnent mieux. C’est là que tout a commencé, l’introduction de l’apprentissage machine dans les algorithmes de Google. Par exemple, avant que ce Google ne soit considéré essentiellement la ville que je vis (Victoria, C.-B.) comme deux mots qui co-occurent régulièrement, mais aussi régulièrement se produire séparément et ne peuvent pas toujours signifier quelque chose de différent quand ils le font. En bref, RankBrain aide les algorithmes à appliquer leurs signaux aux choses au lieu de mots-clés. Là où auparavant un modèle ne pouvait s’appliquer qu’aux mots dans une seule direction, ils obtiennent maintenant une compréhension contextuelle basée sur les mots dans les deux directions. LaMDA n’a pas encore été déployé dans la nature, et a été annoncé pour la première fois à Google I/O en mai 2021. LaMDA est un modèle de langage conversationnel, qui semble écraser l’état actuel de l’art. Fondamentalement, je suis presque sûr que nous verrons les technologies inspirées par LaMDA perméate non-chat zones de recherche. Parce qu’il est basé sur des informations de confiance (Wikidata), il peut être utilisé bien à cette fin. En bref, Google a pris le Wikidata Knowledge Graph anglais, qui est une collection de triples (entité subjective, relation, entité objet (car, couleur, rouge) et l’a transformé en divers sous-graphes d’entité et l’a verbalisé. MUM a également été annoncé à Google I/O en mai 2021. Cela lui donne le pouvoir d’obtenir des informations de plusieurs modalités, ainsi que de répondre. Cela ouvre la porte à de vastes améliorations de l’accès à l’information, en particulier pour ceux qui parlent des langues qui ne sont pas abordées sur Internet, mais même les anglophones bénéficieront directement. Ainsi, plutôt que d’envoyer passivement un utilisateur à un résultat, il peut faciliter la collecte de données à partir de sources multiples et fournir la rétroaction (page, voix, etc. Mais cela est loin de la totalité de l’endroit où l’apprentissage machine est utilisé. C’est à dire que quelqu’un a passé par l’étiquetage des milliers (ou des millions) d’exemples pour former un modèle sur des données fiables. Les problèmes de classification sont assez simples. Google m’a classé, ainsi que des étapes. Mais le modèle aura été formé sur les données étiquetées manuellement pour les étapes. Nous sommes les étiqueteuses manuelles. Devinez ce que vous faites ? Vous aidez régulièrement à former des modèles d’apprentissage automatique. Un exemple simple est de penser à un système pour estimer le prix de vente d’une maison avec l’entrée de pieds carrés, nombre de chambres, nombre de salles de bains, distance de l’océan, etc. Bien que certainement plus complexe et prenant dans un énorme éventail d’algorithmes individuels servant diverses fonctions, la régression est probablement l’un des types d’algorithmes qui conduit les fonctions essentielles de la recherche. Dans l’apprentissage non supervisé, un système est donné un ensemble de données non reconnues et laissé pour déterminer ce qu’il y a à faire. Le système peut regrouper des éléments similaires ensemble, chercher des outliers, trouver la co-rélation, etc. Un bon exemple pourrait être Google News. Ces tâches seraient le mieux exécutées par principalement (mais pas exclusivement) des modèles non supervisés. C’est un domaine incroyablement important de l’apprentissage machine en ce qui concerne la recherche, surtout lorsque les choses se développent. Pas la traduction unique qui existait, où le système a été formé pour comprendre que le mot x en anglais est égal au mot y en espagnol, mais plutôt des techniques plus nouvelles qui recherchent des modèles dans l’utilisation des deux, améliorant la traduction par l’apprentissage semi-supervisé (certaines données étiquetées et beaucoup pas) et l’apprentissage non supervisé, traduisant d’une langue dans une langue complètement inconnue (au système). Espérons que cela a fourni une base de référence pour l’apprentissage de la machine et comment il est utilisé dans la recherche. Nous plongerons également dans des applications pratiques de l’apprentissage machine que vous pouvez utiliser pour être un meilleur référencement. Par exemple, vous pouvez utiliser des modèles d’apprentissage automatique direct pour développer votre compréhension de vos sites, contenu, trafic et plus encore. Théière : prévision des séries chronologiques. Les auteurs du personnel sont énumérés ici. Apprenez des tactiques de marketing de recherche pratique qui peuvent vous aider à conduire plus de trafic, de prospects et de revenus. Commencer à découvrir Maintenant: Printemps (virtuel) 28-29 septembre 2022: Automne (virtual) Nous utilisons des cookies pour vous assurer une meilleure expérience sur notre site. Si vous continuez à utiliser ce site nous supposerons que vous êtes heureux avec lui.