Neseniai internete pasirodė didelis kiekis dokumentų, kurie, atrodo, priklauso „Google“ vidinei duomenų bazės sistemai. Šie dokumentai galimai per klaidą buvo paskelbti „Github“ platformoje kovo 13 dieną naudojant automatizuotą robotą, žinoma kaip yoshi-code-bot.

Taip pat dokumentacija buvo viešai paskelbta per kitą automatizuotą dokumentacijos sistemą. Ši informacija apima „Google“ paieškos turinio saugyklos API dokumentus, kurie yra panašūs į „Google Cloud Platform“ paslaugas.

Ši informacija buvo pasidalinta su „SparkToro“ bendraįkūrėju Rand Fishkinu. Visi šie dokumentai buvo paskelbti pagal Apache 2.0 licenciją, kuri suteikia vartotojams teises naudoti, keisti ir platinti šiuos duomenis. Klaida, dėl kurios dokumentai buvo viešai paskelbti, buvo ištaisyta gegužės 7 dieną, tačiau dokumentacija vis dar yra pasiekiama internete.

Ką sužinojome

Atskleisti 2596 įvairių modulių ir virš 14000 svetainių reitingavimo atributų, kurie įtakoja tinklapių pozicijas Google paieškoje. Tačiau iš dokumentacijos nėra aišku, kokie konkrečiai faktoriai turi daugiau įtakos.

Kodas su moduliais, reitingavimo atributais ir Google komandos vidiniais komentarai atrodo taip:

nutekinta Google dokumetacija anchor anchor modulis

Melo detektorius

Linkėjimai visiems SEO specialistams teoretikams, kurie mėgsta cituoti ir pirštais rodyti į tai ką pasakė ir parašė Google atstovai. Detaliai pažiūrėsime keletą pavyzdžių kur Google atstovai sakė kitaip nei matome pagal nutekintą dokumentaciją.

Domeno autoritetas

Google atstovai daug kartų yra teigė, kad toks faktorius kaip domeno autoritetas neegzistuoja. Vienas iš pavyzdžių žemiau. Youtube nuorodoje galima pamatyti kaip John Muller sako: “We don’t have anything like website authority score”.

jonas muleris

https://www.youtube.com/watch?v=gS4_JH-QqSg&t=2567s

Patyrę SEO specialistai, retai pasitiki oficialiais Google atstovų teiginiais. Todėl kad mato kaip realybė skiriasi nuo gražių Google atstovų teiginių.
Atskleistoje dokumentacijoje, Compressed Quality Signals modulyje, yra aprašytas faktorius kurio pavadinimas yra siteAuthority, kuris prieštarauja oficialiai Google pozicijai.

siteAuthority

No Sandbox – Nauji tinklapiai nėra diskriminuojami

Sandbox efektas, tarp SEO specialistų, yra vadinamas naujai paleistos svetainės diskriminavimas Google paieškos rezultatuose. Praktikoje, SEO specialistai pastebi “Sandbox” efektą pirmus 6 mėnesius po naujo tinklalapio paleidimo. Jeigu SEO optimizavimo darbai yra tinkamai atlikti ir algoritmas tai įvertina teigiamai, maždaug po 6 mėnesių po paleidimo tinklapis sulauks „SEO meilės” iš algoritmo.

no sandbox

Ištrintoje JohnMu Twitter žinutėje yra įamžintas komentaras, kad “Sandbox” neegzistuoja.

Atskleistoje dokumentacijoje PerDocData modulyje yra hostAge faktorius, kuris naudoja amžiaus faktorių, tam kad išfiltruotų naujus paieškos rezultatus, kurie vertinami kaip SPAM’as, matomai, iki kol neįrodys kitaip.

hostage

We don’t use clicks for ratings – Nenaudojame paspaudimų reitingavimui

Google atstovas, Gary Illyes, vieną kartą net apkaltino žinoma SEO specialistą Rand Fishkin, kad paspaudimų naudojimas reitingavimui yra jo fantazijos.

garyillyes rank fishkin2023 m. “Antitrust” byloje JAV teismė Google atskleidė Navboost ir Glue algoritmų veikimo principus. NavBoost naudoja spustelėjimais pagrįstus metodus, kad pagerintų, sumažintų ar kitaip pakeistų rezultatų reitingavimą Google paieškoje. Pasak, Google atstovo Nayak, NavBoost veikia nuo maždaug 2005 metų ir iki šiol naudojo 18 mėnesių laikotarpio spustelėjimų duomenis. Neseniai sistema buvo atnaujinta ir dabar naudoja 13 mėnesių laikotarpio duomenis, koncentruojantis į Google paieškos rezultatus, o kita sistema, vadinama Glue, susijusi su kitais visuotinės paieškos rezultatais.

Apie Navboost veikimo principą galima paskaityti čia →

Algoritmas naudoja tokius faktorius, kurių pavadinimai kalba už save: badClicks, goodClicks, lastLongestClicks ir unsquashedClicks. https://2596.org/module/QualityNavboostCrapsCrapsClickSignals

bad clicks

Be to, 2007 metų Time Based patentas aiškiai nurodė, kaip spustelėjimų įrašai gali būti naudojami Google paieškos sistemos rezultatų atvaizdavimui.

google time based patentas

Įdomūs atradimai

  • Freshness matters – Google vertina publikacijų datas (bylineDate), URL (syntacticDate) ir puslapio turinį (semanticDate).
  • Google priskyria vektorius puslapiams ir tinklapiams, kad nustatytų ir palygintų ar puslapio turinys (siteRadius) sutampa su pagrindine tinklapio tematika (siteFocusScore).
  • Google saugo domeno registracijos informaciją (RegistrationInfo).
  • Puslapio pavadinimas (meta title) yra aktualus faktorius. Google turi atributą (titlematchScore), kuris tikrina atitikimą paieškos užklausai.
  • Google tikrina dokumento šrifto dydžio vidurkį (avgTermWeight).
  • Twiddlers – reitingavimo modifikatoriai, kurie gali vėliau pakeisti dokumento traukimo reitingą.
  • Pažeminimas SERP rezultatuose gali įvykti:
    • kai nuoroda nesutampa su galutiniu tinklapiu
    • SERP naršymas signalizuoja vartotojo nepasitenkinimą
    • NAV demotion – svetainės probleminės navigacijos
    • lokacijos → mažai informacijos
    • EMD – exact match domain ( Kas yra EMD → )
    • pornografijos
  • Puslapio istorija – Google saugo kiekvieno puslapio kopiją, kuri kada nors buvo suindeksuota ir visus suindeksuotus pakeitimu. Tačiau reitingavimui naudoja tik 20 paskutinių dokumento pakeitimų.
  • Nuorodos užskaitomos – PageRank niekur nedingo ir vis dar naudojamas Google reitigavimo algoritme. Esminiai faktoriai yra nuorodų įvairus profilis (link diversity) ir aktualumas (relevance).
  • Dokumento ilgis apkarpomas numToken pagalba. Nuo tam tikro „token’ų” kiekio algoritmas nebeskaito dokumento.
  • Chrome naršyklė yra naudojama paspaudimo duomenims surinkti.

Kaip panaudoti?

Birželio 10 dieną Google atstovai socialiniame tinkle X sureagavo į ipullrank.com straipsnį, kur pacitavo Mike King pasiūlytą veiksmų planą: „Make Great Content and Promote it Well”.

google cituoja mike king

Kaip galima pritaikyti gauta informaciją kasdieniam SEO darbui:

  • SEO testavimas – nuolatinis testavimas įvairių įdėjų ir hipotezių net pačių keisčiausių.
  • Brand matters – prekinio ženklo vystymas turi vykti online ir offline, Google suteikia daugiau „karmos” tašku žinomam prekės ženklui.
  • CTR tobulinimas – paspaudimai paieškos rezultatuose turi įtakos SEO pozicijoms. Itin svarbus yra lastClick (paskutinis paspaudimas SERP) paieškoje.
  • Make content great again – unikalaus, naudingo ir įdomaus turinio kūrimas turi likti prioritetu.

Resursai:

https ://ipullrank.com/google-algo-leak

https ://searchengineland.com/google-search-document-leak-ranking-442617

https://hexdocs.pm/google_api_content_warehouse/api-reference.html

https://2596.org/

https://github.com/yoshi-code-bot/elixir-google-api/commit/d7a637f4391b2174a2cf43ee11e6577a204a161e#diff-0df89c82efd0a23a4fef97ea87fd8498e22d4cc5fb0597d1e225da7463b8bf4a