WordPress e crawl budget: Google segnala i plugin che “sprecano” crawling (caso WooCommerce e parametri add-to-cart)

WordPress e crawl budget:
Total Views: 208

Condividi!

Indice dei contenuti

Negli ultimi giorni è circolata una notizia molto concreta per chi gestisce siti WordPress, soprattutto e-commerce: il team di Google che si occupa di crawling ha iniziato a segnalare bug direttamente ad alcuni plugin quando questi generano URL inutili e fanno “esplodere” lo spazio di pagine da scansionare.

Il caso più citato riguarda WooCommerce: i parametri “azione” tipo ?add-to-cart= risultavano tra le fonti più rilevanti di spreco di crawling. Secondo quanto riportato, WooCommerce ha recepito la segnalazione e ha rilasciato un fix rapidamente. Altri plugin, invece, sarebbero ancora senza correzioni.

Nota importante: questa non è una “Google Update” ufficiale né un dato “certificato” in senso assoluto. È un insight emerso da una fonte di settore (Search Engine Journal) che riassume quanto condiviso da Google nel contesto di un podcast e di un report interno: utile come campanello d’allarme e come spinta ad audit tecnici mirati.

Cosa sono gli “action parameters” e perché diventano un problema SEO

Gli action parameters sono parametri URL che non servono a mostrare un contenuto diverso, ma ad attivare un’azione: ad esempio ?add-to-cart=, ?add-to-wishlist=, ?action=.

Il problema è che, per un crawler, ogni combinazione di parametri può sembrare un URL nuovo. Quando i parametri si “accodano” (stack), il numero di URL cresce rapidamente (raddoppia, triplica, ecc.), creando:

  • spreco di crawl budget (Googlebot visita pagine inutili)
  • duplicazioni (varianti della stessa pagina)
  • discovery e ricrawl più lenti sulle pagine importanti (prodotti, categorie, landing, contenuti editoriali)

Esempi tipici in contesto WooCommerce:

https://tuosito.it/?add-to-cart=123
https://tuosito.it/prodotto/nome-prodotto/?add-to-cart=123
https://tuosito.it/prodotto/nome-prodotto/?add-to-cart=123&quantity=2

“Ma il crawl budget non riguarda solo siti enormi?”

È vero: in molti casi, soprattutto per siti piccoli o medi, il crawl budget non è il primo problema. Tuttavia, anche siti non giganteschi possono soffrire quando plugin o filtri generano migliaia (o milioni) di URL “spazzatura”, perché:

  • Googlebot può entrare in spazi URL “quasi infiniti”
  • il server può rallentare sotto pressione
  • aumenti di duplicati e segnali contraddittori complicano l’indicizzazione

In pratica: magari non ti “uccide” il ranking domani, ma ti sporca l’indice, rallenta la scoperta delle pagine giuste e rende più difficile leggere i dati.

Perché WordPress è terreno fertile per questi problemi

WordPress vive di plugin. Questo è un vantaggio enorme, ma significa che:

  • un plugin può generare link con parametri senza che il proprietario del sito se ne accorga
  • azioni (carrello, wishlist, compare) possono finire in URL crawlable
  • filtri e sort (faceted navigation) possono produrre combinazioni praticamente infinite

La parte “scomoda” è che il problema può non dipendere da te. Ma l’effetto collaterale (crawl sprecato, duplicati, indicizzazione confusa) rimane una responsabilità del sito.

Come capire se stai sprecando crawling su parametri

1) Search Console: segnali di allarme

  • Crawl stats: spike improvvisi di richieste, aumento di URL con querystring (?), peggioramento dei tempi di risposta
  • Pagine / Indicizzazione: URL con parametri in crescita, duplicati o varianti simili

2) Log server (il metodo più affidabile)

Se hai accesso ai log, cerca:

  • quota di richieste a URL con ?
  • pattern ripetitivi su parametri “azione” e filtri
  • correlazione tra crawling e rallentamenti

3) Crawl interno (Screaming Frog / Sitebulb / crawler custom)

L’obiettivo è trovare da dove nasce il link: tema, pulsanti “Add to cart” in GET, plugin wishlist/compare, plugin filtri.

Soluzioni operative: approccio in 3 livelli (dal migliore al più difensivo)

Livello 1 — Fix alla fonte (la soluzione migliore)

Se un plugin genera URL “azione” crawlable, la priorità è non generarli più nel markup o nella navigazione.

  • Aggiorna WooCommerce + plugin collegati (wishlist, filtri, compare, calendari, ecc.)
  • Controlla il tema: molti temi trasformano “Add to cart” in link GET
  • Preferisci add-to-cart via POST o AJAX invece di link indicizzabili

Livello 2 — Controllo dell’inventario URL (cosa vuoi far scansionare davvero)

Qui la domanda è: queste varianti devono davvero esistere per Google?

  • decidi quali filtri devono essere indicizzabili (se stai facendo SEO su filtri “strategici”) e quali no
  • riduci la proliferazione di combinazioni di filtri/sort
  • evita che parametri irrilevanti (tracking interno) entrino nei link del sito

Livello 3 — Mitigazione difensiva (robots.txt + canonical)

Quando non puoi intervenire subito sul tema/plugin, puoi limitare i danni. Qui serve attenzione: una regola “troppo larga” può bloccare pagine che vuoi indicizzare.

Template robots.txt “safe” (parametri azione)

Esempio da adattare (blocca crawling su parametri azione comuni):

User-agent: *
Disallow: /*?*add-to-cart=
Disallow: /*?*add_to_cart=
Disallow: /*?*add-to-wishlist=
Disallow: /*?*add_to_wishlist=
Disallow: /*?*add-to-compare=
Disallow: /*?*add_to_compare=
Disallow: /*?*wishlist
Disallow: /*?*wc-ajax=
Disallow: /*?*quantity=
Disallow: /*?*variation_id=
Disallow: /*?*attribute_pa_

Nota: robots.txt aiuta a ridurre crawling, ma non garantisce la rimozione immediata di URL già noti/indicizzati. Per quelli serve un piano di “pulizia” (vedi sotto).

Canonical coerenti

  • Prodotti e categorie devono canonizzare verso la versione pulita senza parametri
  • Evita canonical incoerenti sulle pagine filtrate (se non vuoi indicizzarle, spesso canonical verso la categoria base)

Flusso di pulizia: cosa fare se URL con parametri sono già indicizzati

Se hai già URL sporchi in indice, attenzione a non bloccarli subito con robots.txt: Google potrebbe non ricrawlare e quindi non aggiornare lo stato.

  1. Stop alla generazione interna (fix plugin/tema): così non crei nuove varianti
  2. Per 2–4 settimane, applica una strategia di rimozione:
    • 301 da URL con parametri azione verso URL pulita (senza eseguire l’azione)
    • oppure 410/404 se quelle URL non devono esistere
    • oppure noindex via header solo come soluzione temporanea (se necessario)
  3. Dopo la discesa degli URL sporchi (monitorando Search Console), rafforza con robots.txt per prevenire ricomparsa
  4. Per accelerare: usa la rimozione URL in Search Console sui pattern più critici

Checklist rapida WMA (da usare in ogni e-commerce WordPress)

  • Plugin e tema aggiornati (WooCommerce + wishlist/compare/filtri/calendari)
  • Verifica che “Add to cart” non generi link GET indicizzabili
  • Audit parametri: azione, filtri, tracking interno
  • Canonical puliti e coerenti
  • Robots.txt mirato sui parametri azione (solo dopo valutazione)
  • Piano di pulizia per URL già indicizzati (301/410/noindex temporaneo)
  • Monitoraggio crawl stats + log server

Conclusione

Il messaggio è semplice: molti problemi di crawling oggi non nascono dal sito “in sé”, ma dal layer plugin. Se un plugin genera URL inutili, Google li può scoprire e scansionare in massa prima di “capire” che non portano valore. Il risultato è spreco di crawling, duplicati e segnali sporchi.

Per un e-commerce WooCommerce, questa è una delle ottimizzazioni tecniche con il miglior rapporto impatto/tempo: pulisce l’indice, riduce sprechi e rende più affidabili i dati di Search Console.

Vuoi una verifica tecnica completa? In WMA possiamo analizzare log, pattern di parametri e struttura dei filtri, e definire una strategia “safe” che non comprometta conversioni e UX.

Fonte notizia: https://www.searchenginejournal.com/googles-crawl-team-filed-bugs-against-wordpress-plugins/566491/

Linee guida Google:

Crawl budget (guida Search Central)

Faceted navigation: gestione crawling di URL con filtri

Condividi questa storia, scegli tu dove!

5,4 min readPublished On: Febbraio 4th, 2026Last Updated: Febbraio 4th, 2026Categories: Indicizzazione

About the Author: Gentian Hajdaraj

ff5b7d6c868a2a5cd5eadcd64683c6b7d013bea5796681fb0ccade6e68200bc6?s=72&d=mm&r=g
Gentian Hajdaraj, titolare di Web Marketing Aziendale, è un Lead Generation Strategist che lavora nel mondo del marketing online da oltre dieci anni. E' autore del libro: “Le Nuove Regole del Web Marketing” & "eCommerce Reload".

Post correlati

Altri articoli

Sito Web Gratis, lo vuoi anche tu?

La realizzazione del sito web gratis serve davvero a qualcosa? Il web pullula di offerte low cost per la realizzazione di siti web aziendali o personali. Ma quali pericoli si nascondono dietro ai prezzi bassi e alla concorrenza selvaggia? Prima di tutto cos'è un sito web [...]

Una Landing Page efficace in 7 mosse

Vuoi davvero aumentare i contatti/lead? Il segreto sta tutto nella creazione di una landing page efficace: uno strumento diretto e potente per raggiungere il tuo obiettivo commerciale. È una delle carte vincenti in ogni strategia di Web Marketing ben riuscita. Ecco perché una landing page davvero [...]

Marketing e comunicazione, la benzina che fa correre il tuo business

Offrire un buon prodotto o servizio non basta più. Gli utenti devono percepirne tutto il valore. Marketing e comunicazione servono proprio a questo e a vendere molto di più Mi piace pensare al marketing e alla comunicazione come alla benzina della tua azienda. Perché che tu [...]

Marketing strategico, la tua impresa lo sfrutta?

Vuoi avere un vantaggio competitivo reale sui tuoi concorrenti? Allora scopri cosa piace davvero ai tuoi potenziali clienti grazie al marketing strategico Il marketing strategico rappresenta una fase molto importante nel processo di marketing di qualsiasi business perché permette di offrire ai propri clienti proprio i [...]

Brand Positioning: Come convertire con il tuo brand

Da cosa è dovuta la capacità di un brand di convertire di più rispetto ai propri concorrenti? Questione di brand positioning e brand awareness e… Ti sei mai chiesto qual è “l’ingrediente segreto” che permette ad un brand di vendere di più ed avere un appeal [...]

Gestire un Blog Aziendale, ecco le 6 regole per farlo al Meglio

Gestire un blog aziendale non è banale come sembra. Il blog è l'immagine della tua azienda nel web, per questo è importante che la gestione del blog sia fatta con serietà. Ho cercato di individuare alcune regole essenziali che dovresti seguire affinché il blog aziendale risulti [...]

Post correlati