1
Riepilogo post gennaio 2021
Attenzione! Questo contenuto è vecchioQuesto articolo risale al 2021, quindi i contenuti e le operazioni qui consigliate potrebbero essere diventate obsolete nel corso del tempo.

Nell'articolo precedente ho parlato del nuovo tool MetaDB, che al suo interno, oltre ad altre interessanti statistiche, dispone di una analisi statistica aggregata riguardante i server di hosting più utilizzati dai siti web online.

Nella fattispecie, vorrei analizzare il market share che Aruba è riuscita ad acquisire nel corso degli anni sul mercato dei siti web Italiani.

MetaDB dispone di un filtro per TLD (estensione del dominio) e lingua utilizzata dal sito, quindi è possibile effettuare delle comparazioni molto precise.

Iniziamo con l'analisi del market share complessivo, ovvero, di tutti i siti web analizzati da MetaDB.

Tutte le statistiche e dati sotto riportati fanno riferimento alla pagina "Quali sono gli hosting più utilizzati" reperibile su MetaDB, e aggiornata al 4 Gennaio 2021.

Non vengono riportati i link ai vari provider, per informazioni basta una ricerca su Google digitando il rispettivo nome provider, se non conosciuto. I provider con una percentuale inferiore al 1% di market share non sono riportati: fare riferimento alla pagina su MetaDB per reperire più informazioni.

  1. 7,46 % - Cloudflare (566.084 siti)
  2. 6,89 % - Google (522.750 siti)
  3. 5,99 % - Aruba (454.373 siti)
  4. 5,69 % - Ovh (432.239 siti)
  5. 4,18 % - Amazon (317.192 siti)
  6. 4,12 % - 1&1 Internet (312.368)
  7. 2,59 % - Hetzner (196.559 siti)
  8. 2,47 % - Strato (187.400 siti)
  9. 2,36 % - Google Cloud (178.889 siti)
  10. 1,68 % - Dataweb (127.120 siti)
  11. 1,6 % - Godaddy (121.616 siti)
  12. 1,52 % - Team Internet (115.056 siti)
  13. 1,27 % - Wix (96.658 siti)
  14. 1,16 % - Transip (88.044 siti)
  15. 1 % - Neue Medien Muennich (76.277 siti)
  16. 1 % - Squarespace (75.964 siti)

Suddivisione dei provider di hosting maggiormente utilizzati - Tutti i siti web sottoposti a scansione

Il dato diventa particolarmente interessante filtrando per TLD .IT (domini con estensione .it).
Il market share di Aruba è davvero notevole, comparato agli altri provider.

  1. 34,09 % - Aruba (365.509 siti)
  2. 7,49 % - Team Internet (80.359 siti)
  3. 6,49 % - Ovh (69.639 siti)
  4. 4,04 % - Dadanet (43.289 siti)
  5. 3,77 % - Amazon (40.379 siti)
  6. 3,22 % - Register (34.512 siti)
  7. 2,86 % - Google Cloud (30.641 siti)
  8. 2,66 % - Hetzner (28.525 siti)
  9. 2,56 % - Cloudflare (27.447 siti)
  10. 2,37 % - Seeweb (25.423 siti)
  11. 2,03 % - Netsons (21.736 siti)
  12. 1,05 % - Sedo (11.245 siti)

Suddivisione dei provider di hosting maggiormente utilizzati - Filtrato per TLD .IT

La suddivisione del market share è similare, se il filtro impostato è sulla lingua Italiana.

Un altro dato interessante è la differenza tra i siti hostati su Aruba, senza filtri per TLD / Lingua, pari a 454.373 unità, rispetto ai siti .IT hostati su Aruba, pari a 365.509 unità. Il delta è pari a 88.864 unità di siti web "non .IT" hostati su Aruba.

Dal delta si deduce che, su un corpus totale di 7.591.234 siti web analizzati (prima immagine), il 1,17% dei siti web non .IT è hostato su Aruba.

Perchè così tanto market share su Aruba? Per quale motivo i possessori di siti web .IT non guardano alla concorrenza, che offre piani vantaggiosi in termini di costo, performance, facilità d'uso e deploy?

Probabilmente sono i veri first mover qui in Italia. Detengono il "first-mover advantage", e ormai hanno anche acquisito il vantaggio mediatico (pubblicità in TV?).
E sappiamo quanto la mentalità italiana faccia la differenza: se funziona, perchè cambiare? E soprattutto, chi mi consiglia e chi sa migrare i miei dati?

Esistono veramente delle alternative migliori, sotto tutti i punti di vista prettamente tecnici, e (personalmente parlando, poi è opinabile) sotto i punti di vista di usabilità delle interfacce di fatturazione e gestione dei server. Semplicemente, il cliente medio non è a conoscenza dell'esistenza della concorrenza e i pro/contro di questo piuttosto che l'altro provider, e i professionisti che seguono questi clienti spesso non sono interessati a far valutare anche altre opzioni.

Attenzione! Questo contenuto è vecchioQuesto articolo risale al 2021, quindi i contenuti e le operazioni qui consigliate potrebbero essere diventate obsolete nel corso del tempo.

E' stata una bella avventura. Dal lontano 2016, quando MetaDB era solo un'idea, ad oggi, che il risultato di tanto lavoro e tanta dedizione è diventato realtà.

Sono elettrizzato nell'annunciare che il nostro progetto MetaDB, rilasciato al pubblico con licenza d'uso dei dati CC BY-NC-SA 4.0, è finalmente online, funzionante e soprattutto pieno di informazioni utilissime per tutti gli esperti nel settore web, e in generale per tutti i Nerd come noi!

MetaDB è un progetto lanciato in produzione nel Gennaio 2021, interamente seguito da me in prima persona, con l'ausilio del team Polarity Bit con il quale collaboro, che pone l'analisi "statica" dei siti web sotto un punto di vista differente e innovativo.

Siamo infatti abituati a tool online di ogni tipo ( solo per citarne alcuni ... seochecker, builtwith, ahrefs, shodan ) che effettuano analisi on-page per domini singoli, e popolano statistiche o dati in riferimento al sito stesso ed eventualmente al sito target confrontandolo con altri siti web.

MetaDB è invece un sistema di analisi statistica e censimento dei siti web, che pone il focus sull'analisi aggregata di "tutti i siti" al posto che sulla analisi del singolo dominio.

La cosa interessante di MetaDB è l'approccio alla analisi di "tutti i siti". Infatti, come si crea un database di tutti i nomi a dominio, per poter effettuare l'analisi del (eventuale) sito web collegato? (non tutti i domini sono registrati per "rispondere" ad una richiesta HTTP, alcuni vengono usati ad esempio solo per la parte email)

MetaDB effettua la scansione partendo da un sottoinsieme di siti web iniziale, una specie di "seed", ed effettua quello che in gergo tecnico si chiama Snowball Sampling. Il seed iniziale viene posto in una coda FIFO, e il codice HTML di ogni sito viene sottoposto a scansione. La scansione del codice HTML riguarda anche tutti i tag <a href>, e quindi tutti i link che puntano a "domini esterni" rispetto al dominio in questione vengono inseriti in coda per l'analisi.

Questa tecnica permette, dopo un numero abbastanza alto di scansioni, di creare una mappa di relazioni piuttosto vasta tra i siti. Ovviamente, per logica, usando questa tecnica non è possibile raggiungere tutti i siti web (e quindi i domini registrati), ma è possibile solo costruire il grafo ad albero di tutti i domini che si referenziano tra loro. Più è vasto il seed iniziale, e più sarà grande il grafo finale.

MetaDB analizza parecchi aspetti dei siti web analizzati, offrendo la possibilità di filtrare i risultati per TLD (estensione del dominio) e lingua del sito. Gli aspetti analizzati includono:

  • Tecnologie utilizzate per la costruzione e il funzionamento del sito (come, ad esempio, PHP - jQuery - Bootstrap - React - Ecommerce)
  • Server di hosting e provider di connettività dell'hosting (Autonomous System Network)
  • Tipi di server web e relative versioni utilizzate (Apache, Nginx, etc)
  • Insight sull'utlizzo di Template e Plugin di Wordpress
  • Codici di errore HTTP più frequenti sui siti offline
  • Utilizzo HTTPS / Linearizzazione www.*
  • Siti web più referenziati (link in ingresso)
  • Text-to-html ratio e suddivisione tra siti che usano un T2HTML ratio sufficiente (>8%) e non (<8%)
  • Insight sull'uso dei tag H1 -> H4 con focus particolare sui siti più popolari, e quelli più referenziati

Una curiosità: sapevate che la maggior parte dei siti web iniziano con la lettera S, con il 9,38% sul totale dei nomi a dominio?


Altro dato, un pò meno eclatante: il 39,19% di tutti i siti web analizzati ha almeno un link verso Facebook, e il 22,87% verso Twitter.

Un dato che mi ha lasciato perplesso è quello relativo all'auto-redirect verso il protocollo sicuro https.

Vero, se un utente raggiunge un sito web è molto probabile lo faccia tramite un motore di ricerca. Ma se lo stesso utente dovesse scrivere a mano il dominio sulla barra degli indirizzi, è incredibile sapere che solo il 31,89% dei siti web effettua un redirect automatico verso https.

Ora, la curiosità passa a Voi lettori. Vi consiglio di andare subito su https://metadb.co e navigare il sito. Troverete molti spunti interessanti per creare contenuti di gradimento per il Vostro pubblico (mi riferisco soprattutto ai Blog di settore), e per condividere qualche informazione utile sui canali social.

Abbiamo dedicato parecchie ore di sviluppo per creare un tool di esportazione dei grafici in formato PNG direttamente sulla GUI del sito. Con un semplice click potrete scaricare i grafici, e ri-pubblicarli su tutti i canali di vostro gradimento.

Nel caso in cui abbiate bisogno di qualche dato specifico e molto settoriale, e possibile estrapolare dati custom dalla base di dati che compone MetaDB. Il posto giusto per effettuare richieste è tramite il modulo di contatto predisposto su MetaDB.

MetaDB è solo all'inizio del suo percorso. Attendiamo con molta curiosità il feedback che arriverà dalla rete, e faremo il nostro meglio per soddisfare le richieste.

Buona navigazione su MetaDB. Speriamo vivamente che possa essere un ottimo spunto per molti Internet Enthusiast, per gli sviluppatori, e per tutte le persone che rendono possibile il funzionamento del web.