{"id":1230,"date":"2021-01-26T20:36:01","date_gmt":"2021-01-26T20:36:01","guid":{"rendered":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/"},"modified":"2021-01-26T20:36:04","modified_gmt":"2021-01-26T20:36:04","slug":"che-cosa-e-il-file-robots-txt-studio-samo","status":"publish","type":"post","link":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/","title":{"rendered":"Che cosa \u00e8 il file Robots.txt &#8211; Studio Samo"},"content":{"rendered":"<p>\t\t\tUn file robots.txt \u00e8 semplicemente un file di testo inserito all&#8217;interno della root del vostro sito web che istruisce i crawlerUn web crawler, chiamato anche spider o robot, \u00e8 un software che naviga sistematicamente nel World Wide Web, tipicamente ai fini dell&#8217;indicizzazione del web. I&#8230; dei motori di ricerca su quali pagine di un sito web deve crawlare e quali ignorare. Queste istruzioni di crawl sono definite &#8220;disallowing&#8221; o &#8220;allowing&#8221; del comportamento di uno specifico (o di tutti) software di web crawling.<\/p>\n<p>Come funziona Robots.txt?<\/p>\n<p>Il file robots fa parte del Robots Exclusion Protocol (REP), un conglomerato di standard che regolano il modo in cui i robotIn informatica, un robot (o semplicemente &#8220;bot&#8221;) \u00e8 un insieme di comandi o istruzioni codificate che indicano ad un dispositivo meccanico e ad un sistema&#8230; eseguono il crawl del web, l&#8217;accesso e l&#8217;indicizzazioneL&#8217;indicizzazione \u00e8 la fase in cui il motore di ricerca raccoglie, analizza ed archivia i dati per facilitare la rapida e accurata ricerca di informazioni&#8230; dei contenuti, e come presentano tali contenuti agli utenti.<\/p>\n<p>Il REP include anche indicazioni come i meta robot, cos\u00ec come pagine, sottodirectory, o istruzioni a livello di sito web per come i motori di ricerca dovrebbero trattare i link (come &#8220;nofollow&#8221; o &#8220;follow&#8221;).<\/p>\n<p>Esempio Robots.txt:<\/p>\n<p>Di seguito sono riportati alcuni esempi di robots.txt in azione per un sito www.example.com.<\/p>\n<p>L&#8217;URLURL sta per Uniform Resource Locator. Chiamato colloquialmente indirizzo web, \u00e8 un riferimento a una risorsa web come un sito, una pagina o un file&#8230; del file robots deve essere: www.example.com\/robots.txt<\/p>\n<p>Blocco di tutti i web crawler da tutti i contenuti<\/p>\n<p>Questa istruzione dice a tutti i web crawler di non eseguire il crawling di alcuna pagina su www.example.com, compresa la homepage.\u00a0<\/p>\n<p>User-agent: *Disallow: \/<\/p>\n<p>Permettere a tutti i web crawler di accedere a tutti i contenuti<\/p>\n<p>La regola seguente dice ai web crawler di cercare tutte le pagine del sito www.example.com, compresa la homepage.<\/p>\n<p>User-agent: * Allow:<\/p>\n<p>Bloccare un web crawler specifico da una cartella specifica<\/p>\n<p>User-agent: Googlebot\u00a0Disallow: \/example-subfolder\/\u00a0<\/p>\n<p>Questa sintassi indica solo al crawler di Google di eseguire il crawler di qualsiasi pagina contenente la stringa URL www.example.com\/example-subfolder\/.<\/p>\n<p>Bloccare un determinato web crawler da una specifica pagina web<\/p>\n<p>User-agent: Bingbot\u00a0Disallow: \/example-subfolder\/blocked-page.html\u00a0<\/p>\n<p>Questa sintassi indica solo il crawler di Bing per evitare il crawling della pagina esatta all&#8217;indirizzo www.example.com\/example-subfolder\/blocked-page.html.<\/p>\n<p>Come funziona il file robots.txt<\/p>\n<p>I motori di ricerca hanno due obiettivi principali:<\/p>\n<p>Eseguire il crawler del web per scoprire i contenutiIndicizzare quel contenuto in modo che possa essere trovato da chi cerca informazioni.In generale, per cercare siti web, i motori di ricerca seguono i link per passare da un sito web all&#8217;altro, navigando attraverso miliardi di link e siti. Questo comportamento di crawling \u00e8 anche conosciuto con il nome di &#8220;spidering&#8221;.<\/p>\n<p>Una volta in un sito web e prima di effettuare lo spidering, i crawler cercano un file robots. Se ne esiste uno, lo leggono ancor prima di proseguire nella &#8220;scansione&#8221; dell&#8217;intera pagina.<\/p>\n<p>Se il file robots non contiene alcuna regola di disallow o il sito web non ha un file robots, i crawler procedono alla ricerca di altre informazioni sul sito web.<\/p>\n<p>Nozioni veloci da sapere sul file robots.txt: <\/p>\n<p>Per essere trovato, un file robots deve essere inserito nella directory di primo livello di un sito web detta anche root.Il file \/robots.txt \u00e8 disponibile al pubblico. Basta aggiungere \/robots.txt alla fine di qualsiasi dominio principale per vedere le direttive di quel sito web (se quel sito ha un file robots!). Questo significa che chiunque pu\u00f2 vedere quali pagine hai impostato per essere o non essere scansionato. Quindi, non usatele per nascondere le informazioni sensibili dell&#8217;utente.Alcuni robot potrebbero decidere di ignorare il vostro file robots. Questo \u00e8 particolarmente comune con i crawler malevoli, come gli scraper di indirizzi e-mail o i robot malware.Ogni sottodominio su un dominio principale utilizza file robots separati. Ci\u00f2 significa che sia example.com che blogUn blog (abbreviazione di &#8220;weblog&#8221;) \u00e8 un &#8220;giornale online&#8221;, o un sito web informativo, che mostra le informazioni in ordine cronologico inverso, con gli ultimi&#8230;.example.example.com dovrebbero avere i propri file robots.txt (su example.com\/robots.txt e blog.example.com\/robots.txt).Robots.txt \u00e8 case sensitive: il file deve essere chiamato &#8220;robots.txt&#8221; (non robots.TXT, Robots.txt, ecc.).Si consiglia di indicare la posizione di eventuali sitemap collegate a questo dominio nella parte inferiore del file robots.Sintassi tecnica robots.txt<\/p>\n<p>Moz definisce la sintassi di robots.txt come segue: La sintassi di Robots.txt pu\u00f2 essere pensata come il &#8220;linguaggio&#8221; dei file robots.txt.<\/p>\n<p>Ci sono 5 termini comuni che si possono incontrare in un file robots. Essi includono:<\/p>\n<p>User-agent: Il web crawler specifico a cui si forniscono le istruzioni per il crawler &#8211; di solito un motore di ricerca. La maggior parte degli interpreti pu\u00f2 essere trovata qui.Allow (valido solo per GooglebotGooglebot \u00e8 il nome del robot (o crawler) di Google. Un web crawler, chiamato anche spider o robot (o semplicemente &#8220;bot&#8221;) \u00e8 un software che&#8230;): Questa direttiva indica a Googlebot di accedere a una pagina o sottocartella anche se la sua pagina madre o sottocartella pu\u00f2 essere proibita.Disallow: La direttiva istruisce l&#8217;utente-agente a non fare il crawl di  certo URL. Si noti che \u00e8 consentita una sola riga &#8220;Disallow:&#8221; per ogni URL.Sitemap: Usato per richiamare la posizione di qualsiasi sitemap XML collegata a questo URL. Suggerimento: questa direttiva \u00e8 supportata solo da Ask, Bing, Google e Yahoo.Crawl-delay: Si riferisce al numero di secondi che un crawler dovrebbe attendere prima di caricare e strisciare il contenuto della pagina. Suggerimento: Googlebot non riconosce questa regola. Tuttavia la velocit\u00e0 di scansione pu\u00f2 essere impostata nella Google Search Console.Da leggere: 40 motori di ricerca alternativi a Google<\/p>\n<p>Pattern-matching<\/p>\n<p>Quando si tratta di consentire o bloccare gli URL esatti, i file robots.txt possono diventare piuttosto complessi in quanto consentono l&#8217;uso di pattern-matching per coprire una serie di possibili opzioni di URL.<\/p>\n<p>Sia Bing che Google riconoscono due espressioni comuni che possono essere usate per rilevare pagine o sottocartelle che un SEOSearch Engine Optimization (ottimizzazione per i motori di ricerca): l&#8217;insieme di strategie e pratiche per posizionare siti o pagine web nei risultati organici dei motori&#8230; vuole essere escluso.<\/p>\n<p>Questi due caratteri sono il segno del dollaro ($) e l&#8217;asterisco (*). <\/p>\n<p>Il ($) corrisponde alla fine dell&#8217;URL e (*) \u00e8 un carattere jolly che rappresenta una qualsiasi sequenza di caratteri. <\/p>\n<p>Google fornisce nelle guida &#8220;Creare un file robots.txt&#8221; un&#8217;ampia lista di possibili sintassi e di esempi di sintassi che corrispondono ai modelli.<\/p>\n<p>Dove mettere i robot.txt?<\/p>\n<p>Il file robots.txt deve essere posizionato alla radice dell&#8217;host del sito a cui si applica.<\/p>\n<p>Ad esempio, per controllare il crawling su tutti gli URL sotto httpL&#8217;Hypertext Transfer Protocol (HTTP) \u00e8 il fondamento del World Wide Web, e viene utilizzato per caricare pagine web utilizzando link ipertestuali. L&#8217;HTTP \u00e8 un protocollo&#8230;:\/\/www.example.com\/, il file robots deve essere posizionato all&#8217;indirizzo http:\/\/www.example.com\/robots.txt.<\/p>\n<p>Non pu\u00f2 essere localizzato in una sottodirectory (per esempio all&#8217;indirizzo http:\/\/example.com\/pages\/robots.txt).<\/p>\n<p>Se non si \u00e8 sicuri di come accedere alla root del proprio sito, o si ha bisogno di un supporto operativo, si consiglia sempre di contattare il proprio fornitore di servizi di web hostingUn Web hosting (o hosting) \u00e8 un servizio che permette di pubblicare un sito web su Internet. Per pubblicare qualunque sito web online, \u00e8 necessario&#8230;.<\/p>\n<p>Suggerimento professionale! Se non riesci ad accedere al tuo sito web root, usa un metodo alternativo come i meta tag.<\/p>\n<p>Perch\u00e9 robots.txt \u00e8 essenziale?<\/p>\n<p>Per bloccare le pagine non pubbliche<\/p>\n<p>S\u00ec, a volte si possono avere pagine del sito web che non si vuole indicizzare &#8211; per esempio, una pagina di login. Se avete tali pagine, \u00e8 possibile utilizzare il file robots.txt per bloccarle da crawler e bot dei motori di ricerca.<\/p>\n<p>Massimizzare il crawl budget<\/p>\n<p>Se hai difficolt\u00e0 a indicizzare tutte le tue pagine, potresti avere un problema di budgetUn budget \u00e8 una stima delle entrate e delle spese in un determinato periodo di tempo futuro, e viene solitamente compilato e rivalutato periodicamente. I&#8230;. Bloccando pagine insignificanti dal file robots, Googlebot pu\u00f2 spendere pi\u00f9 del crawl budgetIl Crawl Budget \u00e8 il numero di pagine che Googlebot cerca e indicizza su un sito web in un determinato lasso di tempo. Il Crawl&#8230; sulle pagine che essenzialmente contano.<\/p>\n<p>Prevenire l&#8217;indicizzazione delle risorse<\/p>\n<p>Mentre le meta directives possono funzionare bene quanto i robots.txt nell&#8217;impedire che le pagine vengano indicizzate, non funzionano bene per le risorse multimediali come immagini e i file PDF. \u00c8 qui che entra in gioco robots.txt.<\/p>\n<p>Puoi sempre controllare quante pagine web hai indicizzato nella Google Search Console. Se il numero \u00e8 esattamente quello che si vuole indicizzare, non c&#8217;\u00e8 bisogno di preoccuparsi. Ma se non \u00e8 cos\u00ec, allora c&#8217;\u00e8 bisogno di creare un file robots.txt per il tuo sito.<\/p>\n<p>Da leggere: Google Search Console: una guida pratica per chi inizia<\/p>\n<p>Le migliori pratiche SEO<\/p>\n<p>Assicurati di non bloccare alcun contenuto o sezione del tuo sito che vuoi far crawlare.Non utilizzare il file robots per evitare che i dati sensibili appaiano nei risultati della SERPSERP: acronimo di Search Engine Results Pages, letteralmente &#8220;pagina dei risultati di un motore di ricerca&#8221;. Le SERP sono pagine web servite agli utenti quando&#8230;. Questo perch\u00e9 altre pagine potrebbero collegarsi direttamente alla pagina contenente informazioni private, che potrebbero essere ancora indicizzate.Se vuoi davvero bloccare la tua pagina dai risultati della ricerca, utilizza un metodo diverso, come la noindex meta directive o la protezione con password.I link sulle pagine bloccate da robots.txt non saranno seguiti. Ci\u00f2 significa:<\/p>\n<p>A meno che non siano collegati anche da altre pagine accessibili dal motore di ricerca (come ad esempio le pagine non bloccate da robots.txt, meta-robot, ecc.), le risorse collegate non saranno sottoposte a crawled e potrebbero non essere indicizzate.Nessuna link equity\u00a0pu\u00f2 essere passata dalla pagina bloccata alla destinazione del link. Se hai pagine a cui vuoi che l&#8217;equity venga passata, utilizza un meccanismo di blocco diverso da quello di robots.txt.Alcuni motori di ricerca hanno pi\u00f9 crawler. Ad esempio, Google utilizza Googlebot-Image per la ricerca di immagini e Googlebot per la ricerca organica.La maggior parte dei crawler dello stesso motore di ricerca seguono le stesse regole, quindi non c&#8217;\u00e8 bisogno di definire regole per ciascuno dei crawler multipli di un motore di ricerca. <\/p>\n<p>Tuttavia, avere la possibilit\u00e0 di farlo permette di perfezionare il modo in cui il tuo sito web viene crawlato.<\/p>\n<p>Rendi il tuo file robots facile da trovare. Mentre \u00e8 possibile posizionarlo in qualsiasi directory principale del tuo sito web, si consiglia di metterlo a https:\/\/example.com\/robots.txt e scriverlo in minuscolo per aumentare le probabilit\u00e0. Il file robots \u00e8 case sensitive. Quindi assicurati di usare una &#8220;r&#8221; minuscola nel nome del file.Un motore di ricerca metter\u00e0 in cache i contenuti di robots.txt, ma di solito aggiorna i contenuti in cache almeno una volta al giorno. Se si modifica il file e si desidera aggiornarlo pi\u00f9 velocemente di quanto non sia, \u00e8 possibile inviare l&#8217;URL \/robots.txt a Google.Robots.txt vs. meta-robot vs. x-robot<\/p>\n<p>Qual \u00e8 la differenza tra questi tre tipi di robot directive?<\/p>\n<p>Semplicemente, robots.txt \u00e8 il file di testo vero e proprio, mentre meta e x-robot sono meta directive. Oltre a questo, questi tre directive servono per funzioni diverse.<\/p>\n<p>Robots.txt determina il comportamento di crawl del sito web o della direzione a livello di sito web. <\/p>\n<p>I meta e gli x-robot possono determinare il comportamento di indicizzazione a livello di singola pagina (o elemento di pagina).<\/p>\n<p>[ \u00a0via siteguru.com ]<\/p>\n<p>\n<!--noindex--><br \/>\n<a href=\"https:\/\/www.studiosamo.it\/che-cosa-e-il-file-robots-txt\/\" rel=\"nofollow\">Source link <\/a><br \/>\n<!--\/noindex--><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Un file robots.txt \u00e8 semplicemente un file di testo inserito all&#8217;interno della root del vostro sito web che istruisce i crawlerUn web crawler, chiamato anche spider o robot, \u00e8 un software che naviga sistematicamente nel World Wide Web, tipicamente ai fini dell&#8217;indicizzazione del web. I&#8230; dei motori di ricerca su quali pagine di un sito [&hellip;]<\/p>\n","protected":false},"author":3,"featured_media":1231,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[2],"tags":[],"class_list":["post-1230","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-novita-di-marketing-su-internet"],"yoast_head":"<!-- This site is optimized with the Yoast SEO plugin v27.2 - https:\/\/yoast.com\/product\/yoast-seo-wordpress\/ -->\n<title>Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News<\/title>\n<meta name=\"robots\" content=\"index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1\" \/>\n<link rel=\"canonical\" href=\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\" \/>\n<meta property=\"og:locale\" content=\"it_IT\" \/>\n<meta property=\"og:type\" content=\"article\" \/>\n<meta property=\"og:title\" content=\"Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News\" \/>\n<meta property=\"og:description\" content=\"Un file robots.txt \u00e8 semplicemente un file di testo inserito all&#8217;interno della root del vostro sito web che istruisce i crawlerUn web crawler, chiamato anche spider o robot, \u00e8 un software che naviga sistematicamente nel World Wide Web, tipicamente ai fini dell&#8217;indicizzazione del web. I&#8230; dei motori di ricerca su quali pagine di un sito [&hellip;]\" \/>\n<meta property=\"og:url\" content=\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\" \/>\n<meta property=\"og:site_name\" content=\"Favorite News\" \/>\n<meta property=\"article:published_time\" content=\"2021-01-26T20:36:01+00:00\" \/>\n<meta property=\"article:modified_time\" content=\"2021-01-26T20:36:04+00:00\" \/>\n<meta property=\"og:image\" content=\"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg\" \/>\n\t<meta property=\"og:image:width\" content=\"1024\" \/>\n\t<meta property=\"og:image:height\" content=\"536\" \/>\n\t<meta property=\"og:image:type\" content=\"image\/jpeg\" \/>\n<meta name=\"author\" content=\"favorite-news\" \/>\n<meta name=\"twitter:card\" content=\"summary_large_image\" \/>\n<meta name=\"twitter:label1\" content=\"Scritto da\" \/>\n\t<meta name=\"twitter:data1\" content=\"favorite-news\" \/>\n\t<meta name=\"twitter:label2\" content=\"Tempo di lettura stimato\" \/>\n\t<meta name=\"twitter:data2\" content=\"10 minuti\" \/>\n<script type=\"application\/ld+json\" class=\"yoast-schema-graph\">{\"@context\":\"https:\/\/schema.org\",\"@graph\":[{\"@type\":\"Article\",\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#article\",\"isPartOf\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\"},\"author\":{\"name\":\"favorite-news\",\"@id\":\"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71\"},\"headline\":\"Che cosa \u00e8 il file Robots.txt &#8211; Studio Samo\",\"datePublished\":\"2021-01-26T20:36:01+00:00\",\"dateModified\":\"2021-01-26T20:36:04+00:00\",\"mainEntityOfPage\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\"},\"wordCount\":1968,\"commentCount\":0,\"image\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg\",\"articleSection\":[\"NOVIT\u00c0 DI MARKETING SU INTERNET\"],\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"CommentAction\",\"name\":\"Comment\",\"target\":[\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#respond\"]}]},{\"@type\":\"WebPage\",\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\",\"url\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\",\"name\":\"Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News\",\"isPartOf\":{\"@id\":\"https:\/\/favorite-news.com\/it\/#website\"},\"primaryImageOfPage\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage\"},\"image\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage\"},\"thumbnailUrl\":\"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg\",\"datePublished\":\"2021-01-26T20:36:01+00:00\",\"dateModified\":\"2021-01-26T20:36:04+00:00\",\"author\":{\"@id\":\"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71\"},\"breadcrumb\":{\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#breadcrumb\"},\"inLanguage\":\"it-IT\",\"potentialAction\":[{\"@type\":\"ReadAction\",\"target\":[\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/\"]}]},{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage\",\"url\":\"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg\",\"contentUrl\":\"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg\",\"width\":1024,\"height\":536,\"caption\":\"Cos&#039;\u00e8 robots.txt file\"},{\"@type\":\"BreadcrumbList\",\"@id\":\"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#breadcrumb\",\"itemListElement\":[{\"@type\":\"ListItem\",\"position\":1,\"name\":\"Home\",\"item\":\"https:\/\/favorite-news.com\/it\/\"},{\"@type\":\"ListItem\",\"position\":2,\"name\":\"Che cosa \u00e8 il file Robots.txt &#8211; Studio Samo\"}]},{\"@type\":\"WebSite\",\"@id\":\"https:\/\/favorite-news.com\/it\/#website\",\"url\":\"https:\/\/favorite-news.com\/it\/\",\"name\":\"Favorite News\",\"description\":\"Favorite News Italy\",\"potentialAction\":[{\"@type\":\"SearchAction\",\"target\":{\"@type\":\"EntryPoint\",\"urlTemplate\":\"https:\/\/favorite-news.com\/it\/?s={search_term_string}\"},\"query-input\":{\"@type\":\"PropertyValueSpecification\",\"valueRequired\":true,\"valueName\":\"search_term_string\"}}],\"inLanguage\":\"it-IT\"},{\"@type\":\"Person\",\"@id\":\"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71\",\"name\":\"favorite-news\",\"image\":{\"@type\":\"ImageObject\",\"inLanguage\":\"it-IT\",\"@id\":\"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g\",\"url\":\"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g\",\"contentUrl\":\"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g\",\"caption\":\"favorite-news\"},\"url\":\"https:\/\/favorite-news.com\/it\/author\/it\/\"}]}<\/script>\n<!-- \/ Yoast SEO plugin. -->","yoast_head_json":{"title":"Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News","robots":{"index":"index","follow":"follow","max-snippet":"max-snippet:-1","max-image-preview":"max-image-preview:large","max-video-preview":"max-video-preview:-1"},"canonical":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/","og_locale":"it_IT","og_type":"article","og_title":"Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News","og_description":"Un file robots.txt \u00e8 semplicemente un file di testo inserito all&#8217;interno della root del vostro sito web che istruisce i crawlerUn web crawler, chiamato anche spider o robot, \u00e8 un software che naviga sistematicamente nel World Wide Web, tipicamente ai fini dell&#8217;indicizzazione del web. I&#8230; dei motori di ricerca su quali pagine di un sito [&hellip;]","og_url":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/","og_site_name":"Favorite News","article_published_time":"2021-01-26T20:36:01+00:00","article_modified_time":"2021-01-26T20:36:04+00:00","og_image":[{"width":1024,"height":536,"url":"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg","type":"image\/jpeg"}],"author":"favorite-news","twitter_card":"summary_large_image","twitter_misc":{"Scritto da":"favorite-news","Tempo di lettura stimato":"10 minuti"},"schema":{"@context":"https:\/\/schema.org","@graph":[{"@type":"Article","@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#article","isPartOf":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/"},"author":{"name":"favorite-news","@id":"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71"},"headline":"Che cosa \u00e8 il file Robots.txt &#8211; Studio Samo","datePublished":"2021-01-26T20:36:01+00:00","dateModified":"2021-01-26T20:36:04+00:00","mainEntityOfPage":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/"},"wordCount":1968,"commentCount":0,"image":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage"},"thumbnailUrl":"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg","articleSection":["NOVIT\u00c0 DI MARKETING SU INTERNET"],"inLanguage":"it-IT","potentialAction":[{"@type":"CommentAction","name":"Comment","target":["https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#respond"]}]},{"@type":"WebPage","@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/","url":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/","name":"Che cosa \u00e8 il file Robots.txt - Studio Samo - Favorite News","isPartOf":{"@id":"https:\/\/favorite-news.com\/it\/#website"},"primaryImageOfPage":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage"},"image":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage"},"thumbnailUrl":"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg","datePublished":"2021-01-26T20:36:01+00:00","dateModified":"2021-01-26T20:36:04+00:00","author":{"@id":"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71"},"breadcrumb":{"@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#breadcrumb"},"inLanguage":"it-IT","potentialAction":[{"@type":"ReadAction","target":["https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/"]}]},{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#primaryimage","url":"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg","contentUrl":"https:\/\/favorite-news.com\/it\/wp-content\/uploads\/sites\/9\/2021\/01\/Che-cosa-e-il-file-Robotstxt-Studio-Samo.jpg","width":1024,"height":536,"caption":"Cos&#039;\u00e8 robots.txt file"},{"@type":"BreadcrumbList","@id":"https:\/\/favorite-news.com\/it\/che-cosa-e-il-file-robots-txt-studio-samo\/#breadcrumb","itemListElement":[{"@type":"ListItem","position":1,"name":"Home","item":"https:\/\/favorite-news.com\/it\/"},{"@type":"ListItem","position":2,"name":"Che cosa \u00e8 il file Robots.txt &#8211; Studio Samo"}]},{"@type":"WebSite","@id":"https:\/\/favorite-news.com\/it\/#website","url":"https:\/\/favorite-news.com\/it\/","name":"Favorite News","description":"Favorite News Italy","potentialAction":[{"@type":"SearchAction","target":{"@type":"EntryPoint","urlTemplate":"https:\/\/favorite-news.com\/it\/?s={search_term_string}"},"query-input":{"@type":"PropertyValueSpecification","valueRequired":true,"valueName":"search_term_string"}}],"inLanguage":"it-IT"},{"@type":"Person","@id":"https:\/\/favorite-news.com\/it\/#\/schema\/person\/4af696433ee608b069a00941a5ebad71","name":"favorite-news","image":{"@type":"ImageObject","inLanguage":"it-IT","@id":"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g","url":"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g","contentUrl":"https:\/\/secure.gravatar.com\/avatar\/fe82ac988eb26597b9c41957906c398c0cad9b76be843314bfcff51603dc5f4a?s=96&d=mm&r=g","caption":"favorite-news"},"url":"https:\/\/favorite-news.com\/it\/author\/it\/"}]}},"_links":{"self":[{"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/posts\/1230","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/users\/3"}],"replies":[{"embeddable":true,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/comments?post=1230"}],"version-history":[{"count":1,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/posts\/1230\/revisions"}],"predecessor-version":[{"id":1232,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/posts\/1230\/revisions\/1232"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/media\/1231"}],"wp:attachment":[{"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/media?parent=1230"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/categories?post=1230"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/favorite-news.com\/it\/wp-json\/wp\/v2\/tags?post=1230"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}