<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>(не)?путевые заметки &#187; Google</title>
	<atom:link href="http://chernyshov.kiev.ua/tag/google/feed/" rel="self" type="application/rss+xml" />
	<link>http://chernyshov.kiev.ua</link>
	<description>Субъективный взгляд на интернет-маркетинг</description>
	<lastBuildDate>Tue, 07 Feb 2012 10:30:53 +0000</lastBuildDate>
	<language>en</language>
	<sy:updatePeriod>hourly</sy:updatePeriod>
	<sy:updateFrequency>1</sy:updateFrequency>
	<generator>http://wordpress.org/?v=3.3.1</generator>
		<item>
		<title>robots.txt и кеш Google</title>
		<link>http://chernyshov.kiev.ua/2011/11/robots-txt-cache-google/</link>
		<comments>http://chernyshov.kiev.ua/2011/11/robots-txt-cache-google/#comments</comments>
		<pubDate>Tue, 29 Nov 2011 08:15:41 +0000</pubDate>
		<dc:creator>Cherny</dc:creator>
				<category><![CDATA[Новости]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[robots.txt]]></category>
		<category><![CDATA[SEO]]></category>
		<category><![CDATA[Яндекс]]></category>

		<guid isPermaLink="false">http://chernyshov.kiev.ua/?p=171</guid>
		<description><![CDATA[Решил перепроверить в принципе уже известные факты о том, как ведут себя Яндекс и Google при запрете страниц в robots.txt. Хотя на самом деле речь в основном пойдет про Google, потому что поведение Яндекса вполне просто и прямолинейно. Есть два варианта: 1) Страница, страницы или разделы уже существуют и проиндексированы, после чего они закрываются от [...]
Смотрите также:<ol>
<li><a href='http://chernyshov.kiev.ua/2011/09/kak-skleit-zerkala-sajta-v-yandekse/' rel='bookmark' title='Как склеить зеркала сайта в Яндексе'>Как склеить зеркала сайта в Яндексе</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/direktivy-v-robots-txt/' rel='bookmark' title='Директивы в robots.txt'>Директивы в robots.txt</a></li>
<li><a href='http://chernyshov.kiev.ua/2009/09/recaptcha-i-google/' rel='bookmark' title='reCaptcha и Google'>reCaptcha и Google</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p><img class="alignleft size-full" style="margin-right: 10px;" title="robots.txt и поисковые системы Яндекс и Google" src="http://chernyshov.kiev.ua/wp-content/uploads/2011/11/robotstxt_vs_Google1.jpg" alt="robots.txt и поисковые системы Яндекс и Google" width="350" height="396" />Решил перепроверить в принципе уже известные факты о том, как ведут себя Яндекс и Google при запрете страниц в robots.txt. Хотя на самом деле речь в основном пойдет про Google, потому что поведение Яндекса вполне просто и прямолинейно.</p>
<p>Есть два варианта:</p>
<p>1) Страница, страницы или разделы уже существуют и проиндексированы, после чего они закрываются от индексирования в robots.txt</p>
<p>2) Страница или группа страниц изначально закрыта в robots.txt до возможности их индексации.</p>
<p>Казалось бы второй вариант вообще нет смысла рассматривать, потому что сразу запрещено и «мышь не проскочит, робот не пройдет». Ан, нет &#8211; возможны варианты!</p>
<h2>Запрещение уже проиндексированных страниц сайта</h2>
<p>Не так давно появилась необходимость закрыть от индексации сайт с сотней тысяч проиндексированных страниц. Практически полностью, т.е. из 100 тыс. осталось штук 30-40. Яндекс в этом случае при ближайшем апдейте безусловно удаляет все 999 960 «лишних» страниц, никак специально не уведомляя об этом, т.е. если вебмастер запретил &#8211; он знает, что делает.<span id="more-171"></span></p>
<p>Google в этом случае начинает сигнализировать в <a href="http://www.google.com/webmasters/">Google Webmaster Tools</a>, что “Обнаружена серьезная ошибка&#8230;” и необходимо проверить, не запрещены ли важные страницы сайта в robots.txt. При этом Google не удаляет из индекса запрещенные страницы, а продолжает их показывать, включая и сохраненные копии, просто-напросто сохраненные копии не обновляются, а выводятся по состоянию на те даты, когда индексирование искомых страниц было разрешено.</p>
<p>Формально Google кажется  правым, поскольку после запрета индексации робот не запрашивает сами страницы, а что проиндексировано до запрета, принадлежит индексу Google, а не вебмастеру сайта.</p>
<h2>Запрещение индексации новых страниц</h2>
<p>Проверяется просто: одна или несколько страниц, выложенных в заранее запрещенную для индексации директорию, ставим на появившиеся страницы ссылки на известных Гуглу страницах.</p>
<p>Яндекс вполне предсказуем &#8211; запрещено, значит запрещено.</p>
<p>Google похож на воспитанную собаку, которая котлету не крадет, но старается быть к ней максимально близко. поисковик считает, что раз ссылка есть, то и страница существует и, ни разу не дернув эту страницу с сервера, начинает показывать ссылку на нее в результатах поиска, используя текст ссылки и близлежащий текст  в качестве заголовка.</p>
<p>Смотрите также:</p><ol>
<li><a href='http://chernyshov.kiev.ua/2011/09/kak-skleit-zerkala-sajta-v-yandekse/' rel='bookmark' title='Как склеить зеркала сайта в Яндексе'>Как склеить зеркала сайта в Яндексе</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/direktivy-v-robots-txt/' rel='bookmark' title='Директивы в robots.txt'>Директивы в robots.txt</a></li>
<li><a href='http://chernyshov.kiev.ua/2009/09/recaptcha-i-google/' rel='bookmark' title='reCaptcha и Google'>reCaptcha и Google</a></li>
</ol>]]></content:encoded>
			<wfw:commentRss>http://chernyshov.kiev.ua/2011/11/robots-txt-cache-google/feed/</wfw:commentRss>
		<slash:comments>1</slash:comments>
		</item>
		<item>
		<title>Поисковики сдают позиции социальным сетям в UK</title>
		<link>http://chernyshov.kiev.ua/2010/06/poiskoviki-sdayut-pozicii-socialnym-setyam-v-uk/</link>
		<comments>http://chernyshov.kiev.ua/2010/06/poiskoviki-sdayut-pozicii-socialnym-setyam-v-uk/#comments</comments>
		<pubDate>Wed, 09 Jun 2010 09:18:28 +0000</pubDate>
		<dc:creator>Cherny</dc:creator>
				<category><![CDATA[Исследования]]></category>
		<category><![CDATA[Facebook]]></category>
		<category><![CDATA[Google]]></category>
		<category><![CDATA[Youtube]]></category>
		<category><![CDATA[социальные сети]]></category>

		<guid isPermaLink="false">http://notes.webartsolutions.com/2010/06/poiskoviki-sdayut-pozicii-socialnym-setyam-v-uk/</guid>
		<description><![CDATA[Сборная поисковиков против сборной социальных сетей. По количеству визитов, а не аудитории. Согласно данным сервиса Experian Hitwise в мае 2010 впервые на рынке Великобритании количество визитов пользователей в социальные сети и сервисы превысило количество визитов на сайты поисковых систем: За год доля визитов на сайты социальных сетей увеличилась с 10% до 11,88%, , а доля [...]
Смотрите также:<ol>
<li><a href='http://chernyshov.kiev.ua/2009/12/vdvoe-bolshe-video-v-socialnyx-setyax/' rel='bookmark' title='Вдвое больше видео в социальных сетях'>Вдвое больше видео в социальных сетях</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/socialnye-seti-2008-2010/' rel='bookmark' title='Социальные сети 2008-2010'>Социальные сети 2008-2010</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/facebook-i-medijnaya-reklama/' rel='bookmark' title='Facebook и медийная реклама'>Facebook и медийная реклама</a></li>
</ol>]]></description>
			<content:encoded><![CDATA[<p>Сборная поисковиков против сборной социальных сетей. По количеству визитов, а не аудитории.</p>
<p>Согласно данным сервиса Experian Hitwise в мае 2010 впервые на рынке Великобритании количество визитов пользователей в социальные сети и сервисы превысило количество визитов на сайты поисковых систем:</p>
<p><img style="display: inline; margin-left: 0px; margin-right: 0px; border: 0px;" title="Динамика визитов британских пользователей на сайты социальных сетей и поисковых систем" src="http://notes.webartsolutions.com/wp-content/uploads/2010/06/UKsocialnetworksandsearchengines.jpg" border="0" alt="Динамика визитов британских пользователей на сайты социальных сетей и поисковых систем" width="507" height="408" /></p>
<p>За год доля визитов на сайты социальных сетей увеличилась с 10% до 11,88%, , а доля визитов на сайты поисковых систем уменьшилась с 12% до 11,33%.</p>
<p>При этом самым посещаемым сайтом в Британии остается Google. Facebook генерирует 55% “социального” трафика, что втрое больше трафика Youtube. А Twitter, самый быстрорастущий сервис два последних года, вышел на 3 место среди социальных сетей, оставив позади бывших лидеров – Myspace и Bebo.</p>
<p>Что касается рекламы, тот же Facebook в марте текущего года сгенерировал 21 млрд. рекламных показов только жителям Великобритании, что составило 30% всех рекламных показов в этом месяце.</p>
<p><a href="http://www.emarketer.com/blog/index.php/uk-social-network-traffic-overtakes-search-engine-visits/">via</a></p>
<p>Смотрите также:</p><ol>
<li><a href='http://chernyshov.kiev.ua/2009/12/vdvoe-bolshe-video-v-socialnyx-setyax/' rel='bookmark' title='Вдвое больше видео в социальных сетях'>Вдвое больше видео в социальных сетях</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/socialnye-seti-2008-2010/' rel='bookmark' title='Социальные сети 2008-2010'>Социальные сети 2008-2010</a></li>
<li><a href='http://chernyshov.kiev.ua/2010/05/facebook-i-medijnaya-reklama/' rel='bookmark' title='Facebook и медийная реклама'>Facebook и медийная реклама</a></li>
</ol>]]></content:encoded>
			<wfw:commentRss>http://chernyshov.kiev.ua/2010/06/poiskoviki-sdayut-pozicii-socialnym-setyam-v-uk/feed/</wfw:commentRss>
		<slash:comments>2</slash:comments>
		</item>
		<item>
		<title>reCaptcha и Google</title>
		<link>http://chernyshov.kiev.ua/2009/09/recaptcha-i-google/</link>
		<comments>http://chernyshov.kiev.ua/2009/09/recaptcha-i-google/#comments</comments>
		<pubDate>Sat, 19 Sep 2009 17:58:15 +0000</pubDate>
		<dc:creator>Cherny</dc:creator>
				<category><![CDATA[Новости]]></category>
		<category><![CDATA[Google]]></category>

		<guid isPermaLink="false">http://notes.webartsolutions.com/2009/09/recaptcha-i-google/</guid>
		<description><![CDATA[&#8220;И человека отфильтруем, и текст распознаем&#8221; 16-го сентября появилось сообщение о покупке Гуглем компании reCAPTCHA. Особенность сервиса купленной компании &#8211; комплексный подход. На изображении выводится два слова, с помощью первого слова отфильтровывается человек, затем отфильтрованный человек используется для помощи в распознавани отсканированного текста. Интересно, что в Google уже использовали &#8220;человеческую&#8221; помощь для обработки данных. В [...]]]></description>
			<content:encoded><![CDATA[<div><em>&#8220;И человека отфильтруем, и текст распознаем&#8221;<br />
</em></div>
<p>16-го сентября появилось <a href="http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html">сообщение</a> о покупке Гуглем компании <a href="http://recaptcha.net/">reCAPTCHA</a>. Особенность сервиса купленной компании &#8211; комплексный подход. На изображении выводится два слова, с помощью первого слова отфильтровывается человек, затем отфильтрованный человек используется для помощи в распознавани отсканированного текста.<br />
Интересно, что в Google уже использовали &#8220;человеческую&#8221; помощь для обработки данных. В одной  моей <a href="http://notes.webartsolutions.com/archives/000221.html">старой записи</a> три года назад я писал об игре <a href="http://images.google.com/imagelabeler/">Google Image Labeler</a>. Там игроки получают очки, называя объекты на изображениях, а Гугл в свою очередь мог связывать изображения с соответствующими им определениями. Вот только информация об использовании данных игры в поиске по изобрадениям мне не попадалась.</p>
]]></content:encoded>
			<wfw:commentRss>http://chernyshov.kiev.ua/2009/09/recaptcha-i-google/feed/</wfw:commentRss>
		<slash:comments>3</slash:comments>
		</item>
	</channel>
</rss>

