"Яндекс" написал инструкцию по защите личных данных от поисковиков
"Прежде всего личную информацию посетителей сайта необходимо защитить, например закрыть паролем", - объясняют специалисты "Яндекса". "Вторая важная вещь: необходимо запретить поисковым роботам индексировать страницы сайтов с информацией, которая не должна стать публичной", - отмечается в сообщении компании.
Специалисты отметили, что для запрета поисковым роботам индексировать страницы сайтов с непубличной информацией необходимо настроить файл robots.txt. "В этом файле веб-мастер может указать параметры индексирования своего сайта как для всех роботов сразу, так и для каждой поисковой системы в отдельности", - заявили в "Яндексе", добавив, что проверить, какие страницы сайта проиндексированы "Яндексом", можно при помощи сервиса "Яндекс.Веб-мастер".
Эксперты подчеркнули, что перед тем как проиндексировать страницу сайта, робот обязательно проверяет файл robots.txt. "И если владелец сайта не желает, чтобы новая страница индексировалась поисковой системой, он может попросить поискового робота этого не делать", - пояснили в компании. "Только если поисковый робот убедился, что robots.txt не запрещает индексирование странички, он будет ее индексировать. Это единственный путь, по которому содержимое страницы попадает в поисковую систему. Другого способа нет", - заверили в "Яндексе".
Напомним, недавно разразился скандал в связи с рядом утечек личных данных пользователей Сети. Сначала в "Яндексе" и частично в других поисковиках проиндексировались страницы с текстами SMS-сообщений, отправленных через сайт "МегаФона" на мобильные номера, затем через запрос в "Яндексе" или в Google стали доступны личные данные покупателей интернет-магазинов, в том числе секс-шопов. Представители крупнейшего поисковика в России заверили, что причиной утечки стала неправильная настройка файла robots.txt, который позволил роботу проиндексировать страницу.