Page 1 of 1

управляет некоторыми индексами с помощью

Posted: Thu Jul 10, 2025 6:27 am
by rakibhasan
как поисковые системы обходят эту проблему? Они могли бы сделать так, чтобы их индексы поддерживали случайные вставки, но это сделало бы их более сложными и менее эффективными. Другой вариант — использовать два индекса. Таким образом, один индекс будет небольшим и быстро обновляемым, а другой — большим и медленно обновляемым. Маленький индекс будет пытаться найти разницу между просканированным и большим индексом. Во время запроса им придется проверять оба. Конечно, у них может быть больше размеров индексов, чем два, но это не влияет на основной смысл: у Google, по-видимому, их больше одного.

Google может удалить страницу из малого индекса Специальный проводник только после того, как она появится в большом индексе, но тогда она будет находиться в обоих индексах какое-то время, пока малый индекс не будет перестроен. Это перекрытие означает, что малый индекс больше, чем необходимо, поэтому он не может быть перестроен максимально быстро и, следовательно, не будет максимально свежим. Возможно, они пытаются идеально рассчитать время, чтобы не было ни перекрытия, ни пробелов. Проблема в том, что по мере ускорения сканирования, роста индексов, усложнения индексации или предоставления стажёру возможности проверить свой летний проект, легко образуется небольшой пробел. Так что, возможно, просто сложно гарантировать, что пробелов никогда не будет, если только не тратить ресурсы на перекрытие.

Чэс (разработчик, сидящий рядом со мной) модели «большой+маленький», которая, к слову, никогда не допускает пробелов. И он вносит свой вклад в то, что его большой индекс начинает перестраиваться в полночь пятницы, поскольку нагрузка на выходные меньше. Однако его компьютеры настроены на GMT, а это значит, что перестройка начинается в пятницу в 17:00 по тихоокеанскому времени. Ну, было чуть позже 17:00 пятницы, когда Джейн впервые заметила, что Linkscape исчез из результатов поиска Google (я получил её письмо в 17:28). У Google меньше ограничений на процессор, чем у Часа, но есть ограничения по пропускной способности, которые необходимы для распространения новых индексов на множество компьютеров.