В записи в блоге объясняется, что предыдущая версия индекса состояла из нескольких слоев, которые обновлялись с различной периодичностью. Так, основной слой обновлялся в среднем раз в две недели. Новый индекс будет анализировать интернет-сайты на постоянной основе небольшими фрагментами.
Отмечается, что общий объем базы данных Caffeine превышает 100 миллионов гигабайт (100 петабайт). При этом каждый день в индекс добавляется несколько сотен тысяч гигабайт новых данных.
Тестирование новой системы с участием пользователей началось в августе 2009 года и продолжалось до ноября.