Интересно Веб-архивы Интернета: как искать удалённую информацию и восстанавливать сайты. Часть 2

Takeshi

Перо Дьявола
Команда форума
PR-group
CPA & Трафик
Регистрация
23 Янв 2019
Сообщения
1,351
Баллы
0
Общие продажи
0$
Общие покупки
0$
Обратите внимание, пользователь заблокирован на форуме. Не рекомендуется проводить сделки.
Если вы хотите восстановить удалённый сайт, то вам поможет программа

Please Login or Register to view hidden text.

.

Программа загрузит последнюю версию каждого файла, присутствующего в Архиве Интернета Wayback Machine, и сохранить его в папку вида ./websites/example.com/. Она также пересоздаст структуру директорий и автоматически создаст страницы index.html чтобы скаченный сайт без каких либо изменений можно было бы поместить на веб-сервер Apache или Nginx.

Об установке программы и дополнительных опциях смотрите на странице

Please Login or Register to view hidden text.



Пример скачивания полной копии сайта suip.biz из веб-архива:

wayback_machine_downloader

Please Login or Register to view hidden text.




Структура скачанных файлов:


Локальная копия сайта, обратите внимание на провайдера Интернет услуг:


Как скачать все изменения страницы из веб-архива
Если вас интересует не весь сайт, а определённая страница, но при этом вам нужно проследить все изменения на ней, то в этом случае используйте программу

Please Login or Register to view hidden text.

.

К примеру для скачивания всех копий главной страницы сайта suip.biz, начиная с даты (--to-date 2017), эти страницы должны быть помещены в папку (-d /home/mial/test), при этом программа должна следовать HTTP редиректам (--follow-redirects):

waybackpack suip.biz -d ./suip.biz-copy --to-date 2017 --follow-redirects


Структура директорий:


Чтобы для указанного сайта (hackware.ru) вывести список всех доступных копий в веб-архиве (--list):

waybackpack hackware.ru --list

Как узнать все страницы сайта, которые сохранены в веб-архиве
Для получения ссылок, которые хранятся в Архиве Интернета, используйте программу

Please Login or Register to view hidden text.

.

Эта программа извлекает все URL указанного домена, о которых знает Wayback Machine. Это можно использовать для быстрого составления карты сайта.

Чтобы получить список всех страниц о которых знает Wayback Machine для домена suip.biz:

echo suip.biz | waybackurls

Заключение
Предыдущие три программы рассмотрены совсем кратко. Дополнительную информацию об их установке и об имеющихся опциях вы сможете найти по ссылкам на карточки этих программ.

Ещё парочка программ, которые работают с архивом интернета: