Закачка сайтов
March 11, 2008 2:06 pm Без категорииКрай как нужно было закачать сайт для offline-просмотра. Вспомнилось, что в firefox’e такую возможность имел scrapbook. Ан нет! Адресок “http://www.drawanime.ru/?pg=art&id=01″ он переваривать отказался.
Начал искать offline-браузеры под линукс, нашёл лишь httrack и проприетарный webcopier. httrack мою ссылку также переваривать отказался, а webcopier отказался запускаться вообще.
И всё! больше ни-че-го. Неужели, думаю, никто под линуксом сайты не выкачивает? Где же софт?
И явился софт. Он, оказывается, всегда был. Видимо, выкачивать сайты с помощью консольного wget для линуксоидов настолько естественно, что про это уже даже и не обсуждается.
Закачать выбранный адрес вместе со ссылками можно с помощью команды:
wget -H -r --level=1 -k -p http://zelgadis.profusehost.net/blog/
где:
- -H разрешает переходить по ссылкам на другие хосты
- –level=1 указывает глубину вложенности ссылок, которые следует закачивать
- -p требует загрузки страниц вместе со связанным содержимым (картинки, стили)
- -k переписывает ссылки на локальные
Для своей ссылки я использовал команду:
wget -r --level=2 -k -p --restrict-file-names=windows --limit-rate=3k "http://www.drawanime.ru/?pg=art&id=01"
где:
- –restrict-file-names=windows заменяет специалььные символы в именах фалов (такие как “?”) чтобы в случае чего не возникало проблем с копированием на FAT32/NTFS.
- –limit-rate=3k ограничивает скорость закачки до 3KB/s чтробы не занимать весь канал.
Адрес заключён в кавычки, чтобы экранировать символ “&” в коммандной строке.
Айе! wget использую уже сам не замечая этого
April 23rd, 2008 at 18:43
спасипки – а где ентот птичий язык для wget-а поподробнее?
April 23rd, 2008 at 19:46
man wget
Вот только wiki-документацию с сайта http://www.linuxgraphics.ru я не смог заставить его выкачать с картинками… Зато с этим справился Firefox’овский scrapbook (тот который http://www.drawanime.ru не переварил).
Комментировать
