Как полностью сохранить сайт с помощью HTTRACK 【Помогу с сохранением】

6 min

language: ja bn en es hi pt ru zh-cn zh-tw

httrack.png

Здравствуйте, я бездарь.

В качестве предварительного шага я пишу о причинах, по которым я сохраняю данные, и поскольку я буду делать это от имени тех, кто не может выполнять веб-краулинг, буду признателен, если вы оставите комментарий к этой статье. Поскольку это система одобрения, те, кто не хочет оставлять комментарии, могут отправить их по электронной почте после уточнения. ※В некоторых случаях это может быть невозможно из-за масштаба или ограничений.

В условиях, когда все исчезает, архивные сервисы удобны, но, думаю, есть два основных опасения.

Опасения по поводу архивных сервисов

-Потери из-за прекращения работы сервиса оператором
-Необходимость подключения к интернету

Что касается первого пункта, то недавно The-Eye.eu фактически прекратил свою работу, и, похоже, существует тенденция к регулированию самого веб-скрейпинга, чтобы предотвратить автоматическое обучение из-за распространения ИИ.
Кстати, я думаю, что существует высокая вероятность того, что операторы The-Eye.eu связаны с членами Eye 4 You, которые создавали художественные сайты в начале 2000-х годов, на заре интернета.

Возвращаясь к теме, что касается второго пункта, я также чувствую необходимость хранить данные в локальной среде на данном этапе, учитывая, что интернет постепенно движется к ситуации, когда он вынужден создавать закрытые пространства. Что особенно ощущается, хотя я не могу здесь об этом говорить, это то, что недавний проигрыш Википедии в суде и принуждение к изменениям также постепенно лишает интернет его свободы.

Причины сохранения веб-сайтов на данном этапе

Возможно, мне сейчас чуть за 20, что можно назвать молодым возрастом, но давайте подумаем, сколько лет тем, кто поддерживал интернет на заре его развития, примерно в 2000-х годах.

Начиная с 1980-х годов, когда история ПК начала широко распространяться, если бы тогда человеку было 20 лет, то к 2000 году ему было бы около 40.
И те, кто поддерживал ранние ПК и интернет, сейчас приближаются к 60 годам. Поддержание веб-сайтов, как и домов, обеспечивается людьми, которые живут, обслуживают и используют их.
Однако, поскольку эти люди тоже люди, то, что они оказываются в ситуации, когда не могут выполнять обслуживание, неизбежно.

К сожалению, эта информация, будучи цифровой, просто исчезнет. То, что мы узнали, мы узнали из прошлого, и я считаю, что сохранение ценной информации для развлечения или для того, чтобы узнать о прошлом, также является данью уважения тем, кто жил в то время.

В частности, поскольку в последнее время мы живем в так называемом ускоренном обществе, потоковые сервисы стали доминировать, и я чувствую разбавление информации, поэтому я пришел к сохранению веб-сайтов, ориентированных на текстовый стиль.
Что касается видео, я сомневаюсь в их долговечности и доступности как данных, поэтому я посчитал более эффективным сохранять сайты, которые суммируют важную информацию в текстовом виде.

Как использовать HTTRACK

Итак, на этот раз это введение, предполагающее использование GNU/Linux.

Поскольку в моей среде используется Devuan, я буду использовать apt для управления пакетами.

apt install httrack

Установка завершена?

Тогда просто введите это.

httrack "URL сайта, который вы хотите сохранить" -O "каталог назначения" "+*.gif" "+*.jpg" "+*.png" 

-O : Указывает каталог назначения

Наиболее стабильным способом сохранения был вышеуказанный.

HTTrack — это удобный инструмент, который предлагает несколько других методов сохранения, поэтому мне еще многое предстоит изучить.
Официальный сайт HTTrack


На этом все.
До новых встреч.

Related Posts