如何使用HTTRACK完整保存网站【我来帮你保存】

大家好，我是无能。

作为前言，我写下了我保存的原因，但对于那些无法进行网络爬取的人，我可以代劳，如果您能在这篇文章下评论，我将不胜感激。由于是审批制，如果您不想留下评论，可以在注明后通过电子邮件发送给我。※根据规模和规定，有时可能无法进行。

在一切都将消失的情况下，归档服务虽然很方便，但我认为其担忧点主要有以下两点。

归档服务的担忧点

-运营方终止服务造成的损失
-需要网络连接

关于第一点，最近的例子是The-Eye.eu实际上终止了服务，此外，随着AI的普及，我感觉正在形成一种趋势，即限制网络抓取本身以阻止自动学习。
另外，题外话，我强烈认为The-Eye.eu的运营方很可能与在2000年前后互联网黎明时期构建艺术网站的Eye 4 You的成员有关。

回到正题，关于第二点，鉴于互联网正逐渐走向一个不得不创造封闭空间的局面，我也觉得目前有必要在本地环境中保存数据。特别值得一提的是，虽然我不能在这里公布，但最近维基百科败诉并被迫修改内容，也表明互联网的自由度正在逐渐丧失。

我目前大概是20岁出头，可以说还很年轻，但让我们想想那些在2000年前后支持互联网黎明时期的人现在多大了。

从1980年代PC历史开始普及算起，如果当时的人20岁，那么到2000年就将近40岁。
而那些支持早期PC和互联网的人，现在已经接近60岁了。网站的维护就像房屋一样，需要人们活着去维护和使用才能得以保存。
然而，他们也是人，如果他们处于无法维护的状态，那也是无可奈何的事情。

不幸的是，这些信息由于是数字媒体，所以会逐渐消失。我们所学到的知识都是从过去中汲取的，我认为将宝贵的信息作为娱乐或了解过去的事物保留下来，也是对当时人们的一种敬意。

特别是最近，我们处于所谓的加速社会，流媒体服务成为主流，我感觉信息被稀释了，因此我开始保存以文本为主的网站。
至于视频，我对其数据的持久性和可用性感到疑问，因此我认为如果信息重要，保存那些以文本形式总结的网站会更有效率。

那么，这次介绍是基于GNU/Linux的使用。

由于我的环境使用Devuan，因此我使用apt进行包管理。

apt install httrack

安装完成了吗？

那么，接下来只需输入这个。

httrack "要保存的网站URL" -O "保存目录" "+*.gif" "+*.jpg" "+*.png"

-O : 指定保存目录

最稳定地保存下来的方法就是上面这种。

HTTrack还有其他几种方便的保存方法，所以我今后还需要继续学习。
HTTrack官方网站

那么。
下次再见。