如何使用HTTRACK完整保存网站【我来帮你保存】

大家好,我是无能。
作为前言,我写下了我保存的原因,但对于那些无法进行网络爬取的人,我可以代劳,如果您能在这篇文章下评论,我将不胜感激。由于是审批制,如果您不想留下评论,可以在注明后通过电子邮件发送给我。※根据规模和规定,有时可能无法进行。
在一切都将消失的情况下,归档服务虽然很方便,但我认为其担忧点主要有以下两点。
归档服务的担忧点
-运营方终止服务造成的损失
-需要网络连接
关于第一点,最近的例子是The-Eye.eu实际上终止了服务,此外,随着AI的普及,我感觉正在形成一种趋势,即限制网络抓取本身以阻止自动学习。
另外,题外话,我强烈认为The-Eye.eu的运营方很可能与在2000年前后互联网黎明时期构建艺术网站的Eye 4 You的成员有关。
回到正题,关于第二点,鉴于互联网正逐渐走向一个不得不创造封闭空间的局面,我也觉得目前有必要在本地环境中保存数据。特别值得一提的是,虽然我不能在这里公布,但最近维基百科败诉并被迫修改内容,也表明互联网的自由度正在逐渐丧失。
目前保存网站的理由
我目前大概是20岁出头,可以说还很年轻,但让我们想想那些在2000年前后支持互联网黎明时期的人现在多大了。
从1980年代PC历史开始普及算起,如果当时的人20岁,那么到2000年就将近40岁。
而那些支持早期PC和互联网的人,现在已经接近60岁了。网站的维护就像房屋一样,需要人们活着去维护和使用才能得以保存。
然而,他们也是人,如果他们处于无法维护的状态,那也是无可奈何的事情。
不幸的是,这些信息由于是数字媒体,所以会逐渐消失。我们所学到的知识都是从过去中汲取的,我认为将宝贵的信息作为娱乐或了解过去的事物保留下来,也是对当时人们的一种敬意。
特别是最近,我们处于所谓的加速社会,流媒体服务成为主流,我感觉信息被稀释了,因此我开始保存以文本为主的网站。
至于视频,我对其数据的持久性和可用性感到疑问,因此我认为如果信息重要,保存那些以文本形式总结的网站会更有效率。
HTTRACK的使用方法
那么,这次介绍是基于GNU/Linux的使用。
由于我的环境使用Devuan,因此我使用apt进行包管理。
apt install httrack
安装完成了吗?
那么,接下来只需输入这个。
httrack "要保存的网站URL" -O "保存目录" "+*.gif" "+*.jpg" "+*.png"
-O : 指定保存目录
最稳定地保存下来的方法就是上面这种。
HTTrack还有其他几种方便的保存方法,所以我今后还需要继续学习。
HTTrack官方网站
那么。
下次再见。