Модификация исходного кода HTTrack для преодоления ограничений (обход ошибки «Too many URLs»)
Привет, я бездарь.
Это то, что я делал вчера, но моя память туманна, поэтому я просто напишу это наобум.
Получение исходного кода с помощью git clone
git clone https://github.com/xroche/httrack.git
Здесь найдите строку «Too many URLs» в исходном коде
grep -r “Too many URLs” httrack/*
Появилось много результатов, но я нашел этот файл

Похоже, это описано в httrack/src/htslib.c.
Поэтому я не пробовал символы вроде *, но просто вставил число с почти бесконечным количеством цифр.
Похоже, есть и ограничение скорости, но было бы проблематично, если бы люди начали сохранять, игнорируя скорость, поэтому я просто прикреплю изображение-подсказку и не буду раскрывать подробности.

Сборка и установка
./configure --prefix=$HOME/usr && make -j8 && make install
Затем, если which httrack не указывает на каталог установки, переименуйте или удалите его, а затем создайте символическую ссылку на недавно установленную версию в месте, указанном which. В моем случае это выглядит так:
sudo ln -s $HOME/usr/bin/httrack /usr/bin/httrack
На этом модификация HTTrack завершена.
Похоже, это сообщение «Too many URLs» является пережитком старого программного обеспечения, созданного примерно в 2000 году. Если полностью удалить его из исходного кода, будет немного грустно, поэтому есть желание, чтобы оно осталось как есть.
На этом все.
До новых встреч.