[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Probleme mit WebHTTrack



Am Dienstag, 11. September 2012 schrieb Jan Kappler:
> Hallo Leute,

Hi Jan,

> ich möchte gern Webseiten lokal speichern, vornehmlich geht es um
> Inhalte von tagesschau.de. Das Problem ist, nach einiger Zeit werden
> Inhalte und insbesondere Kommentare entfernt, weshalb mir das spätere
> Aufrufen über z.B. Liferea nichts nutzt.
> Etwas Recherche brachte mich zu HTTrack und der Web-Oberfläche
> WebHTTrack, da es für Linux keine native Oberfläche gibt (was mich nicht
> stört). Damit habe ich aber einige Probleme.

Eine Idee könnte noch Scrapbook sein? Das funktioniert an sich Out of
the box.

> Erste Frage: Unter System/Einstellungen/Bevorzugte Anwendungen ist
> Iceweasel als Browser eingestellt. Einige Anwendungen, z.B. der BOINC
> Manager oder eben WebHTTrack, öffnen aber Epiphany, der ebenfalls
> installiert ist. Wieso wird die Gnome-Einstellung ignoriert?
> 
> Ich habe mich an die Alternativen erinnert und nachgeschaut: Es gibt
> gnome-www-browser und x-www-browser. gnome-www-browser scheint mit der
> Einstellung unter Gnome aber nichts gemein zu haben.
> Nachdem ich beide auf Iceweasel gesetzt habe, wird der auch benutzt. Ein
> Blick in das webhttrack-Skript (von dem ich sonst nur Bahnhof verstehe)
> zeigte mir eine Stelle mit x-www-browser. Worin liegt der Unterschied?

Hmmm, weiß nicht. Ich nehme an, dass gnome-www-browser nur GNOME/GTK-
basierte Browser in der Auswahl hat.

Ob das irgendein Programm aber verwendet? Vielleicht ist das nur für den
Benutzer selbst gedacht, wenn er halt ein GNOME-basierten Webbrowser
haben möchte.

> Laut Dokumentation soll es eine /etc/httrack.conf geben, bei mir aber
> nicht. Eine Logdatei wird unter /var/log nicht angelegt. Ein Start aus
> einem X-Terminal zeigt keine merkwürdigen Fehlermeldungen.
> Ich denke mal, irgendwie wird die falsche URL an den Browser übergeben.
> Leider sind meine Skript-Kenntnisse äußerst marginal :-(

Hast Du Dich schonmal unter /usr/share/doc/httrack informiert? Zum
Beispiel, ob es da ein README.Debian gibt, dass die Schritte erklärt,
da etwas komplizierter Teil zum Laufen zu bringen.

> Eine weitere unschöne Sache ergibt die Deinstallation. Nach Purge (ich
> nutze Synaptic) bleiben die Menü-Einträge erhalten! Auch nach
> Logout/Login ändert sich das nicht. Das sollte eigentlich nicht sein...

Da würde ich mit reportbug einen Fehlerbericht schreiben.

> Erneute Installation: Versuchtes Laden von http://enterprise:8080 und
> Abbruch wegen zu langer Antwortzeit von http://www.enterprise.com:8080/
> Gebe ich manuell die vollständige lokale Domain ein, funktioniert es,
> also bei http://enterprise.jklocal.de:8080/ , was mit server/index.html
> ergänzt wird. Das dürfte natürlich nur klappen, wenn ich das Skript
> bereits gestartet habe.

Okay, hier nochmal die URL-Geschichte.

Wie sieht Deine /etc/hosts aus? Ist da enterprise auch ohne FQDN mit drin?
Und wenn ja, an welcher Stelle.

Ansonsten sieht die ausgeschriebene URL wie eine Domain im Internet aus.
Meine lokalen Domains haben keine TLD hinten dran. Ich glaube aber nicht,
dass dies hier ein Problem ist. Iceweasel sucht halt im Internet, wenn
er die URL lokal nicht auflösen kann.

Ich habe hier:

martin@merkaba:~> cat /etc/hosts
127.0.0.1       localhost
127.0.1.1       merkaba.lichtvoll       merkaba

was ich auch mal ändern könnte in:

127.0.0.1      merkaba.lichtvoll merkaba localhost

weiß gar nicht mehr, warum ich da zwei IP-Adressen für verwendet hab.

-- 
Martin 'Helios' Steigerwald - http://www.Lichtvoll.de
GPG: 03B0 0D6C 0040 0710 4AFA  B82F 991B EAAC A599 84C7


Reply to: