offline

Save Webpages

Information here is stale and needs to be updated!

Services

Wallabag

Selfhosted Pocket-like service

Raindrop.io

Bookmark Service - saves full page copy (in most cases)

Archive.is

Speichert ganze Website, hat aber keine API/Interface um eigene Artikel abzurufen (same with Archive.org)

API: http://mementoweb.org/depot/native/archiveis/

Workflow

Speichere Kopien von Webseiten lokal (oder cloud)

Bookmark eine Seite via Pocket und speichere diese via IFTTT als Markdown, PDF und ePub in Dropbox

Da Markdown im Moment am sichersten ist, könnte eine Konvertierung automatisch mit Pandoc, lokal ablaufen. Besser wäre aber ein Cloud-Service.

Eventuell kann die Readability API helfen, den Content besser darzustellen.

Was ist das? http://brettterpstra.com/projects/nvalt/

Best Case:

Browserbookmark triggert das speichern in Pocket und archive.is (muss url irgendwo speichern) dann wird aus der Seite eine Markdown, EPub und PDF Version erzeugt und auf Google Drive und in Dropbox gespeichert (was immer besser ist). Das Ganze benötigt natürlich ein Interface, um die gespeicherten Artikel katalogisieren, durchsuchbar zu machen etc.

Die ganze Arbeit lohnt evt. nicht und man bezahlt einfach Pocket ;-).

Google Drive

Pro

Con

Dropbox

Pro

Con

PDF

Pro

Con

Markdown

Service

https://codebeautify.org/html-to-markdown API

preview = 1 = html  

Pro

Con

EPub

Service

DotEPUB stellt eine API und Bookmarklets bereit. Kann mit IFTTT und Dropbox verwendet werden. (Leider nicht so richtig)

Pro

Con

HTML

SingleFile - Chrome Web Store

Artikel

Zusammenfassung

Nicht einfach lösbar!

Webpage zu PDF Konverter kosten meistens Geld oder können nicht per GET angesprochen werden.

Die Readability API liefert JSON und keine Website on the fly.

Archive.is hat ebenfalls keine GET Api (anderenfalls würde vermutlich das Web dort gespiegelt werden)

Die Konvertierung in Markdown als Backup ist derzeit die einzige Möglichkeit die Artikel als reinen Text zu bekommen. Ob die Bilder bei späterer Ansicht noch verfügbar sind, steht auf einem anderen Blatt.

Am besten wäre es wenn Seiten als PDF über Chrome/Cloud gedruckt werden können.

#archive
Marcus Obst
Güterweg 89b
09474 Crottendorf
Germany

+49 37344 133407
info@marcus-obst.de