Save Webpages

Information here is stale and needs to be updated!

Services

Wallabag

Selfhosted Pocket-like service

Raindrop.io

Bookmark Service - saves full page copy (in most cases)

Pocket

Pocket ist erste Wahl, weil es die ganze Website speichert und offline auf den Geräten zur Verfügung stellt.

Nachteil: free Version speichert keine archivierten Artikel.

Archive.is

Speichert ganze Website, hat aber keine API/Interface um eigene Artikel abzurufen (same with Archive.org)

API: http://mementoweb.org/depot/native/archiveis/

Workflow

Speichere Kopien von Webseiten lokal (oder cloud)

Bookmark eine Seite via Pocket und speichere diese via IFTTT als Markdown, PDF und ePub in Dropbox

Da Markdown im Moment am sichersten ist, könnte eine Konvertierung automatisch mit Pandoc, lokal ablaufen. Besser wäre aber ein Cloud-Service.

Eventuell kann die Readability API helfen, den Content besser darzustellen.

Was ist das? http://brettterpstra.com/projects/nvalt/

Best Case:

Browserbookmark triggert das speichern in Pocket und archive.is (muss url irgendwo speichern) dann wird aus der Seite eine Markdown, EPub und PDF Version erzeugt und auf Google Drive und in Dropbox gespeichert (was immer besser ist). Das Ganze benötigt natürlich ein Interface, um die gespeicherten Artikel katalogisieren, durchsuchbar zu machen etc.

Die ganze Arbeit lohnt evt. nicht und man bezahlt einfach Pocket ;-).

Google Drive

Pro

  • Drucke Webseiten aus Chrome zu Drive (inkl. Seitenvereinfachung)
  • Sehr gut durchsuchbar

Con

  • Interface?
  • Apps?
  • Google?

Dropbox

Pro

  • Läuft einfach
  • Einbindung ins Dateisystem etc.

Con

  • Inhalte nicht durchsuchbar (Nur Business-Accounts)

PDF

Pro

  • gekapseltes Format mit Bildern
  • kann überall gelesen werden
  • durchsuchbar (index)

Con

  • keine freie API, müsste programmiert werden (wkHTMLtoPDF)
  • PDF Reader auf dem Phone können das Layout nicht anpassen

Markdown

Service

https://codebeautify.org/html-to-markdown API

preview = 1 = html  

Pro

  • Textformat, überall lesbar
  • Kann in diverse Formate exportiert werden (in epub, pdf, html via Pandoc)

Con

  • Nicht so leicht lesbar als nur Text
  • Braucht Nachbearbeitung (Pandoc)
  • Verlinkt Bilder, aber wenn diese offline sind hat man Pech

EPub

Service

DotEPUB stellt eine API und Bookmarklets bereit. Kann mit IFTTT und Dropbox verwendet werden. (Leider nicht so richtig)

Pro

  • Reader auf allen Plattformen
  • Layout anpassbar
  • Klein

Con

  • Nicht durchsuchbar

HTML

SingleFile - Chrome Web Store

  • Portable Snapshot
  • Not optimized for reading

Artikel

Zusammenfassung

Nicht einfach lösbar!

Webpage zu PDF Konverter kosten meistens Geld oder können nicht per GET angesprochen werden.

Die Readability API liefert JSON und keine Website on the fly.

Archive.is hat ebenfalls keine GET Api (anderenfalls würde vermutlich das Web dort gespiegelt werden)

Die Konvertierung in Markdown als Backup ist derzeit die einzige Möglichkeit die Artikel als reinen Text zu bekommen. Ob die Bilder bei späterer Ansicht noch verfügbar sind, steht auf einem anderen Blatt.

Am besten wäre es wenn Seiten als PDF über Chrome/Cloud gedruckt werden können.