保存网页的三种方式

1 学习笔记:保存网页的三种方式

1.1 浏览器打印功能保存为PDF

1.1.1 优势:

  • 简单易用: 浏览器的打印功能直观易懂,适合一般用户。
  • 轻量级: 生成的PDF文件相对较小,方便存储和分享。

1.1.2 劣势:

  • 丢失交互性: 打印成PDF的网页可能会失去一些动态和交互性,如JavaScript效果。
  • 排版可能有差异: PDF中的排版有时可能与原网页有微小差异。

1.1.3 使用步骤:

  1. 打开需要保存的网页。
  2. 点击右上角的三个点,选择“打印”或使用快捷键 Ctrl + P(Windows/Linux)或 Command + P(Mac)。
  3. 在打印预览页面中,选择目标打印机为“另存为 PDF”。
  4. 调整其他打印设置,如布局、纸张大小等。
  5. 点击“保存”按钮,选择保存位置和文件名。
  6. 最后,点击“保存”按钮,保存为PDF格式的文件。

1.2 SingleFile 插件保存网页

1.2.1 优势:

  • 保留网页完整性: SingleFile 插件可以保存网页的完整性,包括样式、图片等。
  • 单文件保存: 生成的文件是一个单一的HTML文件,方便传输和存储。

1.2.2 劣势:

  • 可能不适用于所有网页: 对于一些使用复杂JavaScript或大量动态加载内容的网页,保存可能不够完美。

1.2.3 使用步骤:

  1. 安装 SingleFile 插件(适用于Chrome浏览器)。
  2. SingleFile GitHub 仓库
  3. 打开需要保存的网页。
  4. 点击 SingleFile 插件图标,它将开始处理当前页面并准备保存。
  5. 插件将打开一个新的标签页,显示网页的归档版本。
  6. 你可以右键点击页面并选择 “保存页面” 进行保存。

1.3 Webrecorder 插件保存网页

1.3.1 优势:

  • 全面保存: Webrecorder 插件能够完整保存网页,包括动态内容和AJAX请求。
  • 高度交互性: 可以在保存的网页上进行互动,查看以前的状态。

1.3.2 劣势:

  • 相对复杂: 对于普通用户来说,可能相对复杂,不如前两种方式直观易用。
  • 存储较大: 保存的网页可能包含大量资源,占用存储空间较大。
  • 非独立文件:保存的文件存于浏览器中。

1.3.3 使用步骤:

  1. 安装 Webrecorder 插件
  2. Webrecorder GitHub 仓库
  3. 打开需要保存的网页。
  4. 点击 Webrecorder 插件图标,它将开始处理当前页面并准备保存。
  5. 插件将打开一个新的标签页,显示网页的归档版本。
  6. 你可以在这个标签页中进行互动,查看保存的网页状态。

1.4 补充说明:

  • 安全性考虑: 在保存网页时,需要注意其中可能包含的敏感信息,特别是在分享时。

  • 适用场景不同: 不同方式适用于不同场景,根据具体需求选择。

  • 支持的浏览器: 确保选择的方式适用于使用的浏览器。

  • 更新和维护: 使用插件时要留意其更新频率,确保使用最新版本以获得最佳性能和兼容性。