Aspose.HTML Product Family

在 C# 中创建、读取和编辑 HTML 文件

作为 C# 开发人员，您可以轻松创建基于 HTML 的文档、加载现有文档并阅读其内容。您还可以在 .NET 应用程序中修改 HTML 文件的内容。在本文中，您将学习如何使用 C# 创建、读取和编辑 HTML 文件。

在 C# 中将网页另存为 PDF

网页可以包含文本、图像、绘图、动画等。有时您可能需要将网页转换为 PDF 以用于存档或其他几个目的。因此，本文介绍了如何通过指定网页的 URL 在 C# 中将网页保存或打印为 PDF 格式。它讨论了简单和基本的转换以及可以加密输出文件的高级转换。

从 C# 中的 URL 下载图像

视觉有助于更清晰、更快速、更轻松地理解事物。因此，出于多种原因，图像通常在网络上使用。有时您可能需要从不同的网页下载图像。因此，本文介绍了如何在 C# 中从 URL 下载图像。它还包含一些下载资源，以便您可以使用即插即用的项目简单地测试图像下载。

在 C# 中创建 Web Scraper

Web Scraping，也称为网络爬虫、网络收获或数据抓取，用于从网站中提取数据。网络爬虫使用不同的数据选择器，如 CSS 选择器、XPath 或两者兼而有之，以便从网页中提取数据。这两种选择器对于收集和分析来自网络的信息都很有效。本文介绍如何使用 C# 创建 Web 抓取工具，特别是有关 HTML 导航、XPath 查询和 CSS 选择器的信息。

在 Java 中将 XHTML 转换为 PDF

XHTML 是一种基于文本的文件格式，带有 XML 格式的标记。这种格式被广泛使用，因为它是通用的并且涉及较少的脚本。而 PDF 文件是固定布局格式的文件，由于与平台无关，因此被广泛使用。在某些情况下，您可能需要将 XHTML 文件转换为 PDF 格式。根据这样的用例，本文演示了如何在 Java 中将 XHTML 转换为 PDF 格式。

在 Java 中将网页另存为 PDF

网页用于显示网站上的各种信息。在某些情况下，您可能需要在 Java 中将网页另存为 PDF。针对这样的场景，本文介绍了如何在 Java 中将网页另存为 PDF。

在 C# 中将 EPUB 转换为 PNG 或 JPG 图像

EPUB 文件通常用于大规模打印目的。在某些情况下，您可能需要以图像的形式预览 EPUB 文件的内容。根据这些用例，本文解释了如何在 C# 中以编程方式将 EPUB 文件转换为 PNG 或 JPG。

在 Java 中创建 Web Scraper

Web Scraping 也称为数据抓取、网络收集或网络爬虫，用于从网页中提取数据。网络爬虫可以使用不同的方法来提取信息。例如，XPath、CSS 选择器、自定义过滤器、HTML 导航等。根据这些场景，本文将介绍如何使用 Java 以编程方式创建 Web 抓取工具。

在 C# 中将 HTML 转换为 MHT 文件

在某些情况下，您可能需要将 HTML 文件转换为 MHT 格式。根据这样的要求，本文讨论了如何在 C# 中以编程方式将 HTML 转换为 MHT 格式。

在 C# 中将 MHT 或 MHTML 转换为 Word DOCX 文件

在某些情况下，您可能需要将 MHT 或 MHTML 文件转换为 Word 文档。因此，本文介绍了如何在 C# 中以编程方式将 MHT 或 MHTML 文件转换为 DOCX 格式的 Word 文档。