在這個 AI 時代,Markdown 因其可用性而受到極大重視。這種標記語言對人類和機器都很容易理解。此外,這種格式幫助 LLM 比 HTML 和 DOCX 更好地理解文檔結構。因此,在本指南中,我們將實現如何在 Python 中程序化地將 HTML 轉換為 Markdown。我們將使用 Aspose.HTML for Python via .NET,因為它在 Python 項目中設置簡單。這個 Python 軟件開發工具包提供企業級功能,以自動化網頁轉換和操作。那麼,讓我們開始吧。
HTML 到 MD - SDK 安裝
這一切都很簡單。只需在終端中運行以下命令來安裝 Aspose.HTML for Python via .NET:
pip install aspose-html-net
不想使用終端/CMD 選項?我們已經為您準備好了。您可以從這個 鏈接 下載 SDK。
在 Python 中將 HTML 轉換為 Markdown - 代碼示例
本節顯示如何程序化地將網頁轉換為 Markdown。 步驟:
- 導入必要的模塊。
- 使用源 HTML 文檔初始化 HTMLDocument 類的對象。
- 實例化 MarkdownSaveOptions 類的實例。
- 調用 convert_html 方法將 HTML 轉換為 MD。
以下代碼示例自動化了您項目中的轉換。使用 Aspose.HTML for Python via .NET 將 HTML 轉換為 Markdown 是如此簡單。
s
輸出:
獲取免費許可證
獲得一個 免費臨時許可證 以超越評估限制來嘗試這個 Python SDK。
提問
有問題嗎?這個 論壇 將回答您所有的問題。
結論
到目前為止,我們已經實現了基本功能。不過,您可以透過導航至 開發者指南 部分來探索進階選項。這裡有幾個類和方法來處理多種場景。現在,您已經學會了如何使用這個強大的 SDK 將 HTML 轉換為 Markdown。此外,您可以跳轉到 API 參考 來豐富您的 HTML 到 MD 轉換工具,提供更多選項。
此外,Aspose.HTML 也支持一個免費的 在線工具 用於 HTML 到 MD 的轉換。