
使用場景
將HackerNews網站內容轉換為Markdown格式
將個人博客的HTML頁面轉換為Markdown以便在GitHub上發佈
將在線文章的HTML格式轉換為Markdown,用於文檔編寫和資料整理
產品特色
支持從HTML到Markdown的內容轉換
模型訓練於大量HTML和Markdown內容對
無需前綴指令,直接輸入HTML即可生成Markdown
支持在Google Colab上快速體驗和使用
提供本地部署和使用的詳細指南
優化以在Google Colab的免費T4 GPU層級上順暢運行
支持自定義輸入URL,探索不同網頁內容的轉換效果
使用教程
在Google Colab上運行Jina AI提供的Colab筆記本,體驗reader-lm模型
安裝transformers庫以在本地使用模型
通過AutoTokenizer和AutoModelForCausalLM加載模型
準備HTML內容並使用tokenizer處理
將處理後的輸入文本傳遞給模型生成Markdown內容
打印或保存生成的Markdown內容