
使用场景
将HackerNews网站内容转换为Markdown格式
将个人博客的HTML页面转换为Markdown以便在GitHub上发布
将在线文章的HTML格式转换为Markdown,用于文档编写和资料整理
产品特色
支持从HTML到Markdown的内容转换
模型训练于大量HTML和Markdown内容对
无需前缀指令,直接输入HTML即可生成Markdown
支持在Google Colab上快速体验和使用
提供本地部署和使用的详细指南
优化以在Google Colab的免费T4 GPU层级上顺畅运行
支持自定义输入URL,探索不同网页内容的转换效果
使用教程
在Google Colab上运行Jina AI提供的Colab笔记本,体验reader-lm模型
安装transformers库以在本地使用模型
通过AutoTokenizer和AutoModelForCausalLM加载模型
准备HTML内容并使用tokenizer处理
将处理后的输入文本传递给模型生成Markdown内容
打印或保存生成的Markdown内容