当前位置：移动技术网 > IT编程>开发语言>Java > 博客园备份小工具使用加代码说明（Java小程序）

博客园备份小工具使用加代码说明（Java小程序）

2019年01月19日 | 移动技术网IT编程 | 我要评论

前言

写了两年多的博客了，我想整理我的博客，问题是，得一个个打开，之后复制粘贴，嫌这样太麻烦，于是便找到了博客园的备份功能。

但是这个备份功能下载下来的只是一个xml文件，我想把每一篇博文都转为一个md文件，于是便有了这个java小工具。

工具下载

blogbackuptool

使用说明

从博客园上下载备份的xml文件将本项目下载，打开run.bat,输入前面下载的xml文件的地址，即会在xml文件的同目录生成一个博客园的文件夹，里面存放md文件和html文件

程序讲解

涉及知识

io流
xml解析

xml文件分析

从博客园下载的xml备份文件，格式大概是这样的

<channel>
    <title></title>
    <link></link>
    <description<</description>
    <language></language>
    <lastbuilddate></lastbuilddate>
    <pubdate></pubdate>
    <ttl></ttl>
    <item></item>
    <item></item>
    ...
</channel>

其中的item就是我们博客中每一篇博文

item结构

<item>
    <title></title>
    <link></link>
    <dc:creator></dc:creator>
    <author></author>
    <pubdate></pubdate>
    <guid></guid>
    <description></description>
<item>

item结点之下还有子结点
title是我们的博文标题

link则是我们博文对应的链接

description则是我们博客的内容

    nodelist itemlists = document.getelementsbytagname("item");//获得所有的item结点
    for (int i = 0; i < itemlists.getlength(); i++) {
        nodelist list = itemlists.item(i).getchildnodes();//获得item结点之下的全部结点，有7个，下标从0开始
        string title = list.item(0).gettextcontent();//第一个结点内容是标题
        string link = list.item(1).gettextcontent();//第二个结点内容是链接
        string description = list.item(6).gettextcontent();
        filewrite(title,link,description);
    }

ps：这里需要注意到是，description里面获取的内容我们查看的时候发现是下面这样的代码

这个cdata其实是个xml的标准标签，表明这里面的内容都是文本（上面的也就是测试和句号才是内容，解析的时候会忽略掉两个中括号）

区分md文件和html文件

如果是md文件，开头不可能出现<这个符号，如果是html文件，因为要使用到各种标签，p,h,div等标签，肯定开头是有<这个符号的

html文件转md文件

如果想不想要html文件，想要md文件的话，就得手动去整理格式，可以先使用在线的工具将html文件转为md格式，这个百度一下就有工具了，不过还得慢慢整理一下，格式转换过来不一定符合排版，我们得手动地去排个版。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

dom4j解析xml详解

dom4j解析xml在Java后台开发中有时候会碰到解析xml文件的节点、属性等需求，一般比较方便的方法是采用d... [阅读全文]
高德地图-微信小程序开发（根据关键字搜索信息）

getInputtips(Object)参考链接：高德地图微信小程序开发手册方法参数说明getInputtips... [阅读全文]
JAVA 实现WebSocket推送数据到数据大屏页面

上篇文章，说到做一个大数据可视化的数据大屏，这里我用了开源的项目去进行二次开发，然后进行数据对接就好，不知道的可... [阅读全文]
Web网页设计之HTML_1. 走进HTML

开讲啦，这个是我们的一个新的起征点啊，也是重要的一个点，不学这个，我们学的数据库，JDBC以及后端的JAVA就都... [阅读全文]
Algebra:Chapter 0 - 预备知识: 集合论和categories

预备知识: 集合论和categories不知道怎么翻译这个categories，等我知道了再改成中文吧！对于集合... [阅读全文]
springboot + vue上传图片在服务器并实现在线预览

后台需要配置一个upload工具类public class UploadUtils {//静态资源路径publi... [阅读全文]
tomcat部署Java web项目的几种方式

tomcat部署Java web项目的几种方式欢迎使用Markdown编辑器在服务器上部署项目,记录Tomcat... [阅读全文]
请谨慎使用增强for循环，刚接触Java值得一看（手动狗头）

今天在看我之前写的一些Demo时，发现在数组的模块里边出现了这样一个问题，挺有意思的，所以拿出来给大家分享一下。... [阅读全文]
js：swiper异形slide

css:.swiper-container { position: relative; width: 1... [阅读全文]
【Nginx】还不会使用Nginx解决跨域问题？肝这一篇就够了！！

当今互联网行业，大部分Web项目基本都是采用的前后端分离模式。前端为H5项目，后端为Java、PHP、Pytho... [阅读全文]

网友评论


验证码：