`
javayestome
  • 浏览: 1010665 次
  • 性别: Icon_minigender_2
  • 来自: 北京
文章分类
社区版块
存档分类
最新评论

备份blog程序

阅读更多
前些年头的blog被和谐后,一直觉得备份博客文章到本地还是相当有必要的。最近看python,此语言给人一种powerful 的感觉。于是兴头之下便来了几句。此代码只是针对csdn博客。方法有点呆板。其实最好是有1个可变的可迭代集合来存放url,python里有人写了优先队列,这是以后要改进的,现在先放一个朴素版本。另外一个用rss来获取url的,但是rss只是收录了更新的博客,老的没有,不知道什么原因,在这就不贴了。

  1. importurllib2,sys,re,os
  2. defsavefile(filename,content,method='wb'):
  3. op=open(filename,method)
  4. op.write(content)
  5. op.close()
  6. return1
  7. defSaveUrl(url):
  8. globalurls
  9. urls[url]=1
  10. c=urllib2.urlopen(url)
  11. content=c.read()
  12. iflen(url.split('/'))>5:
  13. dirs=("%s/backup/%s/%s"%('.',url.split('/')[-4],url.split('/')[-3]))
  14. ifnotos.path.exists(dirs):
  15. os.makedirs(dirs)
  16. savefile("%s/%s"%(dirs,url.split('/')[-1].replace('aspx','html')),content)
  17. print'saveurl',url
  18. urlres=re.compile("http:\/\/blog.csdn.net\/lwj1396\/archive\/[^\">\s\']+aspx")
  19. needtoaddurls=urlres.findall(content)
  20. foriteminneedtoaddurls:
  21. ifitemnotinurls.keys():
  22. urls.setdefault(item,0)
  23. print'add',url
  24. defBackup():
  25. globalurls
  26. i=10000
  27. whilei>0:
  28. forurlinurls:
  29. ifurls[url]==0:
  30. SaveUrl(url)
  31. break
  32. i=i-1
  33. if__name__=='__main__':
  34. urls={}
  35. urls.setdefault(r'http://blog.csdn.net/lwj1396',0)
  36. Backup()



分享到:
评论

相关推荐

    博客备份程序

    博客备份 备份博客 新浪博客 网易博客 QQ空间 百度空间

    很好很好blog备份程序

    blog备份程序。免费程序。blog备份程序。免费程序。blog备份程序。免费程序。blog备份程序。免费程序。blog备份程序。免费程序。

    系统右键自定义备份程序

    系统右键自定义备份程序系统右键自定义备份程序系统右键自定义备份程序系统右键自定义备份程序.具体原理和功能,请看博客http://www.cnblogs.com/simoncai/p/4264432.html

    Symantec Ghost Boot 是一个可靠的备份应用程序,允许您创建和恢复整个磁盘、分区或单个目录的备份映像

    Symantec Ghost Boot CD 2021是一个可靠的备份应用程序,允许您创建和恢复整个磁盘、分区或单个目录的备份映像。 这是一个强大的应用程序,它允许您创建一个完整的系统备份,以恢复您的计算机在硬盘驱动器故障或重大...

    程序备份

    NULL 博文链接:https://xiaotao-2010.iteye.com/blog/980186

    dotnet-TumblThree是一个免费的开源Tumblr博客备份应用程序

    TumblThree是TumblTwo的代码重写,TumblTwo是一个免费的开源Tumblr博客备份应用程序,使用C#和WPF以及MVVM模式开发。 它从给定的tumblr博客下载照片,视频,音频和文本帖子。

    基于 Node.js 的新浪博客备份程序.zip

    基于 Node.js 的新浪博客备份程序.zip

    大师兄博客园博客备份博客下载器 V1.0

    可下载您在博客园的所有博客文章。 可离线阅读、 增量备份、 可下载博客文章中的图片到本地。 东莞大师兄软件工作室出品

    TumblThree:Tumblr备份应用程序

    TumblThree-Tumblr博客备份应用程序 TumblThree是TumblTwo的代码重写, 是一个免费的开源Tumblr博客备份应用程序,使用带有WPF的C#和MVVM模式。 它使用 。 它从给定的tumblr博客下载照片,视频,音频和文本帖子。 ...

    SinaBackup:备份新浪博客中的私人帖子

    新浪私密博文备份本程序用于备份新浪博客的私密博文。运行环境本程序需要 Java 1.7 环境和 HtmlUnit 库。已知问题本程序使用 java.io.Console 类的 readPassword() 方法读入密码,有可能无法在 Eclipse 下直接编译...

    php版mysql大数据库备份和恢复工具

    如果是UTF8编码的数据,如我的博客(http://www.zhouliang.name)采用WordPress程序,默认使用UTF8编码,则只能在MySQL 4.1/MySQL 5以上的数据库中导入导出,因为低版本的MySQL不支持UTF8. 6.以上说明仅针对本程序而言,在...

    windows下的增量备份文件工具

    该程序就是一个小巧的增量备份文件工具,它只会备份你修改过的,或没有备份过的文件。对于已经备份过的,且没有更新过的文件则不会去备份,这样就避免了很多不必要的时间浪费。 该工具使用纯Python编写,小巧而且...

    通用SQL备份恢复工具

    软件名称:通用Sql备份恢复工具 执行程序:iNethink_SqlTool.exe 程序版本:V1.0.0.0 Md5值:E5117643E64EE0708FC3ABED4A2BE30C Sha1值:86377C5E7F60B8921B16ED6CBB3C...在线交流:http://blog.csdn.net/inethink

    TumblThree:Tumblr博客备份应用程序

    TumblThree-Tumblr博客备份应用程序 为了促进TumblThrees在更大社区中的发展,TumblThree正在搬到github组织的新家。 有关新版本,问题以及与社区/开发人员聊天的信息,请查看其新家: TumblThree是TumblTwo的...

    csdnBlogSpider:博客备份实用程序

    我们可以使用它来增加csdn id的访问时间,这也是一个博客备份实用程序。 python版本的Blogspider是单线程的,但很简单。 可以与C版本进行比较。 构建csdnBlogSpider 可以在ubuntu 3.11.3上编译和使用...

    2015rococup nimyrio开发程序备份

    2015年robocup分赛基于中矿SDK修改的参赛程序。程序具体细节已记不清,在个人工作记录博客中应邀上传,请允许我骗个分哈。内部包括调过不同参数的多个备份,以及nimyrio的一些开发文档。

    java程序调用bat文件,执行oracel数据库备份

    NULL 博文链接:https://weishaoxiang.iteye.com/blog/1237809

    定时备份文件jar

    此程序用于定时备份文件 1.自动生成日期时间命名的子文件夹,可选 2.可过滤复制文件夹下同名目录或文件。目录被过滤则目录下都不复制。 3.可选择来源文件夹,目标文件夹,使用配置文件配置 customConfig.property...

    SMARTGOON 博客程序 v1.0 beta.zip

    smartgoon是一个开源的博客程序。程序使用流行的PHP+MYSQL架构而成,在保证运行效率的同时安全性和易用性也得到了保障。后台的数据库分析和数据备份功能可以保证数据的运行安全;自定义导航和快速创建分类功能也在...

    smartgoon博客程序 1.0.zip

    smartgoon是一个开源的博客程序。程序使用流行的PHP+MYSQL架构而成,在保证运行效率的同时安全性和易用性也得到了保障。后台的数据库分析和数据备份功能可以保证数据的运行安全;自定义导航和快速创建分类功能也在...

Global site tag (gtag.js) - Google Analytics