Mike's Blog
  • 首页
  • 归档
  • 分类
  • 标签
  • 关于

读者网作者发布次数统计爬虫

第一种:根据规律手工构造各个期刊的url 爬取两遍,第一遍爬完,去重(集合),并初始化结果集;第二遍爬取,在结果集里查询并计数 将结果集转化为列表,并按照列表中times关键字对字典(相当于数据集合)整体排序 写入结果到txt文件 123456789101112131415161718192021222324252627282930313233343536373839404142434445464
2019-04-05
python爬虫
#编程

git—pages+hexo搭建个人博客网站

新建仓库新建github仓库(必须以 用户名.github.io 命名) 绑定域名(非必须)域名购买可以在腾讯云或阿里云买个域名 域名解析主机记录 记录类型选 CNAME 填上自己git-pages页面的域名 git-pages仓库的设置 本地准备工作下载git工具 git官网 克隆(用户名.github.io)到本地 1$ git clone [仓库的链接] 下载Node.js(一路ne
2019-03-15
技术实践
#开发
1…131415

搜索

Hexo Fluid