怎样借助Python爬虫给宝宝起个好名字

2019-03-31更新: 代码的python3简化版本: https://github.com/peiss/chinese-name-score/tree/master/chinese-name-score/python3 代码的视频讲解(我的付费视频课程中的一节): https://www.iqiyi.com/v_19rsj1yvy8.html 每个人一生中都会遇到一件事情,在事情出现之前不会 … 继续阅读怎样借助Python爬虫给宝宝起个好名字

Firefox数据采集插件大全

本文介绍了使用firefox进行数据采集的一些小窍门、一些数据采集建议和一些优秀的用于数据采集的firefox插件。 实时操作浏览器DOM的一些注意事项 firefox的插件能够实时的对展现出来的网页进行DOM操作和查看,请注意通过firefox的firebug还有chrome的”查看元素”功能查看到的都不是页面最初的源码,而是经过浏览器的一些修改后的结果,比如浏览器会对收 … 继续阅读Firefox数据采集插件大全

数据采集简单示例:采集爱帮网电话号码

爱帮网单个网址:http://www.aibang.com/detail/17881112-420243957 截图: 本文采集该页面的标题和2个电话号码,具体的python代码:

  运行结果: 标题: 坊上人清真饭庄(高新店) 电话号: 029-88222668 029-88226458 其中主要用到了以下模块: xp … 继续阅读数据采集简单示例:采集爱帮网电话号码

数据采集必备知识-php计划任务的实现

站点如果做的多了,难免要发些伪原创的文章,文章的来源必然来源于网络采集,对于采集这里不详述,我自己用的是”Simple HTML DOM”,见我另一篇关于他的介绍: 数据采集利器-PHP用DOM方式处理HTML之《Simple HTML DOM》 数据采集的话,当然可以人工触发,就是每天运行一下脚本,可是这显然不是很完美,如果抓取可以自动定时获取,那么人工运行可执行页面也就 … 继续阅读数据采集必备知识-php计划任务的实现