This website works better with JavaScript
首页
发现
帮助
注册
登录
david
/
gooseeker
镜像自地址
https://github.com/FullerHua/gooseeker.git
关注
1
点赞
0
派生
0
文件
工单管理
0
Wiki
目录树:
14715d9b3d
分支列表
标签列表
gh-pages
master
patch-1
simoleSpider
gooseeker
/
crawler
gz51837844
d3c7084cf7
上传douban.py, 修改之前的小bug
8 年之前
..
simpleSpider
d3c7084cf7
上传douban.py, 修改之前的小bug
8 年之前
tmSpider
d3c7084cf7
上传douban.py, 修改之前的小bug
8 年之前
README
d3c7084cf7
上传douban.py, 修改之前的小bug
8 年之前
anjuke.py
9b34e43858
添加实战代码anjuke.py
8 年之前
crawl_gooseeker_bbs.py
3c5c9b7e21
update class name from gsExtractor to GsExtractor
8 年之前
douban.py
d3c7084cf7
上传douban.py, 修改之前的小bug
8 年之前
result1.xml
9b34e43858
添加实战代码anjuke.py
8 年之前
result2.xml
9b34e43858
添加实战代码anjuke.py
8 年之前
xslt_bbs.xml
f14549c2c8
Upload craw_gooseeker_bbs.py , xslt_bbs.xml
8 年之前
README
# Created at 15:10, May 18,2016
# Updated at 15:20, Jul 6,2016
目录文件说明
================
crawler
- anjuke.py 采集安居客房产经纪人
- result1.xml 安居客房产经纪人结果文件1
- result2.xml 安居客房产经纪人结果文件2
- crawl_gooseeker_bbs.py 采集集搜客论坛内容
- xslt_bbs.xml 集搜客论坛内容提取本地xslt文件
- douban.py 采集豆瓣小组讨论话题
- simpleSpider 一个小爬虫(基于Scrapy开源框架)
- tmSpider 采集天猫商品信息(基于Scrapy开源框架)