config.ini 1.9 KB

12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849
  1. [config]
  2. # 要启用的浏览器driver, 因为有些人PhantomJS或者Chrome配置可能有问题,默认使用Firefox(容易配置).
  3. # 具体参考selenium的浏览器环境配置
  4. browser_driver = Chrome
  5. # chromedriver的路径
  6. executable_path= /usr/local/bin/chromedriver
  7. # 百度用户名
  8. user_name = 百度账号
  9. # 百度密码
  10. password = 百度密码
  11. # 百度登陆链接
  12. login_url = https://passport.baidu.com/v2/?login
  13. # 一周
  14. one_week_trend_url = http://index.baidu.com/?tpl=trend&type=0&area={area}&time=12&word={word}
  15. # 区间
  16. time_range_trend_url = http://index.baidu.com/?tpl=trend&type=0&area={area}&time={start_date}|{end_date}&word={word}
  17. # api
  18. all_index_url = http://index.baidu.com/Interface/Search/getAllIndex/?res={res}&res2={res2}&startdate={start_date}&enddate={end_date}
  19. # 图片信息的api
  20. index_show_url = http://index.baidu.com/Interface/IndexShow/show/?res={res}&res2={res2}&classType=1&res3[]={enc_index}&className=view-value&{t}
  21. # 判断登陆状态的地址
  22. user_center_url = http://i.baidu.com/
  23. # 判断登陆的标记
  24. login_sign = http://passport.baidu.com/?logout
  25. # 浏览器页面加载后的停留时间, 遇到PPval值得不到的情况,可以试试加大此参数,多等待一会儿浏览器加载
  26. browser_sleep = 0.1
  27. # 线程数
  28. num_of_threads = 40
  29. # 关键词index的区间开始, 不配置区间则按当前可以获取的最大区间来提取
  30. start_date = 2016-11-01
  31. # 关键词index的区间结束
  32. end_date = 2016-12-03
  33. # 输出的文件夹路径
  34. out_file_path = ./data/out
  35. # 保存cookie的文件名
  36. cookie_file_path = ./data/cookie.txt
  37. # 关键词任务的文件路径,可以自定义
  38. keywords_task_file_path = ./task.txt
  39. # 要获取趋势的类别,默认是三种趋势都获取。all代表整体趋势,pc代表PC趋势, wise代表移动趋势
  40. index_type_list = all,pc,wise
  41. # 关键词地区, 具体城市code参见city.py, 此例为采集全国和北京
  42. area_list = 0,514