|
实际上就是一个python的curl应用。应tom的要求,现在公布给大家。希望能对大家有用。
http://onefishum.blog.163.com/bl ... 052013324114213898/
目前高端的工作是越来越难找了。本人做了51、zhaopin、猎聘网的刷简历程序,都和此类似,但目前这几个号称最大的招聘网站,根据我一段时间的跟踪分析,发现从去年开始,人员需求基本为0,大部招聘都是假的。所以开发才想做一个刷新简历更新时间程序,以便加大自身机会(工作不换工资不涨,为了活呀,只能发挥技术优势了)。如果大家有好的机会,也可以帮我推荐一下喔。(96年开始c/c++,98年开始linux,99年开始php。游戏、网站、应用、设计通吃) 这个是我研究curl时写的一个python的脚本习做。最开始是用的shell脚本。为了提高一点点效率,现在改成了python的。这个希望对大家起一个抛砖引玉的作用。猎聘相对比较容易,适合大家练练手。其它网站除了zhaopin的图形验证码比较麻烦外。应该都是比较容易的。
#!/usr/bin/python#-*- coding:utf-8 -*-
import os
import sys
import pycurl
import hashlib
import urllib
import StringIO
import string
reload(sys)
sys.setdefaultencoding('utf8')
_DEBUG=False
def posturl(url,postdata):
global _DEBUG
curl = pycurl.Curl()
html=StringIO.StringIO()
# curl -b cookie写入
curl.setopt(pycurl.COOKIEFILE, 'cookie')
# curl -c cookie读入
curl.setopt(pycurl.COOKIEJAR, 'cookie')
# curl -d 使用post模式
curl.setopt(pycurl.POST,True)
curl.setopt(pycurl.POSTFIELDS, postdata)
#curl.setopt(pycurl.POSTFIELDS, urllib.urlencode(postdata))
# 设置url
curl.setopt(pycurl.URL,url)
# ssl认证
#curl.setopt(pycurl.SSL_VERIFYHOST, False)
#curl.setopt(pycurl.SSL_VERIFYPEER,False)
# 设置agent
#curl.setopt(pycurl.USERAGENT,r"User-Agent: Dalvik/1.4.0 (Linux; U; Android 2.3.7; Milestone Build/SHOLS_U2_05.26.3)")
curl.setopt(pycurl.WRITEFUNCTION, html.write)
curl.setopt(pycurl.FOLLOWLOCATION, 1)
if _DEBUG :
# 连接服务器信息
curl.setopt(pycurl.VERBOSE, True)
htmlcode=str(curl.getinfo(pycurl.HTTP_CODE))
print r'返回码:'+ htmlcode
print 'URL:',curl.getinfo(pycurl.EFFECTIVE_URL)
curl.perform()
return html.getvalue().encode('utf8')
#def posturl(url,postdata):
if __name__ == "__main__":
username='你的用户名'
passwd='你的密码'
login=posturl(r'http://www.lietou.com/user/ajaxlogin/?isMd5=1','user_login='+username+'&user_pwd='+str(hashlib.md5(passwd).hexdigest()))
print login
login=posturl(r'http://c.lietou.com/resume/refreshresume/','res_id=123456')
print login
注:
res_id应该是你的简历id,这块我偷懒了。没有用程序自己去抓和分析。大家可以用foxfire的firebug或httpfox抓一下。对于每个人来讲这个值是死的。真没有必要耗cpu。
原文作者:user88
原文链接:http://forum.cubietech.com/forum ... &extra=page%3D1
|
|