私信我或关注微信号:狮范儿,回复:学习,获取免费学习资源包。
生活当中免不了要下载百度文库,但是百度很恶心的是要下载券,收费呀啥的(这次的这个不能下载收费文档哦),所以我就在微信的搜索功能(非常强大)上搜怎么样免费下载百度文库,加了一些群,其中一个群就是有一个有专门的机器人,只要你往群里发链接,机器人自动回复你下载链接
首先我在csdn上查阅相关资料群机器人的文章,明白Python关于群机器人有两大类,QQ群用qqbot库(基于smartqq),微信群用itchat库(基于微信网页版)。但是腾讯已经把smartQQ关了(也就是不能通过qqbot来制作QQ群机器人),只能建一个微信群机器人
我的制作思路:
1、通过itchat登录微信,实时监听所要建的群消息,假如有人发文库链接,将链接提取出来(比较简单)
2、将所提取到的文库连接保存,然后请求下载网站,网站返回下载链接(这个还得要自己去抓包,去慢慢分析,我也是花了一整天才把他整个下载流程弄懂,很麻烦,今天我们重点讲这个,你们可以拿其他网站试试,亲测这个链接很长,我用到了百度的短连接,为了本帖不冗长,省去不讲)
3、将网站返回的链接发送给相应的群,并@相应的人(比较简单)
二
准备
这个网站链接是:http://139.224.236.108/1.html(免费给他打了一波广告把,这个网站是收费的,下载的文档也是源文档,买账号也就几块钱,但是每个账号每天会限制下载次数,但是你可以多买几个账号,当一个被限制了之后,遍历其他账号,这样就OK了,其实下载文档这个不是经常下,但是有需求的时候没有下载券就麻烦了,为了兄弟们更好的复现,我把我买的账号分享给大家)
三
详细
在百度文库上随便获取一个要下载券的文档链接,
点击下载之后又是一波抓包,发送了请求post和nocode
跳转到如下界面:
再点击这个下载,又发送了一个请求具体见下面的down(),我就不再过多讲了
机器人代码:
import requests
firsturl=input('请输入文档链接:')
# 以下用到了两个链接,一个是查询文档ID的,另一个是下载的
url1 = "http://139.224.236.108/post.php"
url3 = "http://139.224.236.108/downdoc.php"
# 将传入的文档链接进行转化
downloadurl = firsturl.replace("/", "%2F").replace(":", "%3A")
# head1查询文档ID的数据头
# data1是查询的数据内容,其中将docinfo的值转化为链接
# 查询得到结果,截取id的那一段并返回
def query():
head1 = {"POST": "/post.php HTTP/1.1",
"Host": "139.224.236.108",
"Content-Length": "145",
"Accept": "*/*",
"Origin": "http://139.224.236.108",
"X-Requested-With": "XMLHttpRequest",
"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",
"Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
"Referer": "http://139.224.236.108/1.html",
"Accept-Encoding": "gzip, deflate",
"Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
"Cookie": "usrname=901961495; usrpwd=559448"
}
data1 = 'usrname=901961495&usrpass=559448&docinfo=downloadurl&taskid=up_down_doc1'
data1 = data1.replace('downloadurl', downloadurl)
respons = requests.post(url1, data=data1, headers=head1).json()
id = respons['url']
id = id[37:]
return id
id = query()
# head3下载文档的数据头
# data3是请求下载的数据内容,其中vid是查询内容返回的文档id值
# 获取下载链接
def down():
Referer = "http://139.224.236.108/nocode.php?id={docid}"
head3 = {"POST": "/downdoc.php HTTP/1.1",
"Host": "139.224.236.108",
"Content-Length": "54",
"Accept": "*/*",
"Origin": "http://139.224.236.108",
"X-Requested-With": "XMLHttpRequest",
"User-Agent": "Mozilla/5.0 (Windows NT 6.3; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.169 Safari/537.36",
"Content-Type": "application/x-www-form-urlencoded; charset=UTF-8",
"Referer": Referer.format(docid=id),
"Accept-Encoding": "gzip, deflate",
"Accept-Language": "zh-CN,zh;q=0.9,en;q=0.8",
"Cookie": "usrname=901961495; usrpwd=559448"
}
data3 = 'vid={docid}&taskid=directDown'
data3 = data3.format(docid=id)
response = requests.post(url3, data=data3, headers=head3).json()
downurl = response["dlink"].replace("\\", '')
print(downurl)#点击这个URL,会自动下载文件哦
return downurl
query()
down()
上面可以实现一个独立的下载,但是如果我们要和微信联系起来,制作微信机器人,那么,我们可以把上面的query(),down(),弄成一个函数,传入一个链接,经过这个函数处理,返回下载地址,到时候直接调用这个函数即可
接下来就是登陆微信,监控对应的群,放在服务器上,你就可以打造出24小时下载的机器人了。
实现代码:
@itchat.msg_register([itchat.content.TEXT], isGroupChat=True) # 注册一个群消息的处理
def print_content(msg):
if msg.User["NickName"] == qun:# 这里可以在后面加更多的or msg.User["NickName"]=='你希望自动回复群的名字
if str(msg['Text'][0:5])=="https":#检测所发的消息是不是链接,是通过前5个
huifubdwk= GET_SHORTURL(str(msg['Text']))#这个GET_SHORTURL是我上面所说的那个函数,我自己定义的
print(msg.User['NickName'] + ":" + msg['Text'] ) # 打印哪个群给你发了什么消息
print("%s+\n"%huifubdwk) # 打印机器人回复的消息
itchat.send(u'@%s\u2005 %s' % (msg['ActualNickName'],huifubdwk), msg['FromUserName'])
else:# 不是链接直接忽略
print(msg['Text'])
else:#不是相应群直接忽略
pass
好了,今天到这就结束了
来源网络,侵权联系删除
私信我或关注微信号:狮范儿,回复:学习,获取免费学习资源包。
声明:我要去上班所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者所有,原文出处。若您的权利被侵害,请联系删除。
本文标题:(python中文库)(python 库文档)
本文链接:https://www.51qsb.cn/article/5084.html