返回顶部
首页 > 资讯 > 后端开发 > Python >如何用Python模拟163登陆获取邮件列表
  • 341
分享到

如何用Python模拟163登陆获取邮件列表

2023-06-17 10:06:13 341人浏览 八月长安

Python 官方文档:入门教程 => 点击学习

摘要

利用cookielib和urllib2模块模拟登陆163的例子有很多,近期看了《python模拟登陆163邮箱并获取通讯录》一文,受到启发,试着对收件箱、发件箱等进行了分析,并列出了所有邮件列表及状态,包括发件人、收件人、主题、发信时间、已

利用cookielib和urllib2模块模拟登陆163的例子有很多,近期看了《python模拟登陆163邮箱并获取通讯录》一文,受到启发,试着对收件箱、发件箱等进行了分析,并列出了所有邮件列表及状态,包括发件人、收件人、主题、发信时间、已读未读等状态。

1、参考代码

#-*- coding:UTF-8 -*-  import urllib,urllib2,cookielib  import xml.etree.ElementTree as etree #xml解析类   class Login163:     #伪装browser      header = {'User-Agent':'Mozilla/5.0 (windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}      username = ''     passwd = ''     cookie = None #cookie对象      cookiefile = './cookies.dat' #cookie临时存放地      user = ''           def __init__(self,username,passwd):          self.username = username          self.passwd = passwd          #cookie设置          self.cookie = cookielib.LWPCookiejar() #自定义cookie存放          opener = urllib2.build_opener(urllib2.HttpCookieProcessor(self.cookie))          urllib2.install_opener(opener)      #登陆          def login(self):                  #请求参数设置          postdata = {              'username':self.username,              'passWord':self.passwd,              'type':1             }          postdata = urllib.urlencode(postdata)           #发起请求          req = urllib2.Request(                  url='http://reg.163.com/logins.jsp?type=1&product=mail163&url=http://entry.mail.163.com/coremail/fcg/ntesdoor2?lightweight%3D1%26verifycookie%3D1%26language%3D-1%26style%3D1',                  data= postdata,#请求数据                  headers = self.header #请求头              )           result = urllib2.urlopen(req).read()          result = str(result)          self.user = self.username.split('@')[0]           self.cookie.save(self.cookiefile)#保存cookie                    if '登录成功,正在跳转...' in result:              #print("%s 你已成功登陆163邮箱。---------\n" %(user))              flag = True         else:              flag = '%s 登陆163邮箱失败。'%(self.user)                       return flag      #获取通讯录      def address_list(self):           #获取认证sid          auth = urllib2.Request(                  url='http://entry.mail.163.com/coremail/fcg/ntesdoor2?username='+self.user+'&lightweight=1&verifycookie=1&language=-1&style=1',                  headers = self.header              )          auth = urllib2.urlopen(auth).read()          for i,sid in enumerate(self.cookie):#enumerate()用于同时返数字索引与数值,实际上是一个元组:((0,test[0]),(1,test[1]).......)这有点像PHP里的foreach 语句的作用              sid = str(sid)              if 'sid' in sid:                  sid = sid.split()[1].split('=')[1]                  break         self.cookie.save(self.cookiefile)                    #请求地址          url = 'http://tWEBmail.mail.163.com/js4/s?sid='+sid+'&func=global:sequential&showAd=false&userType=browser&uid='+self.username          #参数设定(var 变量是必需要的,不然就只能看到:<code>S_OK</code><messages/>这类信息)          #这里参数也是在firebug下查看的。          postdata = {              'func':'global:sequential',              'showAd':'false',              'sid':sid,              'uid':self.username,              'userType':'browser',              'var':'<?xml version="1.0"?><object><array name="items"><object><string name="func">pab:searchContacts</string><object name="var"><array name="order"><object><string name="field">FN</string><boolean name="desc">false</boolean><boolean name="ignoreCase">true</boolean></object></array></object></object><object><string name="func">pab:getAllGroups</string></object></array></object>'             }          postdata = urllib.urlencode(postdata)                    #组装请求          req = urllib2.Request(              url = url,              data = postdata,              headers = self.header              )          res = urllib2.urlopen(req).read()                    #解析XML,转换成JSON          #说明:由于这样请求后163给出的是xml格式的数据,          #为了返回的数据能方便使用最好是转为JSON          json = []          tree = etree.fromstring(res)          obj = None         for child in tree:              if child.tag == 'array':                  obj = child                              break         #这里多参考一下,etree元素的方法属性等,包括attrib,text,tag,getchildren()等          obj = obj[0].getchildren().pop()          for child in obj:              for x in child:                  attr = x.attrib                  if attr['name']== 'EMAIL;PREF':                      value = {'email':x.text}                      json.append(value)          return json            #Demo  print("Requesting......\n\n")  login = Login163('xxxx@163.com','xxxxx')  flag = login.login()  if type(flag) is bool:      print("Successful landing,Resolved contacts......\n\n")      res = login.address_list()      for x in res:          print(x['email'])  else:      print(flag)

分析收件箱、发件箱等网址

在参考代码中,获取通讯录的url为

url = 'http://twebmail.mail.163.com/js4/s?sid='+sid+'&func=global:sequential&showAd=false&userType=browser&uid='+self.username,通过对邮箱地址的分析,发现收件箱、发件箱等的url为url = 'http://twebmail.mail.163.com/js4/s?sid='+sid+'&func=mbox:listMessages&showAd=false&userType=browser&uid='+self.username,其中func=mbox:listMessages。其对收件箱、发件箱的具体区分在下面的postdata中,具体为:

(1)收件箱

postdata = {  'func':'global:sequential',  'showAd':'false',  'sid':'qACVwiwOfuumHPdcYqOOUTAjEXNbBeAr',  'uid':self.username,  'userType':'browser',  'var':'<!--?xml version="1.0"?--><object><int name="fid">1</int><string name="order">date</string><boolean name="desc">true</boolean><boolean name="topFirst">false</boolean><int name="start">0</int><int name="limit">20</int></object>' }

(2)发件箱

postdata = {  'func':'global:sequential',  'showAd':'false',  'sid':'qACVwiwOfuumHPdcYqOOUTAjEXNbBeAr',  'uid':self.username,  'userType':'browser',  'var':'<!--?xml version="1.0"?--><object><int name="fid">3</int><string name="order">date</string><boolean name="desc">true</boolean><boolean name="topFirst">false</boolean><int name="start">0</int><int name="limit">20</int></object>' }

可以看出,两段代码的不同之处就是fid的取值不同,其中收件箱为1,发件箱为3,草稿箱为2。

3、xml解析

利用ElementTree 类来进行xml到字典的转换。在获取通讯录的实例中,主要使用了这一方法。本例子(具体代码见后文)在收取邮件列表时,并没有用这一方法,仍然使用的是字符串的处理方法。但这里还是列一下ElementTree 类对xml的处理。如(参考地址:http://hi.baidu.com/fc_lamp/blog/item/8ed2d53ada4586f714cecb3d.html):

-<result>     <code>S_OK</code>   -<array name="var">    -<object>       <string name="code">S_OK</string>      -<array name="var">       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       +<object></object>       </array>     </object>    +<object></object>    </array>   </result>

解决方法:

#-*- coding:UTF-8 -*-   import xml.etree.ElementTree as etree #xml解析类  def xml2json(xml):      json = []      tree = etree.fromstring(xml) #如果是文件可用parse(source)      obj = None     for child in tree:          if child.tag == 'array':              obj = child                          break     #这里多参考一下,etree元素的方法属性等,包括attrib,text,tag,getchildren()等      obj = obj[0].getchildren().pop()      for child in obj:          for x in child:              attr = x.attrib              if attr['name']== 'EMAIL;PREF':                  value = {'email':x.text}                  json.append(value)      return json

4、收件箱邮件列表

本例子只列出了收件箱邮件列表,如果需要,可根据以上介绍调整fid值,列出发件箱、草稿箱等的邮件列表。程序在windosxp、py2.6环境下调查通过,运行后,会在当前目录下生成三个文件:inboxlistfile.txt记录收件箱邮件列表,addfile.txt记录通讯录,cookies.dat记录cookies。具体代码如下:

#-*- coding:UTF-8 -*-  import urllib,urllib2,cookielib  import xml.etree.ElementTree as etree #xml解析类   class Login163:     #伪装browser      header = {'User-Agent':'Mozilla/5.0 (Windows; U; Windows NT 6.1; en-US; rv:1.9.1.6) Gecko/20091201 Firefox/3.5.6'}      username = ''     passwd = ''     cookie = None #cookie对象      cookiefile = './cookies.dat' #cookie临时存放地      user = ''           def __init__(self,username,passwd):          self.username = username          self.passwd = passwd          #cookie设置          self.cookie = cookielib.LWPCookieJar() #自定义cookie存放          opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(self.cookie))          urllib2.install_opener(opener)      #登陆          def login(self):                  #请求参数设置          postdata = {              'username':self.username,              'password':self.passwd,              'type':1             }          postdata = urllib.urlencode(postdata)           #发起请求          req = urllib2.Request(                  url='http://reg.163.com/logins.jsp?type=1&product=mail163&url=http://entry.mail.163.com/coremail/fcg/ntesdoor2?lightweight%3D1%26verifycookie%3D1%26language%3D-1%26style%3D1',                  data= postdata,#请求数据                  headers = self.header #请求头              )           result = urllib2.urlopen(req).read()          result = str(result)          #print result          self.user = self.username.split('@')[0]           self.cookie.save(self.cookiefile)#保存cookie                    if '登录成功,正在跳转...' in result:              #print("%s 你已成功登陆163邮箱。---------n" %(user))              flag = True         else:              flag = '%s 登陆163邮箱失败。'%(self.user)                       return flag      #获取通讯录      def address_list(self):           #获取认证sid          auth = urllib2.Request(                  url='http://entry.mail.163.com/coremail/fcg/ntesdoor2?username='+self.user+'&lightweight=1&verifycookie=1&language=-1&style=1',                  headers = self.header              )          auth = urllib2.urlopen(auth).read()           #authstr=str(auth)          #print authstr                    for i,sid in enumerate(self.cookie):              sid = str(sid)              #print 'sid:%s' %sid              if 'sid' in sid:                  sid = sid.split()[1].split('=')[1]                  break         self.cookie.save(self.cookiefile)                    #请求地址          url = 'http://twebmail.mail.163.com/js4/s?sid='+sid+'&func=global:sequential&showAd=false&userType=browser&uid='+self.username          #参数设定(var 变量是必需要的,不然就只能看到:<code>S_OK</code><messages>这类信息)          #这里参数也是在firebug下查看的。          postdata = {              'func':'global:sequential',              'showAd':'false',              'sid':'qACVwiwOfuumHPdcYqOOUTAjEXNbBeAr',              'uid':self.username,              'userType':'browser',              'var':'<!--?xml version="1.0"?--><object><array name="items"><object><string name="func">pab:searchContacts</string><object name="var"><array name="order"><object><string name="field">FN</string><boolean name="desc">false</boolean><boolean name="ignoreCase">true</boolean></object></array></object></object><object><string name="func">pab:getAllGroups</string></object></array></object>'             }          postdata = urllib.urlencode(postdata)                    #组装请求          req = urllib2.Request(              url = url,              data = postdata,              headers = self.header              )          res = urllib2.urlopen(req).read()           #print str(res)                    #解析XML,转换成json          #说明:由于这样请求后163给出的是xml格式的数据,          #为了返回的数据能方便使用最好是转为JSON          json = []          tree = etree.fromstring(res)                               obj = None         for child in tree:              if child.tag == 'array':                  obj = child                              break         #这里多参考一下,etree元素的方法属性等,包括attrib,text,tag,getchildren()等          obj = obj[0].getchildren().pop()          for child in obj:              for x in child:                  attr = x.attrib                  if attr['name']== 'EMAIL;PREF':                      value = {'email':x.text}                      json.append(value)          return json  #获取收件箱      def minbox(self):          #获取认证sid          auth = urllib2.Request(                  url='http://entry.mail.163.com/coremail/fcg/ntesdoor2?username='+self.user+'&lightweight=1&verifycookie=1&language=-1&style=1',                  headers = self.header              )          auth = urllib2.urlopen(auth).read()           #authstr=str(auth)          #print authstr                    for i,sid in enumerate(self.cookie):              sid = str(sid)              #print 'sid:%s' %sid              if 'sid' in sid:                  sid = sid.split()[1].split('=')[1]                  break         self.cookie.save(self.cookiefile)                              url = 'http://twebmail.mail.163.com/js4/s?sid='+sid+'&func=mbox:listMessages&showAd=false&userType=browser&uid='+self.username                    postdata = {              'func':'global:sequential',              'showAd':'false',              'sid':'qACVwiwOfuumHPdcYqOOUTAjEXNbBeAr',              'uid':self.username,              'userType':'browser',              'var':'<!--?xml version="1.0"?--><object><int name="fid">1</int><string name="order">date</string><boolean name="desc">true</boolean><boolean name="topFirst">false</boolean><int name="start">0</int><int name="limit">20</int></object>'             }          postdata = urllib.urlencode(postdata)                    #组装请求          req = urllib2.Request(              url = url,              data = postdata,              headers = self.header              )          res = urllib2.urlopen(req).read()           liststr=str(res).split('<object>')#用object进行分割          inboxlistcount=len(liststr)-1#记录邮件封数          inboxlistfile=open('inboxlistfile.txt','w')          t=0  #记录当前第几封信          for i in liststr:              if 'xml' in i and ' version=' in i:                  inboxlistfile.write('inbox 共'+str(inboxlistcount)+'信')                  inboxlistfile.write('\n')              if 'name="id"' in i:                  t=t+1                 inboxlistfile.write('第'+str(t)+'封:')                  inboxlistfile.write('\n')                  #写入from                  beginnum=i.find('name="from"')                  endnum=i.find('</string>',beginnum)                  inboxlistfile.write('From:'+i[beginnum+12:endnum])                  inboxlistfile.write('\n')                  #写入to                  beginnum=i.find('name="to"')                  endnum=i.find('</string>',beginnum)                  inboxlistfile.write('TO:'+i[beginnum+10:endnum])                  inboxlistfile.write('\n')                  #写入subject                  beginnum=i.find('name="subject"')                  endnum=i.find('</string>',beginnum)                  inboxlistfile.write('Subject:'+i[beginnum+15:endnum])                  inboxlistfile.write('\n')                  #写入date:                  beginnum=i.find('name="sentDate"')                  endnum=i.find('</date>',beginnum)                  inboxlistfile.write('Date:'+i[beginnum+16:endnum])                  inboxlistfile.write('\n')                  if 'name="read">true' in i:                      inboxlistfile.write('邮件状态:已读')                      inboxlistfile.write('\n')                  else:                      inboxlistfile.write('邮件状态:未读')                      inboxlistfile.write('\n')                  #写用邮件尺寸                  beginnum=i.find('name="size"')                  endnum=i.find('</int>',beginnum)                  inboxlistfile.write('邮件尺寸:'+i[beginnum+12:endnum])                  inboxlistfile.write('\n')                  #写入邮件编号,用于下载邮件                  beginnum=i.find('name="id"')                  endnum=i.find('</string>',beginnum)                  inboxlistfile.write('邮件编号:'+i[beginnum+10:endnum])                  inboxlistfile.write('\n\n')                            inboxlistfile.close()                                        if __name__=='__main__':      print("Edit @xiaowuyi V1.0  http://www.cnblogs.com/xiaowuyi")      login = Login163('XXXX@163.com','AAAAA')      flag = login.login()      if type(flag) is bool:            #login.letterdown()          print("登陆成功,正在下载列表和通讯录&hellip;&hellip;&hellip;&hellip;&hellip;&hellip;")          login.minbox()          res = login.address_list()          addfile=open('addfile.txt','w')          for x in res:              addfile.write(x['email'])          addfile.close()          print("已完成")      else:          print(flag)

原文链接:http://www.cnblogs.com/xiaowuyi/arcHive/2012/05/21/2511428.html

--结束END--

本文标题: 如何用Python模拟163登陆获取邮件列表

本文链接: https://lsjlt.com/news/288308.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

猜你喜欢
  • 如何用Python模拟163登陆获取邮件列表
    利用cookielib和urllib2模块模拟登陆163的例子有很多,近期看了《python模拟登陆163邮箱并获取通讯录》一文,受到启发,试着对收件箱、发件箱等进行了分析,并列出了所有邮件列表及状态,包括发件人、收件人、主题、发信时间、已...
    99+
    2023-06-17
  • python如何获取文件列表
    要获取文件列表,可以使用Python的os模块中的listdir函数。以下是使用该函数获取当前目录下所有文件的示例代码:```pyt...
    99+
    2023-09-22
    python
  • Python模拟用户自动登陆网易126邮
    Python模拟用户自动登陆网易126邮箱的源码详解,在这里主要来和大家讲一讲,关于利用Python程序来实现自动登录(登陆)网易的126邮箱email的源码与方法,其它邮箱可以借鉴此Python程序代码发邮件。 涉及到Python针对...
    99+
    2023-01-31
    网易 用户 Python
  • python如何获取子列表
    小编给大家分享一下python如何获取子列表,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!获取子列表x = [1,2,3,4,5,6]#前3个...
    99+
    2023-06-17
  • python如何获取列表长度
    使用python获取列表长度的方法:1.新建python项目;2.定义list列表,并初始化;3.定义计数器;4.使用for循环获取列表长度;具体步骤如下:首先,打开python,并新建一个python项目;python项目创建好后,在项目...
    99+
    2024-04-02
  • Python中如何获取类属性的列表
    前言 最近工作中遇到个需求是要得到一个类的静态属性,也就是说有个类 Type ,我要动态获取 Type.FTE 这个属性的值。 最简单的方案有两个: getattr(Type, 'FTE') Type....
    99+
    2022-06-04
    列表 类属 Python
  • Python切片如何获取列表多个值
    小编给大家分享一下Python切片如何获取列表多个值,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!python主要应用领域有哪些1、云计算,典型应用OpenSta...
    99+
    2023-06-14
  • 如何使用批处理获取文件更新列表
    这篇文章给大家分享的是有关如何使用批处理获取文件更新列表的内容。小编觉得挺实用的,因此分享给大家做个参考,一起跟随小编过来看看吧。代码如下:rem 文件更新列表批处理 cls title 枫龙联邦 CopyRight2006 rem &qu...
    99+
    2023-06-09
  • mfc如何获取列表控件的总数据
    要获取MFC列表控件的总数据,可以使用CListCtrl类的GetItemCount()函数。该函数返回列表控件中项目的总数。以下是...
    99+
    2023-09-07
    mfc
  • python中如何获取和查看列表元素
    这篇文章将为大家详细讲解有关python中如何获取和查看列表元素,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。1、获取方法(1)通过索引获取元素元素 = 列表[索引]>>&...
    99+
    2023-06-15
  • golang 如何获取文件夹下面的文件列表
    golang的文档里面比较容易找到的一个方法是filepath.Walk,这个方法有个问题是会自动递归遍历当前目录的子目录,其实我们通常只是想得到一个目录下面的文件列表,并不需要这么...
    99+
    2024-04-02
  • Python使用Srapy框架爬虫模拟登陆并抓取知乎内容
    一、Cookie原理 HTTP是无状态的面向连接的协议, 为了保持连接状态, 引入了Cookie机制 Cookie是http消息头中的一种属性,包括: Cookie名字(Name)Cookie的值(V...
    99+
    2022-06-04
    爬虫 框架 内容
  • 如何用Python模拟登录淘宝
    如何用Python模拟登录淘宝,针对这个问题,这篇文章详细介绍了相对应的分析和解答,希望可以帮助更多想解决这个问题的小伙伴找到更简单易行的方法。Python模拟登录淘宝,我知道,肯定是吸引了你,一起来看看吧!看了下网上有很多关于模拟登录淘宝...
    99+
    2023-06-02
  • Python 如何获取目录下的文件列表,并自然排序
    在实际的算法与程序开发中,经常需要面对的场景就是对同一目录内的文件进行批量操作。 并且很多时候目录中的文件明明是有规律的,同时希望程序在进行处理时也是按照一定的顺序进行。 方法 1 >>> im...
    99+
    2022-06-02
    Python 获取目录 文件列表 自然排序
  • 详解Python如何获取列表(List)的中位数
    前言 中位数是一个可将数值集合划分为相等的上下两部分的一个数值。如果列表数据的个数是奇数,则列表中间那个数据就是列表数据的中位数;如果列表数据的个数是偶数,则列表中间那2个数据的算术平均值就是列表数据的中位...
    99+
    2022-06-04
    中位数 详解 列表
  • VBS如何获取指定目录下的文件列表
    这篇文章主要介绍VBS如何获取指定目录下的文件列表,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!VBS肿么获取某目录下的文件列表dim FileName,fs,foldernamefoldername&nb...
    99+
    2023-06-08
  • 如何使用go从gmail获取未读电子邮件?
    在IT行业这个发展更新速度很快的行业,只有不停止的学习,才不会被行业所淘汰。如果你是Golang学习者,那么本文《如何使用go从gmail获取未读电子邮件?》就很适合你!本篇内容主要包括##cont...
    99+
    2024-04-04
  • MyBatisPlus如何利用Service实现获取数据列表
    这篇文章主要介绍“MyBatisPlus如何利用Service实现获取数据列表”的相关知识,小编通过实际案例向大家展示操作过程,操作方法简单快捷,实用性强,希望这篇“MyBatisPlus如何利用Service实现获取数据列表”文章能帮助大...
    99+
    2023-07-02
  • 详解如何用Python模拟登录淘宝
    目录一、淘宝登录流程二、模拟登录实现1.判断是否需要验证码2.验证用户名密码3.申请st码4.使用st码登录5.获取淘宝昵称三、总结1.代码结构2.存在问题看了下网上有很多关于模拟登...
    99+
    2024-04-02
  • 使用Python怎么获取目录下的文件列表并排序
    本篇文章为大家展示了使用Python怎么获取目录下的文件列表并排序,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。方法 1>>> import os>>...
    99+
    2023-06-15
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作