`
qepwqnp
  • 浏览: 105988 次
  • 性别: Icon_minigender_1
  • 来自: 成都
社区版块
存档分类
最新评论

python模块学习 ---- Cookie

阅读更多

最近在用GAE开发自己的博客程序。虽然GAE的API没有显式的提供操作Cookie的方法,但他现有的架构,使我们有足够的自由来操作Cookie。

Cookie 模块,顾名思义,就是用来操作Cookie的模块。Cookie这块小蛋糕,玩过Web的人都知道,它是Server与Client保持会话时用到的信息 切片。 Http协议本身是无状态的,也就是说,同一个客户端发送的两次请求,对于Web服务器来说,没有直接的关系。既然这样,有人会问,既然Http是无状态 的, 为什么有些网页,只有输入了用户名与密码通过验证之后才可以访问?那是因为:对于通过身份验证的用户,Server会偷偷的在发往Client的数据中添 加 Cookie,Cookie中一般保存一个标识该Client的唯一的ID,Client在接下来对服务器的请求中,会将该ID以Cookie的形式一并 发往Server,Server从回传回来的Cookie中提取ID并与相应的用户绑定起来,从而实现身份验证。说白了,Cookie就是一个在服务器与客户端之间相互传递的字符串(下图通过FireFox的FireBug插件查看访问google.com时的Cookie)。 越扯越远了,回到我们的主题:Python标准模块 -- Cookie。

Http请求头

(上图是Http请求头中的Cookie信息)

Http响应头

(上图是Http响应中的Cookie信息)

Cooke模块中定义了4个直接操作Cookie的类:BaseCookie、SimpleCookie、SerialCookie、 SmartCookie。其中,BaseCookie是基类,定义了操作Cookie的公共部分,其他3个类都继承自BaseCookie,它们之间的区 别仅仅在于序列化数据的方式不同。下面简单讲解这些类的使用。
BaseCookie基类: BaseCookies的行为非常像dict,可以用键/值对的形式来操作它,但是kye必须是字符串,value是Morsel对象 (下面会讲到Morsel)。BaseCookies定义了编码/解码,输入/输出操作的公共规范:

BaseCookie.value_decode(val)
BaseCookie.value_encode(val):
对数据进行序列化/反序列化。这些方法都返回字符串,以便通过Http传输。
BaseCookie.output():
返回字符串,该字符串可以作为Http响应头发往客户端。
BaseCookie.js_output()
返回嵌入js脚本的字符串,浏览器通过执行该脚本,就可以得到cooke数据。
BaseCookie.load(newdata):解析字符串为Cookie数据。

SimpleCookie、SerialCookie、SmartCookie都继承自BaseCookie,具有一致的行为,它们各自对 BaseCookie的value_decode, value_encode进行了重写并实现自己的序列化/反序列化策略,其中:

  • SimpleCookie内部使用str()来对数据进行序列化;
  • SerialCookie则通过pickle模块来序列化反序列化数据;
  • SmartCookie相对聪明点,对于非字符串数据,使用pickle序列/反序列化,否则将字符串原样返回。

下面的例子简单的说明如何使用Cookie模块:

import Cookie

c = Cookie.SimpleCookie()
c['name'] = 'DarkBull'
c['address'] = 'ChinaHangZhou'
c['address']['path'] = '/' # 路径
c['address']['domain'] = 'appspot.com' # domain
c['address']['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT' # 过期时间
print c.output()
print c.js_output()

# 输出结果,与上图对照
# Set-Cookie: address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/
# Set-Cookie: name=DarkBull

# 作为脚本输出
# <script type="text/javascript">
# document.cookie = "address=ChinaHangZhou; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT; Path=/";
# </script>

# <script type="text/javascript">
# document.cookie = "name=DarkBull";
# </script>

Morsel类 : 用于表示Cookie中每一项数据的属性而抽象的类。这些属性包括:expires, path, comment, domain, max-age, secure, version等等(看上图下划线标注部分)。如果你玩过web,对这些应该不会陌生,可以在RCF2109中找到他们的具体定义。
Morsel.key,Morsel.value:Cookie数据项的key/value(value可以是二进制数据);
Morsel.coded_value:数据编码后得到的字符串。Http协议是基于文本的协议,Server无法直接向Client发送二进制数据,只有序列化成字符串后,才能发往Client;
Morsel.set(key, value, coded_value):设置Cookie数据项的key、value、coded_value;
Morsel.isReversvedKey(key):如果key是expires, path, comment, domain, max-age, secure, version, httponly中的一个,返回True,否则返回False;
Morsel.output():返回型如“Set-Cookie: ...”的字符串,表示一个Cookie数据项;
Morsel.js_output():返回Cookie数据项的脚本字符串;
Morsel.OutputString(): 返回Morsel的字符串表示;

Morsel使用示例:

import Cookie

m = Cookie.Morsel()
m.set('name', 'DarkBull', 'DarkBull')
m['expires'] = 'Fir, 01-Oct-2010 20:00:00 GMT'
m['domain'] = 'appspot.com'
print m.output()

# 结果
# Set-Cookie: name=DarkBull; Domain=appspot.com; expires=Fir, 01-Oct-2010 20:00:00 GMT

关于Cookie模块更详细的内容,可以Python手册。

分享到:
评论

相关推荐

    Python代码源码-实操案例-框架案例-如何通过requests模块实现Cookie登录.zip

    Python代码源码-实操案例-框架案例-如何通过requests模块实现Cookie登录.zip

    Python 如何通过requests模块实现Cookie登录 Python源码

    Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 Python源码Python 如何通过requests模块实现Cookie登录 ...

    网络爬虫-如何通过requests模块实现Cookie登录-Python实例源码.zip

    网络爬虫-如何通过requests模块实现Cookie登录-Python实例源码.zip

    requests-cache 是为 Python 的 Requests 库提供了持久化缓存支持的 Python 模块-python

    requests-cache 是为 Python 的 Requests 库提供了持久化缓存支持的 Python 模块 requests-cache Requests-cache 是一个透明的持久缓存请求(版本 &gt;= 1.1.0)库。 用法示例 只需编写: import requests import ...

    python cookie反爬处理的实现

     session对象:该对象和requests模块用法几乎一致.如果在请求的过程中产生了cookie,如果该请求使用session发起的,则cookie会被自动存储到session中. 案例 爬取雪球网中的新闻资讯数据:https://xueqiu.com/ #获取...

    python模块详解

    python模块详解 各个模块的详解 核心模块 1.1. 介绍 1.2. _ _builtin_ _ 模块 1.3. exceptions 模块 1.4. os 模块 1.5. os.path 模块 1.6. stat 模块 1.7. string 模块 1.8. re 模块 1.9. math 模块 1.10....

    老男孩第三期Python全栈开发视频教程 零基础系统学习Python开发视频+资料

    ├─(95) 06 python s3 day53 COOKIE和SESSION配合使用.avi ├─(96) day53课上所有.zip (18)\\python全栈day51-60\\python全栈s3 day54;目录中文件数:13个 ├─(97) 01 python全栈3 day54 今日内容概要 .avi ├─...

    Python requests模块cookie实例解析

    在python requests模块-session中,我们知道了requests中的session对象能够在请求之间保持cookie,它极大地方便了我们去使用cookie。当我们想设置方法级别中的请求时,可以如下面示例一样操作。 import requests s ...

    让python的Cookie.py模块支持冒号做key的方法

    /usr/bin/python # -*- coding: utf-8 -*- “””MorselHook, fix Cookie.CookieError: Illegal key value: ys-tab:entrance:e “”” import Cookie import string _Morsel = Cookie.Morsel class MorselHook(_...

    python-learning.zip

    06.函数和模块的使用.md 07.字符串和常用数据结构.md 08.面向对象编程基础.md 09.面向对急进阶.md 10.图形用户界面和游戏开发.md 11.文件和异常.md 12.字符串和正则表达式.md 13.进程和线程.md 14.网络编程入门和...

    Python-MechanicalSoup一个用于自动与网站交互的Python库

    一个用于自动与网站交互的Python库, MechanicalSoup自动存储和发送cookie,遵循重定向,并可以跟随链接并提交表单。

    python爬虫使用cookie登录详解

    前言: 什么是cookie? Cookie,指某些网站为了辨别用户...Urllib是python内置的HTTP请求库,官方地址:https://docs.python.org/3/library/urllib.html 包括以下模块: &gt;&gt;&gt;urllib.request请求模块 &gt;&gt;&gt;urllib.error异常

    Python使用cookielib模块操作cookie的实例教程

    他最常见的搭档模块就是python下的urllib和request。 核心类 1.Cookie 该类实现了Netscape and RFC 2965 cookies定义的cookie标准,基本可以理解为某一条cookie数据。 部分代码如下,很多属性是不是很眼熟? self....

    python爬虫万能代码-获取网页

    网页下载器:通过传入一个URL地址来下载网页,将网页转换成一个字符串,网页下载器有urllib2(Python官方基础模块)包括需要登录、代理、和cookie,requests(第三方包) 网页解析器:将一个网页字符串进行解析,可以...

    Python异步cookie池,cookies管理,python爬虫工具;基于Asyncio,Aiohttp等库

    基于python asyncio的web网站cookie管理项目;目前提供周期性的登陆获取指定网站Cookie,检测Cookie是否有效, 异常账号睡眠,通过API获取Cookie以及查看Cookie使用情况等功能。 模块功能简介: api:对外接口服务...

    python3.5全栈工程师零基础到项目实战全套

    05.Python3.5模块讲解14课 06.Python3.5面向对象12课 07.Python3.5网络编程13课 08.Python3.5 Socekt高级编程 11课 09.Python3.5的多线程 15课 10.Python3.5的多进程 18课 第二阶段:Python3.5 WEB开发篇 11.Python...

    python爬取豆瓣电影(requests模块)

    python使用requests模块请求网址,使用lxml模块中etree抓取数据,并使用time模块延时 爬取的页面为: 运行结果如下图所示: python代码如下: 在这里插入代码片 # _*_ coding:utf _*_ # 邮箱:3195841740@qq.com #...

    Python爬虫模拟登录带验证码网站

    因此我们需要用Cookielib模块来保持网站的cookie。 这个是要登陆的地址 http://202.115.80.153/ 和验证码地址 http://202.115.80.153/CheckCode.aspx 可以发现这个验证码是动态更新的每次打开都不一样,一般这种...

    python-dokuwiki:通过XMLRPC管理Dokuwiki

    python-dokuwiki 该python模块旨在通过使用提供的来管理 Wiki。 该模块与python2.7和python3 +兼容。 介绍API。发行说明1.2.1(2019-07-24) 删除构造函数中的调用,因为在某些情况下它似乎失败( )。1.2.0(2019-...

Global site tag (gtag.js) - Google Analytics