2020-05-11

23 分钟读完 (大约 3497 个字)

django入门进阶03_学习笔记03

第一章:模型层

1.8 查询操作

一、创建对象

>>> from blog.models import Blog  
>>> b = Blog(name='Beatles Blog', tagline='All the latest Beatles news.')  
>>> b.save()  

b = Blog.objects.create(name='Beatles Blog', tagline='All the latest Beatles news.')

二、保存对象

保存外键和多对多字段

>>> entry = Entry.objects.get(pk=1)  
>>> cheese_blog = Blog.objects.get(name="Cheddar Talk")  
>>> entry.blog = cheese_blog  
>>> entry.save()

多对多字段的保存稍微有点区别，需要调用一个add()方法，而不是直接给属性赋值，但它不需要调用save方法。如下例所示：

1
2
3

>>> from blog.models import Author  
>>> joe = Author.objects.create(name="Joe")  
>>> entry.authors.add(joe)

同时添加多个对象到多对多的字段

1	>>> entry.authors.add(john, paul, george, ringo)

三、检索对象
通过模型的Manager获得QuerySet，每个模型至少具有一个Manager，默认情况下，它被称作objects，可以通过模型类直接调用它，但不能通过模型类的实例调用它，以此实现“表级别”操作和“记录级别”操作的强制分离。

检索所有对象

过滤对象

1 2	filter(kwargs)：返回一个根据指定参数查询出来的QuerySet exclude(kwargs)：返回除了根据指定参数查询出来结果的QuerySet

链式过滤
被过滤的QuerySets都是唯一的

1
2
3

>>> q1 = Entry.objects.filter(headline__startswith="What")  
>>> q2 = q1.exclude(pub_date__gte=datetime.date.today())  
>>> q3 = q1.filter(pub_date__gte=datetime.date.today())

例子中的q2和q3虽然由q1得来，是q1的子集，但是都是独立自主存在的。同样q1也不会受到q2和q3的影响。

检索单一对象
注意：使用get()方法和使用filter()方法然后通过[0]的方式分片，有着不同的地方。看似两者都是获取单一对象。但是，如果在查询时没有匹配到对象，那么get()方法将抛出DoesNotExist异常。
在使用get()方法查询时，如果结果超过1个，则会抛出MultipleObjectsReturned异常
其它QuerySet方法
QuerySet使用限制
注意：不支持负索引！例如 Entry.objects.all()[-1]是不允许的
通常情况，切片操作会返回一个新的QuerySet，并且不会被立刻执行。但是有一个例外，那就是指定步长的时候，查询操作会立刻在数据库内执行，如下：
1
>>> Entry.objects.all()[:10:2]
若要获取单一的对象而不是一个列表（例如，SELECT foo FROM bar LIMIT 1），可以简单地使用索引而不是切片。例如，下面的语句返回数据库中根据标题排序后的第一条Entry：
1
>>> Entry.objects.order_by('headline')[0]
它相当于：
1
>>> Entry.objects.order_by('headline')[0:1].get()
注意：如果没有匹配到对象，那么第一种方法会抛出IndexError异常，而第二种方式会抛出DoesNotExist异常。

也就是说在使用get和切片的时候，要注意查询结果的元素个数。
6. 字段查询
字段查询其实就是filter()、exclude()和get()等方法的关键字参数。其基本格式是：field__lookuptype=value，注意其中是双下划线。例如：

1
2
3

>>> Entry.objects.filter(pub_date__lte='2006-01-01') 
#　相当于：  
SELECT * FROM blog_entry WHERE pub_date <= '2006-01-01';

有一个例外，那就是ForeignKey字段，你可以为其添加一个“_id”后缀（单下划线）。这种情况下键值是外键模型的主键原生值。例如：

1	>>> Entry.objects.filter(blog_id=4)

exact：默认类型。
iexact：不区分大小写。
contains：表示包含的意思！大小写敏感！
icontains：contains的大小写不敏感模式。
startswith和endswith :以什么开头和以什么结尾。大小写敏感！
istartswith和iendswith是不区分大小写的模式。
7. 跨越关系查询
Django提供了强大并且直观的方式解决跨越关联的查询，它在后台自动执行包含JOIN的SQL语句。要跨越某个关联，只需使用关联的模型字段名称，并使用双下划线分隔，直至你想要的字段（可以链式跨越，无限跨度）。
跨越多值的关系查询
最基本的filter和exclude的关键字参数只有一个，这种情况很好理解。但是当关键字参数有多个，且是跨越外键或者多对多的情况下，那么就比较复杂，让人迷惑了。我们看下面的例子：

1	Blog.objects.filter(entry__headline__contains='Lennon', entry__pub_date__year=2008)

这是一个跨外键、两个过滤参数的查询。此时我们理解两个参数之间属于-与“and”的关系，也就是说，过滤出来的BLog对象对应的entry对象必须同时满足上面两个条件。这点很好理解。也就是说上面要求至少有一个entry同时满足两个条件。
但是，看下面的用法：

1	Blog.objects.filter(entry__headline__contains='Lennon').filter(entry__pub_date__year=2008)

把两个参数拆开，放在两个filter调用里面，按照我们前面说过的链式过滤，这个结果应该和上面的例子一样。可实际上，它不一样，Django在这种情况下，将两个filter之间的关系设计为-或“or”，这真是让人头疼。
多对多关系下的多值查询和外键foreignkey的情况一样。
但是，更头疼的来了，exclude的策略设计的又和filter不一样！

1	Blog.objects.exclude(entry__headline__contains='Lennon',entry__pub_date__year=2008,)

这会排除headline中包含“Lennon”的Entry和在2008年发布的Entry，中间是一个-和“or”的关系！

那么要排除同时满足上面两个条件的对象，该怎么办呢？看下面：

Blog.objects.exclude(  
entry=Entry.objects.filter(  
    headline__contains='Lennon',  
    pub_date__year=2008,  
),  
)

（有没有很坑爹的感觉？所以，建议在碰到跨关系的多值查询时，尽量使用Q查询）
8. 使用F表达式引用模型的字段
9. 主键的快捷查询方式：pk
pk就是primary key的缩写。通常情况下，一个模型的主键为“id”，所以下面三个语句的效果一样：

1
2
3

>>> Blog.objects.get(id__exact=14) # Explicit form  
>>> Blog.objects.get(id=14) # __exact is implied  
>>> Blog.objects.get(pk=14) # pk implies id__exact

在LIKE语句中转义百分符号和下划线
在原生SQL语句中%符号有特殊的作用。Django帮你自动转义了百分符号和下划线，你可以和普通字符一样使用它们，如下所示：
1
2
3
>>> Entry.objects.filter(headline__contains='%')
# 它和下面的一样
# SELECT ... WHERE headline LIKE '%\%%';

缓存与查询集
要想高效的利用查询结果，降低数据库负载，你必须善于利用缓存。看下面的例子，这会造成2次实际的数据库操作，加倍数据库的负载，同时由于时间差的问题，可能在两次操作之间数据被删除或修改或添加，导致脏数据的问题：

1 2	>>> print([e.headline for e in Entry.objects.all()]) >>> print([e.pub_date for e in Entry.objects.all()])

为了避免上面的问题，好的使用方式如下，这只产生一次实际的查询操作，并且保持了数据的一致性：

1
2
3

>>> queryset = Entry.objects.all()  
>>> print([p.headline for p in queryset]) # 提交查询  
>>> print([p.pub_date for p in queryset]) # 重用查询缓存

何时不会被缓存
有一些操作不会缓存QuerySet，例如切片和索引。这就导致这些操作没有缓存可用，每次都会执行实际的数据库查询操作。例如：

1
2
3

>>> queryset = Entry.objects.all()  
>>> print(queryset[5]) # 查询数据库  
>>> print(queryset[5]) # 再次查询数据库

但是，如果已经遍历过整个QuerySet，那么就相当于缓存过，后续的操作则会使用缓存，例如：

>>> queryset = Entry.objects.all()  
>>> [entry for entry in queryset] # 查询数据库  
>>> print(queryset[5]) # 使用缓存  
>>> print(queryset[5]) # 使用缓存

下面的这些操作都将遍历QuerySet并建立缓存：

>>> [entry for entry in queryset]  
>>> bool(queryset)  
>>> entry in queryset  
>>> list(queryset)

注意：简单的打印QuerySet并不会建立缓存，因为repr()调用只返回全部查询集的一个切片。

Poll.objects.get(  
Q(question__startswith='Who'),  
Q(pub_date=date(2005, 5, 2)) | Q(pub_date=date(2005, 5, 6))  
)  
# 它相当于  
# SELECT * from polls WHERE question LIKE 'Who%'  
AND (pub_date = '2005-05-02' OR pub_date = '2005-05-06')

当关键字参数和Q对象组合使用时，Q对象必须放在前面，如下例子：

1 2	Poll.objects.get( Q(pub_date=date(2005, 5, 2)) \| Q(pub_date=date(2005, 5, 6)),question__startswith='Who',)

如果关键字参数放在Q对象的前面，则会报错。

五、比较对象
要比较两个模型实例，只需要使用python提供的双等号比较符就可以了。在后台，其实比较的是两个实例的主键的值。下面两种方法是等同的：

1 2	>>> some_entry == other_entry >>> some_entry.id == other_entry.id

如果模型的主键不叫做“id”也没关系，后台总是会使用正确的主键名字进行比较，例如，如果一个模型的主键的名字是“name”，那么下面是相等的：

1 2	>>> some_obj == other_obj >>> some_obj.name == other_obj.name

六、删除对象
删除对象使用的是对象的delete()方法。该方法将返回被删除对象的总数量和一个字典，字典包含了每种被删除对象的类型和该类型的数量。如下所示：

1 2	>>> e.delete() (1, {'weblog.Entry': 1})

也可以批量删除。每个QuerySet都有一个delete()方法，它能删除该QuerySet的所有成员。例如：

1 2	>>> Entry.objects.filter(pub_date__year=2005).delete() (5, {'webapp.Entry': 5})

当Django删除一个对象时，它默认使用SQL的ON DELETE CASCADE约束，也就是说，任何有外键指向要删除对象的对象将一起被删除。例如：

1
2
3

b = Blog.objects.get(pk=1)  
# 下面的动作将删除该条Blog和所有的它关联的Entry对象  
b.delete()

这种级联的行为可以通过的ForeignKey的on_delete参数自定义。
注意，delete()是唯一没有在管理器上暴露出来的方法。这是刻意设计的一个安全机制，用来防止你意外地请求类似Entry.objects.delete()的动作，而不慎删除了所有的条目。如果你确实想删除所有的对象，你必须明确地请求一个完全的查询集，像下面这样：

1	Entry.objects.all().delete()

七、复制模型实例

blog = Blog(name='My blog', tagline='Blogging is easy')  
blog.save() # blog.pk == 1  
#  
blog.pk = None  
blog.save() # blog.pk == 2

八、批量更新对象

1 2	# 更新所有2007年发布的entry的headline Entry.objects.filter(pub_date__year=2007).update(headline='Everything is the same')

九、关系的对象

一对多（外键）
正向查询:
反向查询:
使用自定义的反向管理器:
处理关联对象的其它方法:
多对多
一对一
反向关联是如何实现的？
通过关联对象进行查询

十、使用原生SQL语句

查询集API

一、QuerySet何时被提交
迭代
QuerySet是可迭代的，在首次迭代查询集时执行实际的数据库查询
切片：如果使用切片的”step“参数，Django 将执行数据库查询并返回一个列表。
Pickling/缓存
repr()
len()：当你对QuerySet调用len()时，将提交数据库操作。
list()：对QuerySet调用list()将强制提交操作entry_list = list(Entry.objects.all())
bool()
二、QuerySet
QuerySet类具有两个公有属性用于内省：
ordered：如果QuerySet是排好序的则为True，否则为False。
db：如果现在执行，则返回使用的数据库。

三、返回新QuerySets的API
方法名解释
filter() 过滤查询对象。
exclude() 排除满足条件的对象
annotate() 使用聚合函数
order_by() 对查询集进行排序
reverse() 反向排序
distinct() 对查询集去重
values() 返回包含对象具体值的字典的QuerySet
values_list() 与values()类似，只是返回的是元组而不是字典。
none() 创建空的查询集
all() 获取所有的对象
select_related() 附带查询关联对象

不返回QuerySets的API

get() 获取单个对象
create() 创建对象，无需save()
get_or_create() 查询对象，如果没有找到就新建对象
update_or_create() 更新对象，如果没有找到就创建对象
count() 统计对象的个数
latest() 获取最近的对象
earliest() 获取最早的对象
first() 获取第一个对象
last() 获取最后一个对象
aggregate() 聚合操作
exists() 判断queryset中是否有对象
update() 批量更新对象
delete() 批量删除对象

django系列
django入门进阶01学习笔记01
django入门进阶02学习笔记02
django入门进阶03学习笔记03
django入门进阶04学习笔记04
django入门进阶05快捷复习手册
 django入门进阶06静态文件和模板
 django入门进阶07用户模块与权限系统
 django入门进阶08数据库事务
 django入门进阶09中间件
 django入门进阶10部署上线(nginx,uwsgi,supervisor)
django入门进阶11websocket
django入门进阶12信号
 django入门进阶13异常之makemigrations

本文标题：django入门进阶03_学习笔记03
本文作者：yuanjh
本文链接：https://hexo.yuanjh.cn/hexo/b8d2b721/
发布时间：2020-05-11
版权声明：本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明出处！

# 07通用技术/python/django入门进阶

django入门进阶03_学习笔记03

1.8 查询操作

查询集API

不返回QuerySets的API

目录

链接

分类

最新文章

Your browser is out-of-date!