首页 文章

Django ORM和SQL内连接

提问于
浏览
3

我正在尝试获取属于相关列表对象的特定from_date和to_date范围内的所有Horse对象 . 例如 .

Horse.objects.filter(listings__to_date__lt=to_date.datetime,
listings__from_date__gt=from_date.datetime)

现在据我所知,这个数据库查询创建了一个内部联接,然后我可以根据相关的列表日期找到我所有的马对象 .

我的问题是这是如何工作的,它可能归结为对内连接实际工作方式的主要缺乏理解 . 此查询是否需要首先“检查”每个以及马匹对象,以确定它是否具有相关的列表对象?我想这可能被证明是非常低效的,因为你可能有500万马对象没有相关的列表对象,但你仍然需要先检查每一个?

或者,我可以从我的列表开始,并首先做这样的事情:

Listing.objects.filter(to_date__lt=to_date.datetime, 
from_date__gt=from_date.datetime)

然后:

for listing in listing_objs:
    if listing.horse:
        horses.append(horse)

但这似乎是实现我的结果的一种相当奇怪的方式 .

如果有人可以帮助我理解查询如何在Django中工作,哪种方法最有效,那么这将是一个很好的帮助!

这是我目前的模型设置:

class Listing(models.Model):

    to_date = models.DateTimeField(null=True, blank=True)
    from_date = models.DateTimeField(null=True, blank=True)
    promoted_to_date = models.DateTimeField(null=True, blank=True)
    promoted_from_date = models.DateTimeField(null=True, blank=True)

    # Relationships
    horse = models.ForeignKey('Horse', related_name='listings', null=True, blank=True)

class Horse(models.Model):
    created_date = models.DateTimeField(null=True, blank=True, auto_now=True)
    type = models.CharField(max_length=200, null=True, blank=True)
    name = models.CharField(max_length=200, null=True, blank=True)
    age = models.IntegerField(null=True, blank=True)
    colour = models.CharField(max_length=200, null=True, blank=True)
    height = models.IntegerField(null=True, blank=True)

1 回答

  • 1

    编写查询的方式实际上取决于大多数时候您想要的信息 . 如果您对马匹感兴趣,请查询 Horse . 如果您对列表感兴趣,那么您应该从 Listing 查询 . 's generally the correct thing to do, especially when you'正在使用简单的外键 .

    你的第一个查询可能是关于Django的更好的查询 . 我've used slightly simpler models to illustrate the differences. I' ve创建了一个 active 字段而不是使用日期时间 .

    In [18]: qs = Horse.objects.filter(listings__active=True)
    
    In [19]: print(qs.query)
    SELECT 
    "scratch_horse"."id", 
    "scratch_horse"."name" 
    FROM "scratch_horse" 
    INNER JOIN "scratch_listing" 
    ON ( "scratch_horse"."id" = "scratch_listing"."horse_id" ) 
    WHERE "scratch_listing"."active" = True
    

    上面查询中的内部联接将确保您只获得具有列表的马匹 . (大多数)数据库非常擅长使用连接和索引来过滤掉不需要的行 .

    如果 Listing 非常小,并且 Horse 相当大,那么我希望数据库只查看Listing表,然后使用索引来获取Horse的正确部分而不进行全表扫描(检查每匹马) . 您需要运行查询并检查数据库正在执行的操作 . EXPLAIN(或您使用的任何数据库)非常有用 . 如果你're guessing what the database is doing, you'可能错了 .

    请注意,如果您需要访问每个 horselistings ,那么每次访问 horse.listings 时您都将执行另一个查询 . prefetch_related可以帮助您,如果您需要访问 listings ,执行单个查询并将其存储在缓存中 .

    现在,您的第二个查询:

    In [20]: qs = Listing.objects.filter(active=True).select_related('horse')
    
    In [21]: print(qs.query)
    SELECT 
    "scratch_listing"."id", 
    "scratch_listing"."active", 
    "scratch_listing"."horse_id", 
    "scratch_horse"."id", 
    "scratch_horse"."name" 
    FROM "scratch_listing" 
    LEFT OUTER JOIN "scratch_horse" 
    ON ( "scratch_listing"."horse_id" = "scratch_horse"."id" ) 
    WHERE "scratch_listing"."active" = True
    

    这会进行LEFT连接,这意味着右侧可以包含NULL . 在这种情况下,右侧是 Horse . 如果您有很多没有马的列表,这将表现得非常糟糕,因为它会带回每一个活跃的列表,无论马匹是否与之相关联 . 你可以用 .filter(active=True, horse__isnull=False) 解决这个问题 .

    看到我使用了 select_related ,它连接表,这样你就可以访问 listing.horse 而不会产生另一个查询 .

    现在我应该问为什么你的所有字段都可以为空 . 这通常是一个糟糕的设计选择,特别是对于ForeignKeys . 你有没有一匹与马无关的名单?如果没有,摆脱空 . 你会不会有一匹没有名字的马?如果没有,摆脱空 .

    所以答案是,做大多数时候看似自然的事情 . 如果您知道某个特定的表会很大,那么您需要检查查询计划程序(EXPLAIN),查看在过滤器/连接条件上添加/使用索引,或从关系的另一侧查询 .

相关问题