如何在django中优化自引用模型中相关记录的检索?

我正在从模型创建一个表单 . 此表单包含一个类别 . 类别模型是自引用模型 . 我想在表单的下拉列表中显示类别,以便它们也显示其父类别 . 即

parentcat3 > parentcat2 > parentcat1 > leafcategory

最后一个类别由 leafCategory=True 表示 .

我已经覆盖了我的ModelForm来选择仅使用叶子(结束)类别的记录;

self.fields['primaryCategory'].queryset = Category.objects.exclude(leafCategory=False)

然后,ModelForm下拉列表使用模型中 __unicode__ 的返回值;

getFullPathString()

这会回溯“树”以查找父类别 . 这是缓慢的部分(有10,000个类别)

如何优化父记录的检索?

这是我正在使用的代码:

型号

class Category(models.Model):
    name = models.CharField(max_length=200)
    parent = models.ForeignKey("self",related_name='related_category',null=True)
    leafCategory=models.BooleanField(default=False)

    def __unicode__(self):
        return u"%s" % self.getFullPathString()

    def getParentArray(self):
        """Create an array of parent objects from the current category """
        itemArray=[]

        itemArray.insert(0,self)
        parentCat=self.parent

        while parentCat:
            itemArray.insert(0,parentCat)
            parentCat=parentCat.parent
        return itemArray

    def getFullPathString(self):
        """Get the parent category names, cat 1 > cat 2 etc"""
        returnText=""
        for item in self.getParentArray():
            returnText += item.name
            if not item.isLeaf():
                returnText += " > "
        return returnText

表格

class InventoryForm(ModelForm):
    def __init__(self, *args, **kwargs):
        super(InventoryForm, self).__init__(*args, **kwargs)
        self.fields['primaryCategory'].queryset = Category.objects.exclude(leafCategory=False)

回答(1)

2 years ago

这段代码非常低效 . 它将为每个类别和每个类别的祖先执行一系列新的数据库查询 .

您需要查看针对在数据库中存储和检索此类分层数据而优化的算法 . django-mptt是我最喜欢的 .

另外,在列表的开头重复插入元素也是低效的 . 列表针对追加进行了优化,未针对插入进行优化 . 为两端添加而优化的数据结构是Python的 collections 模块中的 deque - 但更好的解决方案可能是简单地追加元素,然后在返回之前调用列表上的 reverse() .