Python Descriptors: How Django ORM Works Under the Hood

Python Descriptors: How Django ORM Works Under the Hood | U-BLOG

CharField

__get__

__get__(self, obj, objtype=None)   # called on attribute access
__set__(self, obj, value)          # called on attribute assignment
__delete__(self, obj)              # called on attribute deletion

class Circle:
    def __init__(self, radius):
        self._radius = radius

    @property
    def area(self):
        return 3.14159 * self._radius ** 2

class Property:
    def __init__(self, fget=None, fset=None, fdel=None, doc=None):
        self.fget = fget
        self.fset = fset
        self.fdel = fdel
        if doc is None and fget is not None:
            doc = fget.__doc__
        self.__doc__ = doc

    def __set_name__(self, owner, name):
        self.__name__ = name

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        if self.fget is None:
            raise AttributeError("unreadable attribute")
        return self.fget(obj)

    def __set__(self, obj, value):
        if self.fset is None:
            raise AttributeError("can't set attribute")
        self.fset(obj, value)

    def __delete__(self, obj):
        if self.fdel is None:
            raise AttributeError("can't delete attribute")
        self.fdel(obj)

    def setter(self, fset):
        return type(self)(self.fget, fset, self.fdel, self.__doc__)

    def deleter(self, fdel):
        return type(self)(self.fget, self.fset, fdel, self.__doc__)

def object_getattribute(obj, name):
    null = object()
    objtype = type(obj)
    cls_var = find_name_in_mro(objtype, name, null)
    descr_get = getattr(type(cls_var), '__get__', null)

    if descr_get is not null:
        if (hasattr(type(cls_var), '__set__')
            or hasattr(type(cls_var), '__delete__')):
            # Data descriptor -- highest priority
            return descr_get(cls_var, obj, objtype)

    if hasattr(obj, '__dict__') and name in vars(obj):
        # Instance dictionary -- second priority
        return vars(obj)[name]

    if descr_get is not null:
        # Non-data descriptor -- third priority
        return descr_get(cls_var, obj, objtype)

    if cls_var is not null:
        return cls_var

    raise AttributeError(name)

class Dog:
    def speak(self):
        return "woof"

rex = Dog()
rex.speak = lambda: "meow"  # shadows the method
rex.speak()  # "meow" -- instance dict wins over non-data descriptor

class Dog:
    @property
    def speak(self):
        return "woof"

rex = Dog()
rex.speak = "meow"  # AttributeError! Data descriptor wins.

from django.db import models

class Book(models.Model):
    title = models.CharField(max_length=255)
    pages = models.IntegerField()

class DeferredAttribute:
    def __init__(self, field):
        self.field = field

    def __get__(self, instance, cls=None):
        if instance is None:
            return self
        data = instance.__dict__
        field_name = self.field.attname
        if field_name not in data:
            val = self._check_parent_chain(instance)
            if val is None:
                instance.refresh_from_db(fields=[field_name])
            else:
                data[field_name] = val
        return data[field_name]

class Field:
    """Base field descriptor that handles type coercion and validation."""

    def __init__(self, field_type, default=None, required=True):
        self.field_type = field_type
        self.default = default
        self.required = required
        self.name = None

    def __set_name__(self, owner, name):
        self.name = name
        if not hasattr(owner, '_fields'):
            owner._fields = {}
        owner._fields[name] = self

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        val = obj.__dict__.get(self.name)
        if val is None and self.name not in obj.__dict__:
            if self.default is not None:
                return self.default() if callable(self.default) else self.default
            if self.required:
                raise AttributeError(
                    f"Field '{self.name}' has no value and no default"
                )
            return None
        return val

    def __set__(self, obj, value):
        if value is not None:
            try:
                value = self.field_type(value)
            except (TypeError, ValueError) as e:
                raise TypeError(
                    f"Cannot assign {type(value).__name__} to "
                    f"{self.field_type.__name__} field '{self.name}': {e}"
                )
        elif self.required:
            raise ValueError(f"Field '{self.name}' cannot be None")
        obj.__dict__[self.name] = value


class CharField(Field):
    def __init__(self, max_length=255, **kwargs):
        super().__init__(str, **kwargs)
        self.max_length = max_length

    def __set__(self, obj, value):
        super().__set__(obj, value)
        if value and len(value) > self.max_length:
            raise ValueError(
                f"'{self.name}' exceeds max_length of {self.max_length}"
            )


class IntegerField(Field):
    def __init__(self, min_value=None, max_value=None, **kwargs):
        super().__init__(int, **kwargs)
        self.min_value = min_value
        self.max_value = max_value

    def __set__(self, obj, value):
        super().__set__(obj, value)
        if value is not None:
            if self.min_value is not None and value < self.min_value:
                raise ValueError(f"'{self.name}' must be >= {self.min_value}")
            if self.max_value is not None and value > self.max_value:
                raise ValueError(f"'{self.name}' must be <= {self.max_value}")


class Model:
    def __init__(self, **kwargs):
        for name, field in self.__class__._fields.items():
            if name in kwargs:
                setattr(self, name, kwargs[name])

    def __repr__(self):
        fields = ', '.join(
            f'{name}={getattr(self, name, "<?>")}'
            for name in self.__class__._fields
        )
        return f"{self.__class__.__name__}({fields})"


# --- Usage ---
class Book(Model):
    title = CharField(max_length=100)
    pages = IntegerField(min_value=1, max_value=10000)
    rating = IntegerField(min_value=1, max_value=5, required=False, default=None)


book = Book(title="Attention Is All You Need", pages=15)
print(book)  # Book(title=Attention Is All You Need, pages=15, rating=None)

book.pages = 16       # works fine
book.pages = "256"    # coerced to int via int("256")

try:
    book.title = "A" * 200  # ValueError: 'title' exceeds max_length of 100
except ValueError as e:
    print(e)

class cached_property:
    """Non-data descriptor that replaces itself with computed value."""

    def __init__(self, func):
        self.func = func
        self.attrname = func.__name__
        self.__doc__ = func.__doc__

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        val = self.func(obj)
        obj.__dict__[self.attrname] = val  # shadows the descriptor
        return val


class Dataset:
    def __init__(self, path):
        self.path = path

    @cached_property
    def data(self):
        print("Loading dataset...")  # only prints once
        return open(self.path).read()

class Typed:
    def __init__(self, expected_type):
        self.expected_type = expected_type

    def __set_name__(self, owner, name):
        self.name = name

    def __get__(self, obj, objtype=None):
        if obj is None:
            return self
        return obj.__dict__.get(self.name)

    def __set__(self, obj, value):
        if not isinstance(value, self.expected_type):
            raise TypeError(
                f"Expected {self.expected_type.__name__}, "
                f"got {type(value).__name__}"
            )
        obj.__dict__[self.name] = value


class Config:
    host = Typed(str)
    port = Typed(int)
    debug = Typed(bool)

The Art of Python Descriptors: How Django ORM Actually Works Under the Hood

Related Posts

The Protocol Behind Every @property

Data vs Non-Data Descriptors: The Lookup Chain

Reverse-Engineering Django ORM Fields

Building Your Own ORM Field from Scratch

Descriptor Patterns You Should Know

When Descriptors Beat Alternatives

Related Posts