ОсновыНачальный

DISTINCT

Убирает дубликаты из результата запроса.

Синтаксис

SELECT DISTINCT column1, column2 FROM table;

Объяснение

SELECT DISTINCT возвращает только уникальные строки. Для этого база сортирует или хэширует результат — на больших таблицах это дорого. Если дубликаты возникают из-за JOIN или неправильной схемы — лучше исправить запрос, а не добавлять DISTINCT.

Пример

-- Уникальные страны пользователей
SELECT DISTINCT country FROM users ORDER BY country;

-- COUNT уникальных
SELECT COUNT(DISTINCT user_id) AS unique_users FROM visits;

Связанные термины

GROUP BYГруппирует строки с одинаковыми значениями для применения агрегатных функций.SELECTОсновная команда SQL для получения данных из таблицы или нескольких таблиц.

Анекдоты по теме

— Что такое шардинг? — Горизонтальное масштабирование: данные разбиваются на несколько серверов. — Как выбрать ключ шардирования? — Так, чтобы данные распределялись равномерно и запросы касались одного шарда. — Пример плохого ключа? — Статус заказа: большинство 'pending' — один шард перегружен. — Хороший? — user_id с хэшированием.

— Как понять, что ты начинающий? — Ты ставишь LIMIT 10, а база всё равно думает минуту. Опытный ставит правильный индекс и не ждёт.

— Что такое Bitmap Scan? — Промежуточный шаг. PostgreSQL сначала собирает битмап нужных страниц через индекс, потом читает страницы по порядку. — Зачем? — Когда строк много для Index Scan, но мало для Seq Scan. Лучший I/O паттерн. — Три метода: Seq Scan, Index Scan, Bitmap Index Scan. Оптимизатор выбирает.

Все анекдоты →

Потренироваться →← Все термины