vit_r: default (vit_r)
[personal profile] vit_r
IMG00168_Hamburg_small

Как всегда, оценки сроков оказались слишком оптимистичными.
Как всегда, самые интересные проблемы прятались до худших времён.
Как всегда, «Давайте сделаем быстро!» оказалось в конечном итоге гораздо медленнее, чем «Давайте сделаем правильно!»
Как всегда, идея плюнуть на все процессы кроме процессов отчётности породила не креативность, а бардак.
Как всегда, проблемы с архитектурой не удаётся решить хитрыми тулами.
Как всегда, рождению ребёнка ударными темпами в три месяца вместо девяти мешают технические проблемы.
Как всегда, менеджмент решил быть эффективным.

Опять приходится отвечать, что «неважную ошибку» не получится игнорировать, так как она блокирует очень важные процессы, и идея поработать в две смены, конечно, интересная, но вряд ли это снизить пиковую нагрузку на сервер.

Date: 2014-10-10 06:49 am (UTC)
From: [identity profile] orleanz.livejournal.com
Интересуют и технические подробности

Date: 2014-10-10 10:32 am (UTC)
From: [identity profile] vit-r.livejournal.com
Похоже DISTRIBUTED BY с правильными ключами не просто разгоняет запрос в сотни раз по сравнению с DISTRIBUTED RANDOMLY, но и освобождает каналы коммуникации, позволяя тяжёлым запросам гонять терабайты данных по кластеру, практически не мешая друг другу.

Одни говорят:

- А, вдруг, ключи не правильные. Ну и что, что у них «_key» в названии. Может где-то какой-то другой скрипт делает запрос по другим столбцам.

Другие просят не тратить время на производительность, когда есть более важные задачи.

В результате мудрая система автоматического тестирования забита всякой фигнёй, а крутой кластер временами пыжится две минуты, выдавая ответ на банальный SELECT из одной таблицы.

Ещё есть куча нетехнических подробностей, но они все ДСП
Edited Date: 2014-10-10 10:42 am (UTC)

Date: 2014-10-10 02:04 pm (UTC)
From: [identity profile] vit-r.livejournal.com
А есть разница?

Date: 2014-10-10 02:05 pm (UTC)
From: [identity profile] cross-join.livejournal.com
Для целей оптимизации разница между СУБДами всегда значительная, подходы разнятся. Но я для информации спросил, чтобы оценить возможности поддержки больших БД.

Date: 2014-10-10 02:10 pm (UTC)
From: [identity profile] vit-r.livejournal.com
По-моему, это от архитектуры кластеров и количества нод зависит больше, чем от названия. К тому же, это предположения, а не результаты измерений, потому что прямого доступа к админам у нас нет.

С тем случаем, который повалил кластер, тоже сначала думали, что из-за объёма данных. Оказалось, что из-за диких идей планировщика при настройках без жёстких ограничений на его фантазию.
Edited Date: 2014-10-10 02:11 pm (UTC)

Date: 2014-10-10 02:14 pm (UTC)
From: [identity profile] cross-join.livejournal.com
Прежде всего зависит от физической архитектуры хранения, терабайты ведь не в ОЗУ сидят постоянно.

Date: 2014-10-10 04:19 pm (UTC)
From: [identity profile] vit-r.livejournal.com
Фиг знает. Если тупо создать копии таблиц с правильным DISTRIBUTED BY (как это по русски), то общее время сокращается с часов до минут. Я всё-таки думаю, что там проблемы именно с коммуникацией.

Date: 2014-10-10 04:31 pm (UTC)
From: [identity profile] cross-join.livejournal.com
DISTRIBUTED BY - это нестандартное расширение, по сути это вертикальное секционирование таблицы, но не по единицам хранения (устройствам), а по единицам обработки (узлам).
Разумеется, запрос по условию с тремя колонками, разнесенных по узлам, будет выполняться быстрее, чем на одном узле.
Если узлы имеют свои независимые системы хранения, то все нормально, а если они все сидят на некотором большом массиве, то это нивелирует преимущества и может быть даже хуже, чем запрос к одному узлу с поколоночно секционированной по многим устройствам хранения таблицей.

Date: 2014-10-10 06:33 pm (UTC)
From: [identity profile] vit-r.livejournal.com
Это просто указание планировщику, как раскладывать данные для улучшения доступа.

А хуже-лучше это в любом случае гадание. Надо смотреть запросы на реальных данных.

Date: 2014-10-10 08:23 am (UTC)
From: [identity profile] gorba.livejournal.com
Гражданина Хакамада?

Date: 2014-10-10 09:21 am (UTC)
From: [identity profile] vit-r.livejournal.com
Кто это такая и к чему вопрос?

Date: 2014-10-10 09:27 am (UTC)
From: [identity profile] gorba.livejournal.com
http://www.kulichki.com/vv/pesni/opasayas-kontrrazvedki-izbegaya-zhizni.html

Profile

vit_r: default (Default)
vit_r

January 2026

S M T W T F S
    12 3
45678910
11121314151617
18192021222324
25262728293031

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags
Page generated Jan. 6th, 2026 10:04 pm
Powered by Dreamwidth Studios