The Big Data hype is a reincarnation of the socialism in IT. Instead of creating small autonomous self-regulating entities Big Data adepts send all kind of junk into the Gosplan (the State Planning Committee, USSR).
The problem is not the volume, the variety or the velocity of data but that the new generation Gosplan is too far from places where data is born. Information sources cannot adapt to real needs and are forced to report everything possible but nothing usable.
Modern interfaces are created by people who sit in crowded rooms behind transparent glass walls. It is no wonder that the results of their creativity show too much unnecessary junk, cannot help with orientation and are miserably fragile.
My 3 favorite impediments to technology changes on the base level in IT.
1. Developers like incremental improvements but they are afraid of global changes.
2. Developers are unwilling to learn something what they do not understand.
3. A lot of today developers are simply unable to work with abstractions.
The problem is not the volume, the variety or the velocity of data but that the new generation Gosplan is too far from places where data is born. Information sources cannot adapt to real needs and are forced to report everything possible but nothing usable.
Modern interfaces are created by people who sit in crowded rooms behind transparent glass walls. It is no wonder that the results of their creativity show too much unnecessary junk, cannot help with orientation and are miserably fragile.
My 3 favorite impediments to technology changes on the base level in IT.
1. Developers like incremental improvements but they are afraid of global changes.
2. Developers are unwilling to learn something what they do not understand.
3. A lot of today developers are simply unable to work with abstractions.
no subject
Date: 2017-11-08 09:08 am (UTC)no subject
Date: 2017-11-08 01:40 pm (UTC)no subject
Date: 2017-11-08 02:24 pm (UTC)Моя задача не доказать миру, что я на коне и весь в белом, а пристроить куда-нибудь неприкаянные мысли. Заодно "немногочисленные посетители" могут что-то полезное сказать, а просто кинуть что-то в мир и считать лайки - это как-то грустно.
no subject
Date: 2017-11-08 02:49 pm (UTC)As an entertainment, will add that last night I figured I need commutative groups to be passed around in my new API. Not just monoids, groups! Commutative!
no subject
Date: 2017-11-08 03:55 pm (UTC)no subject
Date: 2017-11-08 07:31 pm (UTC)наоборот, это традиционные приложения ходят за данными в Центральный Распределитель Реляционной БД, согласно постановлениям, изданным Админами ЦК Партии
бигдата наоборот, строится на ДЕцентрализованном принятии решений по совместным алгоритмам, где клиенты часто и есть серверы
кластера бигдаты стараются не иметь одной точки сбоя; обработка данных в любой момент морально готова к выходу из строя нескольких узлов, прозрачно перераспределяя нагрузку на остальные узлы
а скажем оракл бд умеет масштабировать один запрос на несколько машин? а как там со сбоями дисков при исполнении? или скажем постгрес? (я в курсе, что специальные версии есть, но в общем нет)
про тему дата мартс я умолчу, но вообще-то это свой старый и богатый мир
для них бигдата это, ну, и не такое видали
а настойчивое подчёркивание дартаньяновости автора на фоне программистов-пидорасов вызывает уже некоторую неловкость
bragging how smart you are isn't exactly a pleasant show
no subject
Date: 2017-11-08 07:39 pm (UTC)no subject
Date: 2017-11-09 01:05 pm (UTC)Как вы себе это представляете?
Впрочем, умеет. И Оракл, и DB2, и даже MS SQL.
no subject
Date: 2017-11-09 03:07 pm (UTC)Видимо, вместо кластера 7/24/365 за сотню тысяч выделить сотню виртуальных убожеств, а потом попытаться запустить через них процессинг кредитных карт или датамарт предприятия с пятью десятками отделений.
no subject
Date: 2017-11-18 08:36 pm (UTC)про сотню тысяч, про сотню убожеств
минимизируется capex
сотню убожеств можно настроить и выделить через 40 минут, поюзать и выбросить
а титаник строится полгода-год и его не перепродашь
и технически устареет он через 3 года, никто не перекупит
no subject
Date: 2017-11-18 09:01 pm (UTC)Можно выбрасывать сразу. Ни для каких серьёзных задач это всё равно не годится.
и технически устареет он через 3 года, никто не перекупит
Вообще-то это работает десяток лет. Непрерывно. Постоянно. Потому что любой простой в серьёзной организации - это деньги, быстро превышающие вложения в хорошее железо.
no subject
Date: 2017-11-19 12:06 am (UTC)остальные не бывают, ну только несерьёзные и с ними никто не связывается
спасибо, для меня это новость
конець сарказма
интересно, для вас будет новостью, что 99.9% экономики -- несерьёзные организации с несерьёзными юз кейсами?
или вы себе выкололи духовные глаза 20 лет назад и не хотите видеть?
что ж, как завещал франко-эфиопско-российский гуру, не надо оспаривать знатока
no subject
Date: 2017-11-19 10:41 am (UTC)Если сайту с десятком тысяч посещений в день надо чего-то в Big Data, значит они просто не смогли найти человека, нормально разбирающегося в информационных потоках и способах их обработки.
Если смотреть, как хреново работает NoSQL и сколько там ошибок, то это лезть туда кому-то, кому кроме выпендрёжа нужно что-то ещё, совершенно не стоит.
Помнится, мы сидели с людьми из университета. Ни у кого не было такого, чтобы надо было повторять Фейсбук и Гугл. Таблицы на терабайты информации - это спокойно обходится без big data. На что-то большее просто нет реальных данных.
no subject
Date: 2017-11-18 08:32 pm (UTC)можно оракл дб, можно сиквел сервер
у дб2 да, есть спец версия с партиционированием с шэред носин, но это какой-то хай энд, который не пощупать + надо заранее продумывать и описывать
в бигдата оно без особых усилий, натурально, масштабируется само при возможности
само координируясь