Анализ данных в Google BigQuery

Google BigQuery - облачная СУБД от Google, данные в которой хранятся в таблицах, объединенных в датасеты. Позвользователи Google Analytics Premium могут настроить стриминг данных из гугл аналитики в BigQuery и создавать отчеты на любом их двух поддерживаемых диалектов (Standard SQL и Legacy) с высокой точностью подсчета и без семплирования. Для автоматизации запросов и выгрузки данных на постоянной основе в отчеты возможно использовать расширения для Google Spreadsheets или же написать самостоятельный скрипт в Google Apps Script. В разделе собраны уроки по работе с Google BigQuery, тонкости составления эффективных и понятных SQL запросов к данным из Google Analytics и Firebase.

0x0b приемов работы с BigQuery на Standard SQL

Как шутят сами представители Google — когда у пользователя возникает проблема с BigQuery, он может написать в поддержку, позвонить персональному менеджеру или запостить вопрос на stackoverflow.com. Угадайте, в каком случае ответ появится быстрее?

Далее →

Массовое обновление таблиц в Google BigQuery

Если читатель часто и много работает с BigQuery, то читатель наверняка хотя бы раз сталкивался с необходимостью обновить данные в таблице. Для этого диалект Standard SQL поддерживает Data Manipulation Language, позволяющий вставлять, удалять и обновлять данные. Но что, если читателю требуется изменить данные сразу в большом датасете с кучей таблиц за несколько месяцев? В этом случае документация BigQuery читателя пошлет:

DML statements that modify partitioned tables are not yet supported.
BigQuery

А я в данной статье рассказываю, как просто решить эту задачу.

Далее →