Реальная база готовых
студенческих работ

Авторам Вопрос-ответ

Узнайте стоимость индивидуальной работы!

Тип задания

Предмет

Ваше имя

Вы нашли то, что искали?

Да, спасибо!

Нет, пока не нашел

Узнайте стоимость индивидуальной работы

Тип задания

Предмет

Ваше имя

это быстро и бесплатно

Оформите заказ сейчас и получите скидку 100 руб.!

Тип задания

Предмет

Ваше имя

Превращение масштабных данных из проблемы в актив

Тип Статья

Предмет Базы данных

ID (номер) заказа
2411096

Просмотров

784

Размер файла

55.45 Кб

Ознакомительный фрагмент работы:

GeoSpock проектирует, разрабатывает и поставляет GeoSpock DB - уникальную облачную аналитическую базу данных, предназначенную для запросов к очень масштабным наборам данных. Основанная на ведущей мировой технологии, разработанной в Кембридже, GeoSpock DB представляет собой высокопроизводительную базу данных любого масштаба, позволяющую выполнять сложную аналитику в реальном мире. GeoSpock DB может обеспечить будущее умных городов, умных стран, Интернета вещей и подключенных транспортных средств.
История
GeoSpock был основан в 2013 году доктором Стивом Маршем, когда он читал докторскую диссертацию по компьютерным наукам в Кембриджском университете. Идея GeoSpock пришла к Стиву во время создания суперкомпьютера, имитирующего человеческий мозг, с использованием основанных на биологии массивно-параллельных архитектур - концепция, которая до сих пор лежит в основе дизайна GeoSpock DB.
В мире, который все больше ориентируется на данные, все больше и больше данных о физическом мире генерируется машинами с помощью датчиков Интернета вещей и мобильных устройств. GeoSpock работает над тем, чтобы аналитика данных приносила максимальную пользу, обеспечивая динамический контекстный анализ, даже когда данные обширны, разнообразны и сложны. Способность получать аналитические данные в режиме реального времени - за секунды, а не за недели при использовании существующих решений - означает, что можно использовать новые приложения, отвечать на сложные вопросы и оперативно принимать оптимальные решения.
Управление данными
Экспоненциальный рост глобальной экосистемы Интернета вещей (IoT) приводит к взрывному росту геопространственных данных. Экстремальные данные быстро становятся нормой - гигабайты превосходят терабайты, которые уже заменяются петабайтами и даже эксабайтами.
По мере того, как организации стремятся измерять, анализировать и понимать все больше и больше аспектов своей деятельности, жизненно важно, чтобы они заново изобрели свой подход к управлению большими данными и информацией - в противном случае они рискуют быть захваченными непрерывным увеличением объема данных.
Инфраструктура, в которой хранятся, организованы и управляются данные, так же важна для реализации цифровых амбиций в масштабах предприятия, как и сами необработанные данные. Но унаследованные системы просто не приспособлены для работы с экстремальным возрастом данных.
Вот почему GeoSpock DB - революционно новый подход к сверхмасштабному управлению данными, специально разработанный для обеспечения высокой производительности и масштабируемости в будущем. Размещенная на доступном стандартном оборудовании, GeoSpock DB позволяет организациям исследовать и извлекать ценные сведения из массивных наборов геопространственных данных с недостижимой ранее скоростью.
Принцип работы
Современная база данных - это гораздо больше, чем простое хранилище данных. Это динамичный информационный центр в центре цифровой инфраструктуры организации. Как и их аналоги в физической инфраструктуре, лучшие базы данных являются инструментами, способствующими максимально быстрому и эффективному обмену данными и аналитическими данными в рамках организации.
Два основных потока данных, которые имеют решающее значение для всех операций с базой данных, - это захват и запрос. Оба требуют взаимодействия с большими объемами данных - и для максимальной производительности оба должны выполняться на высокой скорости без увеличения затрат.
Когда дело доходит до приема, GeoSpock DB позволяет встраивать терабайты данных так быстро - и таким рентабельным способом - что полностью меняет взаимодействие организации с данными. Больше никаких сокращений или агрегации, удаления данных еще до того, как они смогут создать ценность. Все данные могут быть доступны в одном месте в мгновение ока.
А когда дело доходит до запросов, GeoSpock DB позволяет отвечать даже на самые сложные вопросы по самым большим наборам данных быстрее и дешевле, чем когда-либо прежде, обеспечивая наличие критически важной информации, необходимой для принятия решений, основанных на фактах, тогда, когда она вам нужна. Эта уникальная производительность переопределяет организационный подход к аналитике данных, поддерживая инновации и обеспечивая понимание для решения самых сложных проблем.
Чтобы поместить вещи в контекст, GeoSpock DB позволяет получать данные экстремального масштаба, эквивалентные целому году общегородских дорожных событий, менее чем за один ночной пробег. Затем те же самые данные могут быть запрошены с одинаково высокой скоростью и эффективностью, возвращая результаты из миллиардов строк данных меньше, чем за время, необходимое для покупки чашки кофе. Запрос тоже будет стоить меньше, чем чашка кофе.
А ее масштабируемость означает, что при увеличении объемов данных можно положиться на GeoSpock DB, чтобы обеспечить такой же высокий уровень производительности - преобразование ваших чрезвычайно масштабных данных из организационной проблемы в актив.
Пример таблицы (с визуализациями Kepler.gl)
Connecting Tableau to GeoSpock DB
Чтобы подключиться к GeoSpock DB, используйте драйвер Presto от Tableau, который может потребоваться установить. Обратитесь к этой документации Tableau для получения более подробной информации. Запустите Tableau и в разделе «Подключить» выберите «Presto». Заполните следующую информацию о подключении:
Параметр Значение
ServerYour GeoSpock DB deployment’s SQL access hostsname –sqlaccess.geospock.example.com
Port8446
CataloggeospockSchemaLeave this field blankAuthenticationLDAP
UsernameYour GeoSpock DB account username
PasswordYour GeoSpock DB account password
Require SSL EnabledНастройте базовый запрос, который мы будем использовать в этом тематическом исследовании в качестве источника данных. В этом случае мы визуализируем твиты от второго ноября, для чего мы можем использовать следующий запрос:
SELECT event.* FROM geospock.default.tweet AS event
WHERE event."timestamp" BETWEEN TIMESTAMP '2012-11-02 00:00:00' AND TIMESTAMP '2012-11-02 23:59:59'
Выполнение SQL-запроса
Первый запрос в этом тематическом исследовании позволяет визуализировать, откуда были отправлены твиты за один день. Перейдите к первому листу - вы должны увидеть все столбцы из набора данных твитов, отображаемых на вкладке «Данные» в левой части интерфейса таблицы. Поля широты и долготы неправильно классифицируются как меры. Перетащите их в область «Размеры», чтобы реклассифицировать их как измерения, чтобы мы могли использовать их для визуализации того, откуда был отправлен твит.
(КАРТИНКА https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/lat_long_dimensions.png )Перетаскивание этих размеров на лист данных автоматически переключает формат отображения на карту символов, которая выглядит следующим образом:
(КАРТИНКА https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/symbol_map.png )Визуализация результатов запроса на карте Kepler.glЧтобы визуализировать ту же карту в Kepler, создайте новую панель инструментов и поместите на нее новый лист. Перетащите объект Extension с панели Objects на панель инструментов рядом с ним:
(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/add_object.png )Выберите расширение Kepler.gl в разделе «Мои расширения», сначала загрузив его из галереи расширений, если вы еще этого не сделали, и на вашу панель управления должен быть добавлен объект расширения «Kepler.gl within Tableau»:
(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/unconfigured_extension.png )Чтобы настроить расширение Kepler для отображения ваших данных, подключите его к созданному вами листу и добавьте свой ключ API MapBox (если он у вас есть). Учтите, что данные пока не появятся на карте - режим точек Кеплера несовместим. Преобразуйте слой в режим Hexbin, установив радиус шестиугольника на 100 км, чтобы точки данных можно было отображать следующим образом:
(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/query_one_layer.png )(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/query_one_output.png )
Просмотр Парижа
В следующем запросе мы сосредоточимся на твитах, исходящих из города Парижа. Создайте новый источник данных и создайте новый запрос следующим образом:
SELECT event.* FROM geospock.default.tweet AS event
WHERE st_within(st_point(event.longitude, event.latitude), st_geometryfromtext('POLYGON ((2.225 48.854, 2.250 48.881, 2.320 48.901, 2.396 48.900, 2.410 48.881, 2.412 48.8333, 2.356 48.815, 2.225 48.854))'))
Создайте новый лист и добавьте расширение Kepler для визуализации точек, как описано в предыдущем разделе. Настройте поля долготы и широты и установите цветовую окраску точек для использования поля tweet_artistid, перетащив его из «Размеры» в поле «Метки» следующим образом:
(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/query_two_map.png )Итак, вы можете добавить эту функцию на панель управления, щелкните правой кнопкой мыши tweet_artistid и выберите Показать фильтр. Добавьте лист на свою панель управления, как и раньше, но используйте размер шестигранника по умолчанию.
(https://github.com/GeoSpock/examples/raw/master/tableau-kepler/resources/query_two_result.png )Обратите внимание, что вы можете использовать фильтр в правом верхнем углу, чтобы отфильтровать данные, поступающие в Kepler.
Сравнение твитов из Парижа и остального мира
Следующий запрос исследует, популярен ли художник в остальном мире, а также в Париже.
Создайте источник данных с помощью следующего запроса:
SELECT event.* FROM geospock.default.tweet AS event
WHERE tweet_artistid = '356772' AND event.timestamp BETWEEN TIMESTAMP '2012-11-01 00:00:00' AND TIMESTAMP '2012-12-01 00:00:00'
Используйте те же шаги, что и выше, для визуализации новых результатов. Похоже, что художник более популярен в Европе, чем за пределами Европы, но по размеру по умолчанию сказать сложно. Кеплер предоставляет нам инструмент для более тщательного изучения этого вопроса. Измените режим отображения на Hexbin и увеличьте размер hexbin до 1000 км. Это покажет, что данный художник действительно непропорционально популярен в Западной континентальной Европе.
Использование базы данных на предприятиях
Данные - это сердцебиение современного предприятия. С помощью данных организации узнают больше о своей среде, своей деятельности и своих клиентах. Поэтому неудивительно, что все больше и больше организаций ставят данные в центр своей коммерческой стратегии.
Как центральный компонент цифрового предприятия, база данных так же важна, как и сами данные, в реализации цифровых амбиций организации. База данных хранит, связывает и объединяет различные потоки, каналы и источники информации, помогая организациям превращать данные в решения, а идеи - в действия.
По мере того, как экстремальные среды данных становятся обычным явлением, организациям требуется столь же экстремальная производительность баз данных - и именно поэтому мы создали нашу уникальную экстремально масштабную пространственно-временную базу данных GeoSpock DB.
Чтобы проиллюстрировать, что он может сделать, были смоделированы годовые данные о дорожном движении для всего города, чтобы создать чрезвычайно масштабный набор данных, способный бросить вызов возможностям даже самых ориентированных на данные организаций. Четыре миллиона ежедневных поездок на шести различных типах транспортных средств были нанесены на карту по основным дорогам Сингапура. При среднем времени в пути 15 минут и интервале выборки в одну секунду это позволило создать действительно экстремальный набор данных - размером 108 Тбайт и содержащий 1,3 триллиона уникальных строк.
GeoSpock DB использовали для приема данных и их подмножеств, чтобы понять скорость, масштабируемость и стоимость во всем диапазоне масштабов данных. Лучшая загрузка позволяет быстрее доставить больше данных туда, где они больше всего нужны. И лучший глоток делает это без увеличения затрат. Это означает меньше времени, затрачиваемого на обработку, агрегирование и уменьшение размера данных - и больше времени на создание из них ценности.
Эффективность работы
Чтобы протестировать GeoSpock DB, было проведено несколько тестов с наборами данных разного размера, чтобы оценить производительность во всем спектре масштабов корпоративных данных. Использование ресурсов облака позволяет GeoSpock DB масштабировать свои ресурсы в соответствии с размером проблемы данных, поэтому тесты также включали результаты из машинных кластеров переменного размера.
В результате GeoSpock DB успешно принимала данные во всех масштабах. Самый большой набор данных - 1,3 триллиона строк, представляющих 1,46 миллиона поездок на автомобиле - был загружен со скоростью всего 0,7 доллара за час ЦП, точно так же, как и у самого маленького набора данных.
Достигнута высокая скорость приема (1,29 миллиарда строк на машину в час), которая остается высокой и постоянной во всех сценариях обработки данных. Например, годовой запас поведения транспортного средства был обработан всего за 920 часов ЦП. При использовании кластера из 200 машин прием 108 Тб данных в реальном времени занял менее пяти часов - меньше, чем один ночной прогон.
Что касается стоимости, средняя скорость загрузки составила всего 0,56 доллара на миллиард строк. Даже самый большой набор данных объемом 108 ТБ стоит всего 640 долларов. Параллельные операции позволяют отделить общую стоимость от желаемой скорости, обеспечивая единую цену за загрузку для каждого набора данных - независимо от того, насколько быстро вам это нужно.
Впервые организации теперь имеют доступ к базе данных, действительно подходящей для экстремального возраста данных.
Перспективы применения
Сочетание высокой производительности, масштабируемости и экономической эффективности, обеспечиваемое GeoSpock DB, решает противоречивые проблемы стоимости и производительности, связанные с требованиями современных предприятий к крупномасштабным геопространственным данным. GeoSpock DB, созданный для частного хостинга в облаке AWS, специализируется на анализе наборов данных экстремальных геопространственных, временных данных, точек интереса (PoI) и устройств, представляющих интерес (DoI).
GeoSpock DB использует собственный механизм базы данных для обеспечения эффективного хранения, объединения данных и быстрого программного доступа к данным с использованием стандартных запросов ANSI SQL и соединителей JDBC. Пользователи могут выполнять глубокий анализ и обмениваться информацией с помощью знакомых наборов инструментов с поддержкой plug-and-play для распространенных инструментов бизнес-аналитики, таких как Tableau ™, Amazon QuickSight ™ и Microsoft Power BI ™, а также сред для анализа данных и машинного обучения, включая Python Notebooks. и Apache Spark.
База данных также может быть интегрирована с проприетарными приложениями, веб-сервисами и внутренними инструментами - с совместимостью с открытыми и настраиваемыми библиотеками визуализации, такими как Kepler и Cesium.js.
Основываясь на новаторском запатентованном механизме индексирования, GeoSpock DB открывает возможности для создания ценности в экстремальных средах данных и снижает сложность для быстрой и экономичной аналитики. Он обещает изменить способ воплощения данных в жизнь - выявить скрытые закономерности, предлагающие немедленные преимущества для бизнеса.
Литература:
https://geospock.com/en/product/
https://www.glassdoor.com/Location/All-GeoSpock-Office-Locations-E1623573.htmhttps://www.capterra.com/p/194529/Geospock/https://github.com/GeoSpockhttps://www.glassdoor.co.uk/Overview/Working-at-GeoSpock-EI_IE1623573.11,19.htmhttps://github.com/GeoSpock/examples

Смотреть

Нет нужной работы в каталоге?

Сделайте индивидуальный заказ на нашем сервисе. Там эксперты помогают с учебой без посредников Разместите задание – сайт бесплатно отправит его исполнителя, и они предложат цены.

Вы работаете с экспертами напрямую. Поэтому стоимость работ приятно вас удивит

Исполнитель внесет нужные правки в работу по вашему требованию без доплат. Корректировки в максимально короткие сроки

Если работа вас не устроит – мы вернем 100% суммы заказа

Наши менеджеры всегда на связи и оперативно решат любую проблему

К работе допускаются только проверенные специалисты с высшим образованием. Проверяем диплом на оценки «хорошо» и «отлично»

1 000 +

Новых работ ежедневно

Требуются доработки?
Они включены в стоимость работы

Работы выполняют эксперты в своём деле. Они ценят свою репутацию, поэтому результат выполненной работы гарантирован

Математика

История

Экономика

159599
рейтинг

3275
работ сдано

1404
отзывов

Математика

Физика

История

157252
рейтинг

6079
работ сдано

2741
отзывов

Химия

Экономика

Биология

105734
рейтинг

2110
работ сдано

1318
отзывов

Высшая математика

Информатика

Геодезия

62710
рейтинг

1046
работ сдано

598
отзывов

Тип работы

СПбГУ

Исполнитель проделала прекрасную работу, выполнила раньше срока! Очень ей благодарна!

ГУП

Всегда заказываю статьи, работы выполнены идеально с высокой оригинальностью)))

СПбГЭТУ «ЛЭТИ»

Спасибо большое Анастасии за качественную статью в научный журнал! Справилась на отлично!

Последние размещённые задания

Ежедневно эксперты готовы работать над 1000 заданиями. Контролируйте процесс написания работы в режиме онлайн

Выполнить 3 лабораторные

Лабораторная, Химия

Срок сдачи к 10 авг.

2 минуты назад

Отчёт по практике

Отчет по практике, Идо педагогическая практика, 44.03.01 педагогика, физическая культура, спорт и фитнес

Срок сдачи к 30 сент.

3 минуты назад

Оформить доклад для международной научной конференции в соответствии с...

Доклад, Юриспруденция

Срок сдачи к 9 авг.

3 минуты назад

Выполнить 3 лабораторные работы

Лабораторная, Основы инженерной химии

Срок сдачи к 10 авг.

3 минуты назад

Хорошо учиться

Онлайн-помощь, Физкультура

Срок сдачи к 29 авг.

4 минуты назад

Написать практико ориентированную работу по психологии В-01730

Отчет по практике, Психология

Срок сдачи к 9 авг.

5 минут назад

Сделать 9 красивых, современных презентаций по заранее подготовленному...

Другое, Бренд и инструменты для продвижения социальных проектов

Срок сдачи к 23 авг.

6 минут назад

Ответить на вопросы 60 вопросов

Ответы на билеты, Безопасность в чрезвычайных ситуациях

Срок сдачи к 7 авг.

6 минут назад

Анализ качества электроэнергии и разработка методов его повышения

Диплом, Технические дисциплины

Срок сдачи к 30 сент.

6 минут назад

Написать творческое задание по критериям

Другое, Юриспруденция

Срок сдачи к 7 авг.

6 минут назад

сделать отчет по практике

Отчет по практике, Строительство

Срок сдачи к 7 авг.

6 минут назад

Сделать контрольную работу 11 заданий

Контрольная, Электротехника

Срок сдачи к 17 авг.

8 минут назад

Ответить раскрыто на 58 вопросов

Ответы на билеты, Философия

Срок сдачи к 7 авг.

8 минут назад

Мировая валютная система, валютный рынок и валютный курс 30 страниц...

Курсовая, Макроэкономика

Срок сдачи к 4 авг.

9 минут назад

gyigiukh ih loj;ok'

Реферат, История

Срок сдачи к 26 авг.

9 минут назад

Внешние и внутренние угрозы кадровой безопасности ооо «адвирос»

Курсовая, Управление кадровой безопасностью организации

Срок сдачи к 30 сент.

11 минут назад

Вариант 4 Тема: 12-этажный монолитный жилой дом с мансардным этажом

Курсовая, Организация, планирование и управление строительством

Срок сдачи к 17 авг.

11 минут назад

Экономический анализ и управление производством

Самостоятельная работа, Экономический анализ и управление производством

Срок сдачи к 5 авг.

11 минут назад

Закажи индивидуальную работу за 1 минуту!

Размещенные на сайт контрольные, курсовые и иные категории работ (далее — Работы) и их содержимое предназначены исключительно для ознакомления, без целей коммерческого использования. Все права в отношении Работ и их содержимого принадлежат их законным правообладателям. Любое их использование возможно лишь с согласия законных правообладателей. Администрация сайта не несет ответственности за возможный вред и/или убытки, возникшие в связи с использованием Работ и их содержимого.