Сегодня: 21 | 09 | 2020

Лекция Анализ данных в ГИС

Лекция Анализ данных в ГИС

Основные типы анализа пространственных и непространственных данных

Анализ с точки зрения ГИС – расчленение исходных данных на составные части, ее преобразование с целью получения новых данных на базе имеющихся.

Виды анализа:

Анализ пространственных данных.

Применение пространственного анализа в ГИС опирается на свойствах метричности картографической информации.

1.Картометрические операции.

Главные картометрические операции –расчет длин линий, расчет длин ломаных линий, расчет периметров полигонов, площадей, изменение масштаба, генерализация изображения, перевод из одной системы координат в другую, расчет координат центроидов полигонов, определение точности изображения.

Доп. ошибка измерений:

В городе - Fдоп=10см, в сельской местности - fдоп=20см, вне населенного пункта - fдоп=40см

2. Операции пространственной статистики изображениями:

2.1 Расчет среднего центра и стандартного радиуса для множества течек растрового изображения.

2.2 Определение характера размещения течек:

-регулярный характер

-случайный

-кластерезирующийся.

Операция сопровождается расчетом математического ожидания стандартного отклонения и коэффициентов вариации.

3.Ресчет компактности полигона, образованного ячейками растра.

Идеальная фигура - круг.- самая компактная.

4.Генерирование векторного файла на основе растрового изображения, т. е. автоматизация процесса векторизации.

3. Оверлейный анализ (Послойный анализ)

Является наиболее распространенным, наиболее технологически разработанным для всех ГИС.

Основой этого вида анализа составляет наложение двух и более картографических слоев с целью создания новых производных объектов, возникающих при наложении исходных объектов (изображений).

Главное достоинство ГИС состоит в том, что атрибутивная информация связана с пространственными объектами наследуется производными картографическими объектами в автоматическом режиме или по заданным логическим формулам.

Оверлейные операции в ГИС осуществляются на основе использования пространственной логики Буля, основанной на формализации процедуры анализа пространственного перекрытия.(рис1)

Рис1

Рис2

Исп 3

1

1+3

2

1+1

3

1+2

4

4+6

5

6+6

З/п

1

П

2

Паст

3

П

4

Злб з

Реж

1

Огр

2

Запр

3

Неогр

Рис2- при формировании производных объектов в ходе Оверлейного анализа ГИС сохраняет топологию объектов, или наследует топологию исходных объектов.

4.Анализ Географических сетей

Географическая сеть- совокупность линейных объектов природного или антропогенного происхождения, образующих систему.

Системы бывают двух видов – регулярные и нерегулярные.

Элементами географической сети являются узлы и грани (которые соединяют узлы).

Регулярными сетями являются те, в которых пространственное наложение подчиняется строго определенной математической зависимости. Целью сетевого анализа является выявление закономерностей строения географических сетей, закономерности формирования для развития сетей, мониторинг состояния сетей, управление и оптимизация сетей.

Задачи анализа географических сетей

1.представление и хранение в базе данных метрической и топологической информации по структуре сети.

2.Визуализация графических сетей в виде дисплейных карт-схем с возможностью интерактивного запроса к базе атрибутивных данных для получения информации как оп сети в целом, так и по каждому из элементов сети.

3.Анализ структуры сети на основе алгоритмов теории графов (элемент графического изображения) и построения моделей развития сети также на основе теории графов.

Тео́рия гра́фов — раздел дискретной математики, изучающий свойства графов. В наиобщем смысле граф представляется как множество вершин (узлов), соединённых рёбрами. В строгом определении графом называется такая пара множеств G={R, V}, где V есть подмножество любого счётного множества, а R - подмножество V×V.

Теория графов находит применение, например, в геоинформационных системах (ГИС). Существующие или вновь проектируемые дома, сооружения, кварталы и т. п. рассматриваются как вершины, а соединяющие их дороги, инженерные сети, линии электропередач и т. п. — как рёбра. Применение различных вычислений, производимых на таком графе, позволяет, например, найти кратчайший объездной путь или ближайший продуктовый магазин, спланировать оптимальный маршрут.

Целью изучения географических сетей является выявление закономерностей их строения, формирование и развитие, мониторинг (за текущим) и управление с точки зрения оптимизации, функционирования и управления сетей.

ГИС в сетевом анализе обеспечивает возможность компьютерного представления моделирования и анализа сколько угодно больших объектов по числу вершин и ребер.

Сетевой анализ в ГИС сопровождается тематическим картографированием, интерактивным редактированием и многообразными средствами визуализации сетевых моделей.

Основные задачи решаемые с помощью сетевого анализа в ГИС

Анализ географических сетей в ГИС осуществляется на основе использования теории графов.

1. Оптимизация пути между двумя узлами сети предполагает расчет наилучшего варианта сети между заданными начальной и намеченной вершинами графа сети с учетом целевой функции (время, расстояние, топливо, стоимость). Дополнительные возможности при решении этой задачи обеспечиваются путем внесения дополнительных ограничений и условий (указания вершин и ребер по которому обязан пройти искомый путь вершин и ребер, движения через которых запрещено).

2. Типическая задача определения радиуса допустимости фиксированного узла. Находятся и помечаются все вершины графов, расположенные в пределах установленного радиуса допустимости.

3. Поиск кратчайших маршрутов в интерактивном режиме сходно с первой задачей по содержанию, однако, данные о запретах и ограничениях узлов и ребер в сети, а также положение объекта относительно их определяется в режиме реального времени и постоянно изменяется.

4. Сценарный анализ и модификация сети. Содержание задачи – это редактирование исходной сети путем добавления новых ребер и вершин и путем придания специального статуса определенным элементам сети. Вновь образованная сеть ее варианты сохраняются в виде сценария, который может быть использован для последующего анализа, для выбора оптимального варианта сети.

5. Территориальное планирование сферы обслуживания. Суть – определение границ зон обслуживания сети сервисных центров (магазины, больницы, склады). В результате моделирование исходной сети и анализа связей происходит расчленение участков сети на ряд графов с определением центров притяжения каждого графа.

Анализ Растровых изображений

Растровые изображения в ГИС анализируются с помощью пространственно временной статистики и операций картографической алгебры.

Операции Пространственной статистики включают два вида:

Инкрементальные и зональные функции.

К инкрементальным функциям относятся следующие виды анализа:

-расчет площади участка на двумерной поверхности.

-расчет компасных направлений фронтальной поверхности ячеек на трехмерной поверхности.

-расчет направления поверхностного стока на каждую ячейку из соседних ячеек (водосборы и водоразделы)

-расчет длины границ на трехмерной поверхности ассоциированы с ячейками.

-расчет крутизны уклона для каждой ячейки на трехмерной поверхности.

-расчет длины транспортной сети, элементами которого являются растровые ячейки.

-расчет объемов образованных сечением плоскостями трехмерной поверхности.

К зональным функциям относят следующие виды анализа:

-Вычисление и идентификация уникальных комбинаций пересечений зон на различных слоях.

-Вычисление произведений сумм процентного соотношения ячеек, встречаемых в каждой зоне в различных слоях.

Картографическая алгебра

Многие пространственно-распределенные явления реально связанные между собой зависимостями ( функциональными или статистическими) , в тех случаях, когда такие зависимости не выражены явно, они - зависимости могут быть представлены, как функция пространства и времени при помощи абстрагирования, генерализации и представления сложных функций более простыми. Такого рода задачи реализуются в полнофункциональных ГИС в виде специальных модулей.

Картографическая алгебра реализуется по средством решения следующих групп функций:

1. Локальные функции, работают с индивидуальным положением ячеек путем вычисления их значений в одном или нескольких слоях изображения.

2. Фокальное значение - анализирует окружение каждой отдельно взятой ячейки и вычисляет для нее новое значение в зависимости от свойств окружения, направления радиуса процесса или типа математической операции.

3. Инкрементальные функции. Работая с анализом окружения отдельно-взятой ячейки, эти функции перевычисляют значения, как приращения одно, двух или трехмерных картографических форм. Анализ окружения вычисляется, как в одном, так и в нескольких слоях изображения.

4. Зональные функции работают с ранее определенными группами ячеек, вычисляя их новое значение на одном картографическом слое, относительно значений этих зон на других картографических слоях.

Виды непространственного анализа в ГИС

Включает группу непространственной статистики и группу стандартных арифметических и геометрических операций.

К стандартным операциям относят следующее:

1.Вычисление синуса, косинуса, тангенса, арксинуса и т. д. для каждой ячейки анализируемого слоя.

2.Сложение, вычитание, умножение, деление значений ячеек базового слоя и сравниваемых картографических слоев.

3.вычисление корня или степени для значений ячеек базового слоя в сравнении с другими слоями изображений.

4.Присвоение порядковых номеров всем ячейкам геоизображений.

5.Вычисление среднего значения ячеек в данной зоне

6. Вычисление сумм произведений , разностей ячеек в заданной зоне поиска.

7. Вычисление процента ячеек ,значение которых равны анализируемым.

8.Вычисление дистанции от ячеек производных слоев до центра ячейки в базовом слое.

9. Вычисление наиболее/наименее/средне часто встречающихся значений в заранее заданной зоне.

К группе непространственной статистики относят:

1.Расчет статистических параметров атрибутивных признаков в пределах всего изображения ( математическое ожидание, стандартное отклонение).

2.получение суммарных статистических характеристик выбранных объектов изображения (min, max, сумма, среднеарифметическое, стандартное отклонение и др.)

3.Регресионный анализ двух геоизображений. Результатом является график линий тренда, диаграмма распределений, уравнение регрессии, коэффициент корреляции и показатели значимости.

4.Выявление статистической зависимости двух геоизображений, атрибутивные признаки которых изменены в качественных шкалах. В результате строится таблица сопряженности, рассчитывается число степеней свободы и др. дополнительные статистические показатели.

5. Генерирование и построение случайных гипотетических геоизображений, построенных на основе статистических моделей распределения с заданными параметрами распределения. Эта процедура может быть реализована пространственном анализе для построения стохастической (непрерывной) поверхности с целью оценки вероятности появления определенных событий.

6. Расчет коэффициентов пространственной автокорреляции, либо всего геоизображения, либо его части.

7. Расчет среднего центра для множества точек растрового изображения.

Способы формализации пространственной информации в ГИС

Пространственные данные представляют собой информационную основу ГИС. Способы формализации (представления) этой информации является технологической основой действия ГИС.

Существует два основных вида пространственной информации: растр и вектор.

Выбор организации пространственных данных зависит от типа исходных данных от специфики решаемой задачи и от свойств компьютера.

Формализация растровых данных

Растровая модель пространственных данных (растровая модель данных) заключается в изображении пространственных объектов в виде мозаики, покрывающей всю территорию объекта.

Растровая модель представляется в идее регулярной сети, состоящей из индивидуальных ячеек, пикселей. Форма которой может существенно отличаться. Наиболее простой вариант:

-прямоугольная форма ячеек ( система)

-треугольная форма ячеек T/N применяется в программах arcmap, arcview, arcinfo и др.

-возможно шестигранное, пятигранное построение растра.

В стандартном случае в растровой модели пространственная информация кодируется в идее прямоугольной матрицы, положение каждого элемента растра в этой матрице определяется номера столбца и строки, в которой расположен этот элемент изображения. При кодировании растра, столбцы располагаются в направлении с-ю, а строки – з-в. В качестве начальной ячейки с координатами (0;0) или (1;1) чаще всего принимается ячейка в верхнем левом углу изображения.

111222

112222

222122

222112

222222

222222

Закодированное :

3.13.2

2.14.2

3.21.12.2

3.22.11.2

6.2

6.2

Большинство объектов растровой модели данных выражаются в виде иерархических моделей, в которых каждый следующий уровень связан с предыдущем, каждый вышележащий уровень обобщает информацию, содержащуюся в нижних уровнях

1- пирамидальная организация информации

2- древовидная.

При иерархическом способе формализации растровых данных, удваиваются длины сторон ячейки при переходе от одного уровня к другому, увеличение размера изображения составляет около 30 %. При пирамидальной системе формализации растровой информации, если за 1 уровень принять всю поверхность земли, то на 15 уровне разрешение составит около 20 м, а на тридцатом уровне субсантиметровое.

Растровое представление подобного типа объектов обладает отрицательными качествами, связанными с использованием больших объемов машинной памяти, поэтому в практике широко применяется сжатие растровой информации.

Модели сжатия

1. Основанная на алгоритме группового кодирования.

Групповое кодирование заключается в кодировании информации содержащейся в каждой строке исходной матрицы, с помощью пар значений, первая из которой представляет собой количество следующих друг за другом одинаковых значений кодируемого элемента.

2. Основана на присвоении значений 0 и 1 каждой из ячеек, при этом 0 соответствует ячейкам лежащим вне контура, а второе значение – 1 – ячейкам находящимся внутри контура. В этом случаи используется строчный код.

1 1,3; 2 1,2; 3 4; 4 4,5; 5 6

3. Квадротомическая структура сжатия растровой информации.

Квадродерево - представляет собой древовидный граф степень вершины которого равна 4, то есть размер ячейки каждого вышележащего уровня ровно в четыре раза больше, чем предыдущего.

1 2

Принцип кодирования растровой информации в квадротомической структуре заключается на нижележащем уровне только для пространственно неоднородных ячеек данного уровня

В сочетании с жестко – заданной архитектоникой пирамиды и отсутствием необходимости хранить информацию о незначащих фрагментах растра, обеспечивают значительную ( до 30 раз) экономию машинной памяти и позволяет осуществлять быстрый доступ к данным по ветвям квадротомического дерева.

Векторное представление метрических пространственных данных

Векторное изображение состоит из 3-х основных элементов : точка, линия, полигон., которые могут быть представлены с помощью разных типов структуризации векторных данных.

Простейшим типом представления векторных данных является тип -

1. точечной полигональной структуры.

Точечная полигональная структура предполагает табличное описание каждой точки, которая оконтуривает полигон.

ID

A

1,2,3,4,5

B

3,4,6

C

5,4,6,7

Координаты

X

Y

1

X1

Y1

2

X2

Y2

2.Следующим типом представления векторных данных в ГИС является Сегментно-топологический тип (IDME) основным элементом кодирования является точка и сегмент. Сегмент представляет собой совокупность линий начало и окончание которой фиксируется узловыми точками.

Под узловой точкой понимается точка пересечения трех и более линий.

Координаты

Х

У

1

Х1

У2

….

….

….

7

Х7

У7

Сег

Нач. т.

Кон. т.

Прав.

Полож

Левое

Полож

Точка

1

1

4

А

О

1,2,3,4

2

5

4

О

В

4,5

3

5

6

В

С

5,6

4

6

1

В

О

6,1

5

1

4

В

А

1,4

6

5

6

С

О

5,7,6

3.Код Фримена ,с помощью которого в регулярной сети квадратных полигонов задается код одного из 8 направлений, который фиксирует положение сегмента. Исходная точка кодирования задается произвольно.

11223324446677667

4. Цепное кодирование Применяется в тех случаях, когда расстояние между точками изображения настолько небольшое, что приращение координат между смежными точками выражается 10 мм и сотыми долями единицы. В этом случае записывается код координат только исходной точки, дальше записывается точка приращения координат для каждой последующей точки цепи.

5.Иерархическая система Представления векторных данных

Иерархические уровни моделей данных:

1. Уровень – M - карта

2. Полигон – Squire

3. Линия - Line

4. Точка – Point

При иерархическом представлении векторных данных топология задается принадлежностью объектов разных уровней.

6.Реляционная организация данных при которой для каждого иерархического уровня создается своя таблица содержащая данные о связях элементов изображения соседних иерархических уровней.

1.

M

A

B

2.

A

A

B

C

D

B

D

E

F

G

3.

A

1

2

B

2

3

C

3

4

D

4

1

D

1

4

В современных полнофункциональных ГИС применяется преимущественно векторно-топологическая модель кодирования данных.

Основные этапы разработки программного обеспечения для ГИС

Любая ГИС предназначена для решения конкретной задачи и опирается на существующий пакет программных продуктов. Создать универсальную ГИС пригодную для решения любых задач невозможно, поэтому существующий программный продукт подстраивается под решения конкретной задачи, создается специальный программный продукт с узкоспециальной направленностью в области ГИС. При создании новых пакетов программ стандартно выполняется несколько основных этапов:

1.анализ требований предъявляемых к системе – занимает 10% времени;

2.Определение спецификации - 10%;

3.проектирование - 15%

4.Кодирование – 20%

5.Тестирование-45%

6.Эксплуатация и сопровождение программного продукта—

Анализ требований к системе

Включает следующие вопросы:

Время обработки информации, стоимость, точность, защита от несанкционированного доступа, вероятность ошибок и прочие вопросы.

На этом этапе выясняются проблемы стоящие перед разработчиком программы, точно выявляется цель и задачи. Решаемые с помощью программного обеспечения.

Результатом первого этапа является концепция, очерчивающая общие контуры применения данного продукта.

Определение спецификации

Определяет конкретные функции исполняемые программным обеспечением, раскрывает содержание этих функций без описания технологии выполнения функций. На этом этапе задается структура входных и выходных данных, определяется структура файлов, описывается организация ввода и изъятия данных.

Проектирование

Представляет собой разработку алгоритмов, выполнение функций заданных спецификаций, разрабатывается общая структурная схема вычислительной системы, определяются время и ответственные исполнители по каждому из блоков. Создается программа выполнения работ.

Кодирование

Представляет из себя выполнение реального программирования с использованием алгоритмических языков.

Тестирование

Осуществляется в два под этапа:

-автономное тестирование

-комплексное тестирование.

Автономное - испытание созданного программного продукта по блокам, модулям на которые разбивается программа.

Комплексное - испытание всего программного продукта в разных режимах.

Словарь терминов

Данные- 1. зарегистрированные факты, описания явлений реального мира или идей, которые представляются достаточно ценными для того, чтобы их сформулировать и точно зафиксировать.

Дигитайзер - устройство для ручного цифрования картографической и графической документации в виде множества или последовательности точек, положение которых описывается прямоугольными декартовыми координатами.

Дисплей- устройство отображения с помощью которого осуществляется визуализация выводных данных.

ЗИС - земельно-информационная система представляет собой специализированную ГИС земельно-ресурсной и кадастровой направленности. В ряде случаев ЗИС подразумевает базу данных кадастровой или ресурсной специализации, не связанную с пространственными объектами.

Идентификатор- уникальный номер, присеваемый пространственному объект слоя, может присваиваться автоматически или назначаться пользователем, служит для связи позиционной и непозиционной части пространственных данных.

Интерактивная обработка- обработка данных в режиме двухстороннего диалогового взаимодействия человека (пользователя) и компьютера, обмена между последовательностью запросов (вопросов) и ответов, с целью вмешательства и управления вычислительным процессом.

Интерфейс-совокупность средств и правил, обеспечивающих взаимодействие вычислительных систем, входящих в их состав устройств, программ, а также пользователя с системой.

Информационное обеспечение- совокупность массивов информации, систем кодирования, классификации и документации, обслуживающая систему обработки данных.

Картографирование - Совокупность процессов и технологий создания карт, атласов и т. д.

Картографический метод исследования- метод научного исследования, в котором карта выступает как модель изучаемого объекта из промежуточного звена между объектом и исследователем.

Картографический образ- пространственная комбинация картографических знаков воспринимаемая читателем карты или распознающим устройством.

Картометрия- Измерения по картам.

Карта-схема- карта с неточно выдержанным масштабом и проекцией, упрощенным изображением элементов содержания.

Квадротомическое представление – Один из способов представления пространственных объектов в вид иерархической, древовидной структуры, основанный на декомпозиции пространства на квадратные участки.

Квантование - Операция преобразования данных из непрерывной формы в дискретную. 2. разбитие данных на подгруппы.

Конвертирование форматов- преобразование данных из одного формата в другой, воспринимаемый иной системой.