GISを扱っているとよく出てくるのがラスタデータとベクタデータ。
2つともGIS(地理情報システム)における2つの主要なデータ形式で、それぞれが異なる方法で地理的情報を表現し、異なる種類の解析や可視化に使用されます。
地理空間データを取り扱う際には、その特性に基づいて使い分けられるため、ラスタデータとベクタデータ両方の特性を理解する必要があります。
しかしGISを勉強したての段階では、この2つのデータの違いについてよくわからないという方もいらっしゃるかもしれません。
そこで今回はラスタデータとベクタデータついて特徴やファイル形式、具体的な事例などをそれぞれ簡単に解説します。
ラスタデータとは
まずはラスタデータについて紹介します。
ラスタデータは画像を構成するグリッド(格子)の形で情報を表現する方法です。
この形式では地理空間が等間隔の正方形や長方形のセル(ピクセル)で分割され、それぞれのセルに値が割り当てられる形でデータを表現しています。
そのため地図全体に共通するデータである、地表温度、植生、降水量などの連続的な表現に向いています。
データの特徴
先ほども伝えたようにラスタデータは地理空間がピクセルによって連続的に表現され、各ピクセルに値が格納されるという特性を持っています。
このため、連続的な表面や連続的な現象を表現するのに適しているといえるでしょう。
データの形が連続的なため、処理が速く、地形解析や統計解析などの演算が効率的に行えるというのも特徴です。
ピクセルには色情報も含まれているため、視覚的にもわかりやすいメリットもあります。
ただ、ラスタデータはPC上における写真や動画のようにピクセル形式で表現されるためにデータ量は大きくなる傾向にあります。
そのため大規模なデータセットを表現するのに適していますが、お使いのパソコンによってはファイル容量や処理能力は大きな問題となるかもしれません。
また元は画像のデータのため、ArcGISやQGISといったGISソフトでレイヤーとして用いるときに、データの色を変更することはできないことにも注意が必要です。
一般的な画像データと同様、拡大すると画像が粗くなってしまうのもラスタデータのデメリットとなります。
狭い範囲を分析する際には気をつけなければならないデータといえるでしょう。
ファイル形式
ラスタデータはピクセルにより表現されるデータであるため、写真・画像データと同じ形式が使われます。
具体的にはGeoTIFFファイル(.tif)やJPEGファイル(.jpg)などが該当します。
主な使用例
ラスタデータはピクセルによって表現されるデータであるため、地理空間に関する画像データは全てラスタデータに含まれます。
例えば衛星画像などはラスタデータの一例です。
また特定の境界を持たず、地図空間全体に共通するデータもラスタデータとなります。
具体的には以下のようなデータが該当します。
- 降水量、気温などの気象データ
- 地表温度
- 植生
- 数値標高モデル(DEM)
これらの情報は、調査場所の各位置で、調査目的によらず記録されるためラスタデータの中に含まれます。
ベクタデータとは
ラスタデータが地図全体に連続的に存在するデータである一方、地図の特定の場所に境界線や領域が存在するのがベクタデータです。
ベクタデータは点、線、ポリゴンなどのジオメトリ要素とそれに関連する属性情報から構成され、地理的な位置とその位置に関連するデータを記述します。
地図の要素を個別に表現するため、建物の場所や道路などの複雑な地理情報を表現するのに向いています。
データの特徴
ベクタデータは先ほどもお伝えしたように点、線、面などの幾何学的な表現を行い、それに対して位置情報(緯度・経度)と属性情報(都市名・建設の名称・建築年などの場所そのものの情報)が結びついてできています。
そのためどこに何があるかを表現するのに向いているデータと言えるでしょう。
数値情報によって表され、拡大しても綺麗に表現されるのも特徴です。
地図上にある様々なベクタデータには適用される点、線、ポリゴンなどによって、それぞれに多種多様な属性情報が存在しています。
道路、建物、国境、都市などの詳細な地理的な要素を表現するのに適しているといえるでしょう。
ベクターデータはそれぞれの属性や位置に基づくものであるため、GISソフト上で色を変更したり、一部を非表示にしたりすることも可能です。
これらの情報は属性テーブルで変更できます。
またファイルの表現形式は、点、線、ポリゴンといったオブジェクトと属性情報をまとめた属性テーブルによって表現されるため、画像形式で表現されるラスタデータに比べ、ファイルの大きさは小さくなります。
そのため、同じ領域を表現する際にはラスタデータよりも詳細な地理情報を持っているにもかかわらず、データ量を少なくできるというメリットがあります。
ファイル形式
画像関連の拡張子が多いラスタデータに比べると、ベクタデータは様々な形で表現されます。
具体的には以下のようなものがあります。
- Shapefile(.shp):GISで最も一般的なファイル形式。点、線、ポリゴンなどのベクター形式を扱える
- GeoJSON(.geojson):Web上で頻繁に使われる、地理情報を基準するテキスト形式のベクターファイル
- GML(xml):地理空間データの標準化を推進しているOGC(Open Geospatial Consortium)が仕様を定めて、国際標準(ISO19136)として利用されているフォーマット
- KML (.kml):Google Earthで使用される点、ライン、ポリゴンなどを扱えるベクターファイル。3Dデータも表現可能。
またベクタデータに含まれないこともありますが、緯度経度情報を用いた点データとしてカンマ区切りのデータであるCSV(.csv)やExcelファイル(.xlsx)も地理空間分析ではよく用いられています。
主な使用例
ベクタデータは境界が明確に存在するデータについて、緯度・経度などの位置情報と建設年度や国名・都市名など様々な属性情報と一緒に表現しています。
具体的には以下のようなものが当たります。
- 道路や鉄道などの交通機関
- 市区町村、国などの行政区画
- 建物や施設の境界線
- 河川
このようにベクタデータは特定の場所や境界線などに関する属性情報を持ち合わせているのが特徴です。
地図の中から具体的なテーマに基づいて場所を設定する際には必要不可欠なデータといえるでしょう。
まとめ
ラスタデータとベクタデータについては、それぞれに以下のような違いがあります。
表現方法:ラスタデータはピクセルで連続的なデータを表現し、ベクタデータは幾何学的な要素で個別のデータを表現する。
データ量と精度:ラスタデータは大量のデータを効率的に扱えるが、ベクタデータはより詳細で精密な地理情報を表現できる。
適した用途: ラスタデータは連続的な現象や大域的な解析に、ベクタデータは具体的な地物や詳細な地理情報の表現に適している。
主な使用例:ラスタデータは衛星画像をはじめとする画像のデータや気象情報・数値標高といった地図全体に存在する連続的なデータを扱う一方で、ベクタデータは道路ネットワークや行政区画など明確な境界線が存在するデータを扱う。
拡大した時の画質:ラスタデータは拡大すると粗くなるが、ベクタデータは縮尺を変更しても綺麗に保たれる。
GISソフトでの見せ方の変更:ラスタデータは変更できないが、ベクタデータは地理空間分析がしやすいようGISソフト上で色を変更したり、一部を非表示にすることが可能である。
GISでは基本的にラスタデータとベクタデータの違いにより、データの挿入方法や設定方法などが大きく異なります。
実際に地理空間分析を行う際には、いま自分が扱っているデータがどちらにあたるのかを意識して進めるようにしましょう。
参考資料
Bonny P.McClain “Pyhon for Geospatial Data Analysis Theory, Tools, and Practice for Location Intelligence” (日本語訳:廣川類.「Pythonによる地理空間データ分析 例題で学ぶロケーションインテリジェンス」 オライリー・ジャパン,2023,p12~14)
GIS Academy.「【No.011】【GIS初心者必見】ベクタデータとラスタデータとは?ポリゴン、線、点データについて解説、ファイル形式も紹介」GIS Academy. 2023年4月30日
https://gisaca.net/vector-and-raster/(2023年12月12日取得)
いりやま|GIS芸人 @マップクエスト 国産シンプルGISのSDKメーカー. 「ラスターデータとベクターデータを理解して効率的に活用する|デジタル地図開発」.note.
2023年8月28日 09:38 https://note.com/mapquest_m/n/n893b2ad5533d(2023年12月12日取得)
中島円.「その問題、デジタル地図が解決します はじめてのGIS」ベレ出版,2021,p25~30