『Abstract
A robust classification scheme for partitioning water chemistry
samples into homogeneous groups is an important tool for the characterization
of hydrologic systems. In this paper we test the performance of
the many available graphical and statistical methodologies used
to classify water samples including: Collins bar diagram, pie
diagram, Stiff pattern diagram, Schoeller plot, Piper diagram,
Q-mode hierarchical cluster analysis, K-means clustering, principal
components analysis, and fuzzy k-means clustering. All the methods
are discussed and compared as to their ability to cluster, ease
of use, and ease of interpretation. In addition, several issues
related to data preparation, database editing, data-gap filling,
data screening, and data quality assurance are discussed and a
database construction methodology is presented.
The use of graphical techniques proved to have limitations compared
with the multivariate methods for large data sets. Principal components
analysis is useful for data reduction and to assess the continuity/overlap
of clusters or clustering/similarities in the data. The most efficient
grouping was achieved by statistical clustering techniques. However,
these techniques do not provide information on the chemistry of
the statistical groups. The combination of graphical and statistical
techniques provides a consistent and objective means to classify
large numbers of samples while retaining the ease of classic graphical
presentations.
Keywords: Classification techniques; Cluster analysis; Database
construction; Fuzzy k-means clustering, Water chemistry』
『水質化学試料を均等なグループに分けるしっかりした分類案は、水系の特徴づけのための重要な手段である。本論文で我々は、コリンズバー図、パイ図、スティフパターン図、ショーラープロット、パイパー図、Q-モード階層クラスター分析、K-平均クラスター法、主成分分析、およびファジーk-平均クラスター法を含む、水試料を分類するのに使われる多くの有効な図的および統計的方法の性能を試験している。すべての方法が議論され、クラスター化を行う能力、使い易さ、および理解し易さに関して比較されている。さらに、データ解釈、データベース編集、データ-ギャップフィリング、データスクリーニングおよびデータの質保証に関連するいくつかの問題が議論され、データベース構築法が示されている。
図的手法の使用は、大きなデータセットに対して多変量法と比べ限界があることがわかった。主成分分析はデータの整理編集ならびにクラスターの連続性/重複あるいはデータにおけるクラスター化/類似点の評価に役立つ。最も効果的なグループ分けは統計的クラスター化手法により達成された。しかし、これらの手法は統計グループの化学的性質についての情報は与えない。図的と統計的手法を組み合わせると、伝統的な図的表現のし易さを残しながら、多くの試料を分類するための矛盾のない客観的な手段を提供する。』
Introduction
Hydrogeologic setting
Methods
Database editing
Censored values
Data-gap filling procedures−estimation of the missing values
Charge balance error
Data screening
Results
Graphical methods
Multivariate statistical techniques
Fuzzy k-means clustering
Discussion
Summary and conclusions
Acknowledgements
References