Guler〔uの頭に¨〕 et al.(2002)による〔『Evaluation of graphical and multivariate statistical methods for classification of water chemistry data』(455p)から〕

『水質化学データの分類のための図的および多変数統計的方法の評価』


Abstract
 A robust classification scheme for partitioning water chemistry samples into homogeneous groups is an important tool for the characterization of hydrologic systems. In this paper we test the performance of the many available graphical and statistical methodologies used to classify water samples including: Collins bar diagram, pie diagram, Stiff pattern diagram, Schoeller plot, Piper diagram, Q-mode hierarchical cluster analysis, K-means clustering, principal components analysis, and fuzzy k-means clustering. All the methods are discussed and compared as to their ability to cluster, ease of use, and ease of interpretation. In addition, several issues related to data preparation, database editing, data-gap filling, data screening, and data quality assurance are discussed and a database construction methodology is presented.
 The use of graphical techniques proved to have limitations compared with the multivariate methods for large data sets. Principal components analysis is useful for data reduction and to assess the continuity/overlap of clusters or clustering/similarities in the data. The most efficient grouping was achieved by statistical clustering techniques. However, these techniques do not provide information on the chemistry of the statistical groups. The combination of graphical and statistical techniques provides a consistent and objective means to classify large numbers of samples while retaining the ease of classic graphical presentations.

Keywords: Classification techniques; Cluster analysis; Database construction; Fuzzy k-means clustering, Water chemistry』

『水質化学試料を均等なグループに分けるしっかりした分類案は、水系の特徴づけのための重要な手段である。本論文で我々は、コリンズバー図、パイ図、スティフパターン図、ショーラープロット、パイパー図、Q-モード階層クラスター分析、K-平均クラスター法、主成分分析、およびファジーk-平均クラスター法を含む、水試料を分類するのに使われる多くの有効な図的および統計的方法の性能を試験している。すべての方法が議論され、クラスター化を行う能力、使い易さ、および理解し易さに関して比較されている。さらに、データ解釈、データベース編集、データ-ギャップフィリング、データスクリーニングおよびデータの質保証に関連するいくつかの問題が議論され、データベース構築法が示されている。
 図的手法の使用は、大きなデータセットに対して多変量法と比べ限界があることがわかった。主成分分析はデータの整理編集ならびにクラスターの連続性/重複あるいはデータにおけるクラスター化/類似点の評価に役立つ。最も効果的なグループ分けは統計的クラスター化手法により達成された。しかし、これらの手法は統計グループの化学的性質についての情報は与えない。図的と統計的手法を組み合わせると、伝統的な図的表現のし易さを残しながら、多くの試料を分類するための矛盾のない客観的な手段を提供する。』

Introduction
 Hydrogeologic setting
Methods
 Database editing
  Censored values
  Data-gap filling procedures−estimation of the missing values
  Charge balance error
  Data screening
Results
 Graphical methods
 Multivariate statistical techniques
 Fuzzy k-means clustering
Discussion
Summary and conclusions
Acknowledgements
References


戻る