ユーザーガイド
ラマン分光分析アプリケーションの完全な使用マニュアル
📖 このガイドについて
このユーザーガイドは、アプリケーションのすべての機能と機能性の包括的なドキュメントです。初心者から上級者まで、すべてのユーザーがアプリケーションを最大限に活用できるように設計されています。
🎯 対象読者
初心者
アプリケーションを初めて使用する場合:
中級ユーザー
基本を理解している場合:
高度な前処理 - 複雑なパイプライン(準備中)
統計分析 - グループ比較(準備中)
機械学習 - 予測モデル
ワークフロー最適化 - 効率的な分析(準備中)
上級ユーザー
すべての機能を活用したい場合:
カスタムパイプライン - 独自のワークフロー(準備中)
バッチ処理 - 大規模データセット(準備中)
プログラマティックアクセス - Pythonスクリプト(準備中)
カスタム手法 - 独自のアルゴリズム(準備中)
📚 ガイドセクション
1. データ管理
CSVファイルの読み込み
データ形式と要件
バッチインポート
データ検証
グループ管理(準備中)
グループの作成と編集
サンプルの割り当て
グループの色分け
グループ情報のエクスポート
※英語版と構成を揃えるため、「プロジェクト管理」や「結果のエクスポート」の個別ページは統合しました。 必要な情報は、上記の「データのインポート」や各ガイド内の該当セクションを参照してください。
2. スペクトル処理
ベースライン補正
スムージングとノイズ除去
正規化手法
パイプラインの構築と管理
品質管理(準備中)
スペクトル品質の評価
外れ値の検出
データクリーニング
品質レポート
スペクトル操作(準備中)
トリミングとリサンプリング
数学的演算
スペクトルの結合
リファレンス減算
3. データ解析
PCA(主成分解析)
UMAP と t-SNE
クラスタリング
統計検定
可視化(準備中)
スペクトルプロット
スコアプロットとローディング
ヒートマップ
3D可視化
結果の解釈(準備中)
スコアとローディングの理解
クラスターの解釈
統計的有意性
結果のレポート作成
4. 機械学習
アルゴリズムの選択
モデルのトレーニング
クロスバリデーション
ハイパーパラメータ調整
モデル評価(準備中)
パフォーマンスメトリクス
混同行列
ROC曲線
学習曲線
予測と分類(準備中)
新しいサンプルの予測
確率の解釈
信頼区間
モデルの保存と読み込み
5. エクスポートと共有
結果のエクスポート(準備中)
データのエクスポート(CSV / XLSX / JSON / TXT / PKL)
図の保存(PNG / SVG)
レポート用フォルダ出力(例: report.txt, metadata.json)
データ共有(準備中)
プロジェクトのエクスポート
テンプレートの保存
設定の共有
協同作業
🚀 アプリケーションインターフェース
メイン画面
アプリケーションは複数のタブで構成されています:
UI の全体レイアウトは スクリーンショットで確認してください:
1. ホームタブ
機能:
アプリケーションの概要
最近のプロジェクト
クイックアクション
システム情報
クイックアクション:
新しいプロジェクト
プロジェクトを開く
サンプルデータをロード
ドキュメントを開く
2. データパッケージタブ
機能:
データのインポート
スペクトルの表示
グループ管理
データ情報
主要コンポーネント:
主要コンポーネント(実画面)はスクリーンショットを参照してください:
3. 前処理タブ
機能:
前処理ステップの追加
パラメータの設定
プレビュー
パイプラインの管理
ワークフロー:
選択したスペクトル
↓
[ステップ1: AsLS] [パラメータ] [プレビュー]
↓
[ステップ2: スムージング] [パラメータ] [プレビュー]
↓
[ステップ3: 正規化] [パラメータ] [プレビュー]
↓
[適用] [保存] [リセット]
4. 分析タブ
機能:
分析手法の選択
パラメータの設定
結果の表示
エクスポート
レイアウト:
レイアウト(実画面)はスクリーンショットを参照してください:
5. 機械学習タブ
機能:
アルゴリズムの選択
トレーニング設定
モデルの評価
予測
ワークフロー:
データ準備
↓
アルゴリズム選択 → [SVM] [Random Forest] [XGBoost]
↓
トレーニング設定 → [CV] [テスト分割] [パラメータ]
↓
トレーニング実行 → [進行状況バー]
↓
結果評価 → [混同行列] [メトリクス] [曲線]
↓
[モデル保存] [予測] [エクスポート]
🔧 一般的なワークフロー
ワークフロー1: 基本的な探索的分析
flowchart LR
A[データのインポート] --> B[グループ作成]
B --> C[前処理適用]
C --> D[PCA実行]
D --> E[スコア/ローディング確認]
E --> F[結果エクスポート]
詳細手順:
データのインポート(2分)
データパッケージ → ファイルをインポート → CSV選択 → ロード
グループの作成(1分)
グループ管理 → 新規グループ → 名前入力 → サンプル割り当て
前処理(3分)
前処理 → ステップ追加 → AsLS → パラメータ設定 → 適用
PCA実行(1分)
分析 → PCA選択 → 成分数設定 → 実行
結果確認(2分)
スコアプロット確認 → ローディング確認 → 説明分散確認
エクスポート(1分)
エクスポート → フォーマット選択 → 保存
所要時間: 10分
難易度: 初級
ワークフロー2: グループ比較
flowchart LR
A[ラベル付きデータロード] --> B[グループ定義]
B --> C[前処理パイプライン]
C --> D[統計検定選択]
D --> E[検定実行]
E --> F[有意な波数特定]
F --> G[レポート生成]
詳細手順:
データ準備(5分)
複数のグループ(少なくとも2つ)
各グループ少なくとも3サンプル
適切なラベル付け
前処理(5分)
推奨パイプライン: - AsLS (lambda=100000) - Savitzky-Golay (window=11, polyorder=3) - SNV
統計検定(3分)
2グループ: t検定
3+グループ: ANOVA
有意水準: 0.05
結果解釈(5分)
p値を確認
効果量を評価
有意な波数を特定
レポート作成(2分)
統計表をエクスポート
図を保存
解釈を文書化
所要時間: 20分
難易度: 中級
ワークフロー3: 機械学習分類
flowchart TD
A[訓練データをロード] --> B[前処理を最適化]
B --> C[データを分割]
C --> D[モデルを選択]
D --> E[トレーニング]
E --> F[クロスバリデーション]
F --> G[テストセットで評価]
G --> H[モデル保存]
H --> I[新データ予測]
詳細手順:
訓練データをロード(5分)
目的変数(クラス/ラベル)が付与されたデータを準備
欠損やラベル不整合がないか確認
前処理最適化(15分)
複数のパイプラインを試す: - パイプライン1: AsLS + ベクトルノルム - パイプライン2: AirPLS + SNV - パイプライン3: AsLS + 微分 + 正規化 最適なパイプラインを選択
モデル選択(10分)
アルゴリズムを比較: - SVM - Random Forest - XGBoost - ロジスティック回帰
トレーニングと評価(15分)
各モデルについて: - 5-fold クロスバリデーション - ハイパーパラメータ調整 - テストセットで評価
最適モデルの選択(5分)
精度を比較
混同行列を確認
ROC-AUCを評価
デプロイメント(5分)
モデルを保存
予測関数を作成
ドキュメント作成
所要時間: 60分
難易度: 上級
💡 ベストプラクティス
データ管理
✅ 推奨事項
一貫したファイル命名
良い例: - sample_001_group_A.csv - sample_002_group_A.csv - sample_003_group_B.csv 悪い例: - data.csv - test.csv - final_final_v2.csv
メタデータの保持
測定日
測定条件
サンプル情報
前処理履歴
バックアップ戦略
定期的なバックアップ: - 日次: プロジェクトファイル - 週次: 完全なバックアップ - 月次: アーカイブ
バージョン管理
プロジェクトバージョン番号
変更履歴
分析ログ
❌ 避けるべき事項
元データの上書き
不明確なファイル名
バックアップなしの分析
メタデータの欠落
前処理
✅ 推奨事項
段階的アプローチ
1. 基本的な前処理から開始 2. プレビューで効果を確認 3. 必要に応じて追加のステップ 4. パラメータを最適化
パイプラインテンプレート
用途別テンプレート: - 生物医学: AsLS + SNV + 微分 - 材料科学: AirPLS + ベクトルノルム - 品質管理: AsLS + Savitzky-Golay + MSC
パラメータ文書化
すべてのステップを記録
パラメータ値を保存
理由を文書化
検証
各ステップ後に確認: - ベースラインが平坦か - ピークが保持されているか - ノイズが減少しているか - スケールが適切か
❌ 避けるべき事項
プレビューなしの適用
過度な処理
パラメータの無記録
検証の欠如
分析
✅ 推奨事項
探索的分析から開始
1. PCAで全体像を把握 2. 外れ値を特定 3. グループ分離を確認 4. 詳細分析を計画
複数の手法を使用
相補的な分析: - PCA + クラスタリング - UMAP + 統計検定 - PCA + 機械学習
結果の検証
視覚的検証
統計的検証
生物学的/化学的妥当性
再現性の確保
すべてを記録: - 使用した手法 - パラメータ設定 - 結果の解釈 - 結論
❌ 避けるべき事項
単一の分析手法に依存
視覚的検証の欠如
結果の過度な解釈
再現性の無視
機械学習
✅ 推奨事項
適切なデータ分割
推奨分割: - 訓練: 70% - 検証: 15%(ハイパーパラメータ調整用) - テスト: 15%(最終評価用)
クロスバリデーション
必須の使用: - 5-fold または 10-fold CV - 層化サンプリング - 複数回実行して平均化
複数のメトリクス
総合評価: - 精度 - 精密度、再現率、F1スコア - ROC-AUC - 混同行列
過学習の監視
チェック項目: - 訓練 vs テスト精度の差 - 学習曲線 - 正則化の使用
❌ 避けるべき事項
データ分割なし
クロスバリデーションの欠如
単一メトリクスに依存
過学習の無視
🎯 ユースケース別ガイド
ユースケース1: 研究開発
目的: 新しい化合物の特性評価
推奨ワークフロー:
データ収集とグループ化
包括的な前処理
探索的分析(PCA, UMAP)
統計的比較
詳細なレポート作成
重点事項:
再現性
統計的厳密性
出版品質の図
詳細な文書化
ユースケース2: 品質管理
目的: 製品の一貫性確認
推奨ワークフロー:
標準スペクトルの確立
自動前処理パイプライン
類似度計算
合格/不合格判定
トレンド監視
重点事項:
速度と効率
自動化
明確な基準
トレーサビリティ
ユースケース3: 医療診断
目的: バイオマーカーの検出と分類
推奨ワークフロー:
臨床サンプルの収集
標準化された前処理
機械学習分類
性能検証
診断レポート
重点事項:
高精度
感度と特異度
臨床的妥当性
規制準拠
ユースケース4: 教育
目的: ラマン分光法の教育
推奨ワークフロー:
サンプルデータの使用
段階的なチュートリアル
インタラクティブな実演
学生プロジェクト
評価とフィードバック
重点事項:
わかりやすさ
インタラクティブ性
視覚的教材
段階的な学習
🔍 高度なトピック
カスタムパイプライン
目的: 特定のニーズに合わせたワークフロー
構築方法:
要件を定義
個別のステップをテスト
順序を最適化
パラメータを調整
テンプレートとして保存
例: 蛍光除去特化パイプライン
1. AirPLS (高lambda値)
2. Whittaker スムージング
3. 一次微分
4. SNV 正規化
バッチ処理
目的: 大量のサンプルを効率的に処理
設定方法:
バッチ設定ファイルの作成
前処理パイプラインの定義
自動実行のスケジュール
結果の自動エクスポート
利点:
時間節約
一貫性
エラー削減
スケーラビリティ
プログラマティックアクセス
現時点では、安定したPython API / CLIは提供していません。 自動化が必要な場合は、GUI上の「フォルダ読み込み」や各タブのエクスポート機能をご利用ください(将来的に拡充予定)。
📊 データ形式
入力形式
CSVフォーマット(推奨):
Wavenumber,Sample1,Sample2,Sample3
400.0,0.123,0.145,0.112
401.0,0.134,0.156,0.123
402.0,0.145,0.167,0.134
...
要件:
ヘッダー行必須
第1列: 波数
以降の列: サンプル強度
数値データのみ
TXTフォーマット:
# コメント行
400.0 0.123 0.145 0.112
401.0 0.134 0.156 0.123
402.0 0.145 0.167 0.134
...
ASC/ASCIIフォーマット:
.asc/.ascii一般的なテキスト形式(スペース/タブ区切り)
PKLフォーマット:
.pklアプリ内のデータを再利用するための保存形式(Python pickle)
出力形式
データ:
CSV / XLSX / JSON / TXT / PKL
画像(プロット):
PNG / SVG
レポート:
PDF出力は現時点では未対応です
レポート用フォルダ(テキスト+メタデータ+画像など)として出力される場合があります
🆘 ヘルプとサポート
ドキュメントリソース
クイックスタート - 迅速な開始
はじめに - セットアップと基本の流れ
分析手法 - 手法の詳細
FAQ - よくある質問
トラブルシューティング - 問題解決
コミュニティサポート
GitHub Discussions / Issues(プロジェクトリポジトリ)
フィードバック
アプリケーションの改善にご協力ください:
機能リクエスト: GitHub Issuesで提案
バグ報告: 詳細な情報を含めて報告
ドキュメント改善: プルリクエストを歓迎
🔄 次のステップ
ユーザーガイドを読んだ後:
実践: 自分のデータで試す
探索: 高度な機能を学ぶ
最適化: ワークフローを改善
共有: コミュニティに貢献
最終更新: 2026年1月24日