# ユーザーガイド ラマン分光分析アプリケーションの完全な使用マニュアル --- ## 📖 このガイドについて このユーザーガイドは、アプリケーションのすべての機能と機能性の包括的なドキュメントです。初心者から上級者まで、すべてのユーザーがアプリケーションを最大限に活用できるように設計されています。 --- ## 🎯 対象読者 ### 初心者 アプリケーションを初めて使用する場合: 1. **[クイックスタート](../quick-start.md)** - 5分でアプリを使い始める 2. **[データのインポート](data-import.md)** - データのロードと管理 3. **[前処理](preprocessing.md)** - スペクトルの準備 4. **[分析](analysis.md)** - 最初の分析を実行 ### 中級ユーザー 基本を理解している場合: 1. **高度な前処理** - 複雑なパイプライン(準備中) 2. **統計分析** - グループ比較(準備中) 3. **[機械学習](machine-learning.md)** - 予測モデル 4. **ワークフロー最適化** - 効率的な分析(準備中) ### 上級ユーザー すべての機能を活用したい場合: 1. **カスタムパイプライン** - 独自のワークフロー(準備中) 2. **バッチ処理** - 大規模データセット(準備中) 3. **プログラマティックアクセス** - Pythonスクリプト(準備中) 4. **カスタム手法** - 独自のアルゴリズム(準備中) --- ## 📚 ガイドセクション ### 1. データ管理 **[データのインポート](data-import.md)** - CSVファイルの読み込み - データ形式と要件 - バッチインポート - データ検証 **グループ管理**(準備中) - グループの作成と編集 - サンプルの割り当て - グループの色分け - グループ情報のエクスポート ※英語版と構成を揃えるため、「プロジェクト管理」や「結果のエクスポート」の個別ページは統合しました。 必要な情報は、上記の「データのインポート」や各ガイド内の該当セクションを参照してください。 ### 2. スペクトル処理 **[前処理](preprocessing.md)** - ベースライン補正 - スムージングとノイズ除去 - 正規化手法 - パイプラインの構築と管理 **品質管理**(準備中) - スペクトル品質の評価 - 外れ値の検出 - データクリーニング - 品質レポート **スペクトル操作**(準備中) - トリミングとリサンプリング - 数学的演算 - スペクトルの結合 - リファレンス減算 ### 3. データ解析 **[解析](analysis.md)** - PCA(主成分解析) - UMAP と t-SNE - クラスタリング - 統計検定 **可視化**(準備中) - スペクトルプロット - スコアプロットとローディング - ヒートマップ - 3D可視化 **結果の解釈**(準備中) - スコアとローディングの理解 - クラスターの解釈 - 統計的有意性 - 結果のレポート作成 ### 4. 機械学習 **[機械学習](machine-learning.md)** - アルゴリズムの選択 - モデルのトレーニング - クロスバリデーション - ハイパーパラメータ調整 **モデル評価**(準備中) - パフォーマンスメトリクス - 混同行列 - ROC曲線 - 学習曲線 **予測と分類**(準備中) - 新しいサンプルの予測 - 確率の解釈 - 信頼区間 - モデルの保存と読み込み ### 5. エクスポートと共有 **結果のエクスポート**(準備中) - データのエクスポート(CSV / XLSX / JSON / TXT / PKL) - 図の保存(PNG / SVG) - レポート用フォルダ出力(例: report.txt, metadata.json) **データ共有**(準備中) - プロジェクトのエクスポート - テンプレートの保存 - 設定の共有 - 協同作業 --- ## 🚀 アプリケーションインターフェース ### メイン画面 アプリケーションは複数のタブで構成されています: UI の全体レイアウトは **スクリーンショット**で確認してください: - **{ref}`インターフェース概要: メインウィンドウ `** ### 1. ホームタブ **機能**: - アプリケーションの概要 - 最近のプロジェクト - クイックアクション - システム情報 **クイックアクション**: - 新しいプロジェクト - プロジェクトを開く - サンプルデータをロード - ドキュメントを開く ### 2. データパッケージタブ **機能**: - データのインポート - スペクトルの表示 - グループ管理 - データ情報 **主要コンポーネント**: 主要コンポーネント(実画面)はスクリーンショットを参照してください: - **{ref}`インターフェース概要: データパッケージタブ `** ### 3. 前処理タブ **機能**: - 前処理ステップの追加 - パラメータの設定 - プレビュー - パイプラインの管理 **ワークフロー**: ``` 選択したスペクトル ↓ [ステップ1: AsLS] [パラメータ] [プレビュー] ↓ [ステップ2: スムージング] [パラメータ] [プレビュー] ↓ [ステップ3: 正規化] [パラメータ] [プレビュー] ↓ [適用] [保存] [リセット] ``` ### 4. 分析タブ **機能**: - 分析手法の選択 - パラメータの設定 - 結果の表示 - エクスポート **レイアウト**: レイアウト(実画面)はスクリーンショットを参照してください: - **{ref}`インターフェース概要: 分析タブ `** ### 5. 機械学習タブ **機能**: - アルゴリズムの選択 - トレーニング設定 - モデルの評価 - 予測 **ワークフロー**: ``` データ準備 ↓ アルゴリズム選択 → [SVM] [Random Forest] [XGBoost] ↓ トレーニング設定 → [CV] [テスト分割] [パラメータ] ↓ トレーニング実行 → [進行状況バー] ↓ 結果評価 → [混同行列] [メトリクス] [曲線] ↓ [モデル保存] [予測] [エクスポート] ``` --- ## 🔧 一般的なワークフロー ### ワークフロー1: 基本的な探索的分析 ```mermaid flowchart LR A[データのインポート] --> B[グループ作成] B --> C[前処理適用] C --> D[PCA実行] D --> E[スコア/ローディング確認] E --> F[結果エクスポート] ``` **詳細手順**: 1. **データのインポート**(2分) ``` データパッケージ → ファイルをインポート → CSV選択 → ロード ``` 2. **グループの作成**(1分) ``` グループ管理 → 新規グループ → 名前入力 → サンプル割り当て ``` 3. **前処理**(3分) ``` 前処理 → ステップ追加 → AsLS → パラメータ設定 → 適用 ``` 4. **PCA実行**(1分) ``` 分析 → PCA選択 → 成分数設定 → 実行 ``` 5. **結果確認**(2分) ``` スコアプロット確認 → ローディング確認 → 説明分散確認 ``` 6. **エクスポート**(1分) ``` エクスポート → フォーマット選択 → 保存 ``` **所要時間**: 10分 **難易度**: 初級 ### ワークフロー2: グループ比較 ```mermaid flowchart LR A[ラベル付きデータロード] --> B[グループ定義] B --> C[前処理パイプライン] C --> D[統計検定選択] D --> E[検定実行] E --> F[有意な波数特定] F --> G[レポート生成] ``` **詳細手順**: 1. **データ準備**(5分) - 複数のグループ(少なくとも2つ) - 各グループ少なくとも3サンプル - 適切なラベル付け 2. **前処理**(5分) ``` 推奨パイプライン: - AsLS (lambda=100000) - Savitzky-Golay (window=11, polyorder=3) - SNV ``` 3. **統計検定**(3分) - 2グループ: t検定 - 3+グループ: ANOVA - 有意水準: 0.05 4. **結果解釈**(5分) - p値を確認 - 効果量を評価 - 有意な波数を特定 5. **レポート作成**(2分) - 統計表をエクスポート - 図を保存 - 解釈を文書化 **所要時間**: 20分 **難易度**: 中級 ### ワークフロー3: 機械学習分類 ```mermaid flowchart TD A[訓練データをロード] --> B[前処理を最適化] B --> C[データを分割] C --> D[モデルを選択] D --> E[トレーニング] E --> F[クロスバリデーション] F --> G[テストセットで評価] G --> H[モデル保存] H --> I[新データ予測] ``` **詳細手順**: 1. **訓練データをロード**(5分) - 目的変数(クラス/ラベル)が付与されたデータを準備 - 欠損やラベル不整合がないか確認 2. **前処理最適化**(15分) ``` 複数のパイプラインを試す: - パイプライン1: AsLS + ベクトルノルム - パイプライン2: AirPLS + SNV - パイプライン3: AsLS + 微分 + 正規化 最適なパイプラインを選択 ``` 3. **モデル選択**(10分) ``` アルゴリズムを比較: - SVM - Random Forest - XGBoost - ロジスティック回帰 ``` 4. **トレーニングと評価**(15分) ``` 各モデルについて: - 5-fold クロスバリデーション - ハイパーパラメータ調整 - テストセットで評価 ``` 5. **最適モデルの選択**(5分) - 精度を比較 - 混同行列を確認 - ROC-AUCを評価 6. **デプロイメント**(5分) - モデルを保存 - 予測関数を作成 - ドキュメント作成 **所要時間**: 60分 **難易度**: 上級 --- ## 💡 ベストプラクティス ### データ管理 #### ✅ 推奨事項 1. **一貫したファイル命名** ``` 良い例: - sample_001_group_A.csv - sample_002_group_A.csv - sample_003_group_B.csv 悪い例: - data.csv - test.csv - final_final_v2.csv ``` 2. **メタデータの保持** - 測定日 - 測定条件 - サンプル情報 - 前処理履歴 3. **バックアップ戦略** ``` 定期的なバックアップ: - 日次: プロジェクトファイル - 週次: 完全なバックアップ - 月次: アーカイブ ``` 4. **バージョン管理** - プロジェクトバージョン番号 - 変更履歴 - 分析ログ #### ❌ 避けるべき事項 - 元データの上書き - 不明確なファイル名 - バックアップなしの分析 - メタデータの欠落 ### 前処理 #### ✅ 推奨事項 1. **段階的アプローチ** ``` 1. 基本的な前処理から開始 2. プレビューで効果を確認 3. 必要に応じて追加のステップ 4. パラメータを最適化 ``` 2. **パイプラインテンプレート** ``` 用途別テンプレート: - 生物医学: AsLS + SNV + 微分 - 材料科学: AirPLS + ベクトルノルム - 品質管理: AsLS + Savitzky-Golay + MSC ``` 3. **パラメータ文書化** - すべてのステップを記録 - パラメータ値を保存 - 理由を文書化 4. **検証** ``` 各ステップ後に確認: - ベースラインが平坦か - ピークが保持されているか - ノイズが減少しているか - スケールが適切か ``` #### ❌ 避けるべき事項 - プレビューなしの適用 - 過度な処理 - パラメータの無記録 - 検証の欠如 ### 分析 #### ✅ 推奨事項 1. **探索的分析から開始** ``` 1. PCAで全体像を把握 2. 外れ値を特定 3. グループ分離を確認 4. 詳細分析を計画 ``` 2. **複数の手法を使用** ``` 相補的な分析: - PCA + クラスタリング - UMAP + 統計検定 - PCA + 機械学習 ``` 3. **結果の検証** - 視覚的検証 - 統計的検証 - 生物学的/化学的妥当性 4. **再現性の確保** ``` すべてを記録: - 使用した手法 - パラメータ設定 - 結果の解釈 - 結論 ``` #### ❌ 避けるべき事項 - 単一の分析手法に依存 - 視覚的検証の欠如 - 結果の過度な解釈 - 再現性の無視 ### 機械学習 #### ✅ 推奨事項 1. **適切なデータ分割** ``` 推奨分割: - 訓練: 70% - 検証: 15%(ハイパーパラメータ調整用) - テスト: 15%(最終評価用) ``` 2. **クロスバリデーション** ``` 必須の使用: - 5-fold または 10-fold CV - 層化サンプリング - 複数回実行して平均化 ``` 3. **複数のメトリクス** ``` 総合評価: - 精度 - 精密度、再現率、F1スコア - ROC-AUC - 混同行列 ``` 4. **過学習の監視** ``` チェック項目: - 訓練 vs テスト精度の差 - 学習曲線 - 正則化の使用 ``` #### ❌ 避けるべき事項 - データ分割なし - クロスバリデーションの欠如 - 単一メトリクスに依存 - 過学習の無視 --- ## 🎯 ユースケース別ガイド ### ユースケース1: 研究開発 **目的**: 新しい化合物の特性評価 **推奨ワークフロー**: 1. データ収集とグループ化 2. 包括的な前処理 3. 探索的分析(PCA, UMAP) 4. 統計的比較 5. 詳細なレポート作成 **重点事項**: - 再現性 - 統計的厳密性 - 出版品質の図 - 詳細な文書化 ### ユースケース2: 品質管理 **目的**: 製品の一貫性確認 **推奨ワークフロー**: 1. 標準スペクトルの確立 2. 自動前処理パイプライン 3. 類似度計算 4. 合格/不合格判定 5. トレンド監視 **重点事項**: - 速度と効率 - 自動化 - 明確な基準 - トレーサビリティ ### ユースケース3: 医療診断 **目的**: バイオマーカーの検出と分類 **推奨ワークフロー**: 1. 臨床サンプルの収集 2. 標準化された前処理 3. 機械学習分類 4. 性能検証 5. 診断レポート **重点事項**: - 高精度 - 感度と特異度 - 臨床的妥当性 - 規制準拠 ### ユースケース4: 教育 **目的**: ラマン分光法の教育 **推奨ワークフロー**: 1. サンプルデータの使用 2. 段階的なチュートリアル 3. インタラクティブな実演 4. 学生プロジェクト 5. 評価とフィードバック **重点事項**: - わかりやすさ - インタラクティブ性 - 視覚的教材 - 段階的な学習 --- ## 🔍 高度なトピック ### カスタムパイプライン **目的**: 特定のニーズに合わせたワークフロー **構築方法**: 1. 要件を定義 2. 個別のステップをテスト 3. 順序を最適化 4. パラメータを調整 5. テンプレートとして保存 **例**: 蛍光除去特化パイプライン ``` 1. AirPLS (高lambda値) 2. Whittaker スムージング 3. 一次微分 4. SNV 正規化 ``` ### バッチ処理 **目的**: 大量のサンプルを効率的に処理 **設定方法**: 1. バッチ設定ファイルの作成 2. 前処理パイプラインの定義 3. 自動実行のスケジュール 4. 結果の自動エクスポート **利点**: - 時間節約 - 一貫性 - エラー削減 - スケーラビリティ ### プログラマティックアクセス 現時点では、安定したPython API / CLIは提供していません。 自動化が必要な場合は、GUI上の「フォルダ読み込み」や各タブのエクスポート機能をご利用ください(将来的に拡充予定)。 --- ## 📊 データ形式 ### 入力形式 **CSVフォーマット**(推奨): ```text Wavenumber,Sample1,Sample2,Sample3 400.0,0.123,0.145,0.112 401.0,0.134,0.156,0.123 402.0,0.145,0.167,0.134 ... ``` **要件**: - ヘッダー行必須 - 第1列: 波数 - 以降の列: サンプル強度 - 数値データのみ **TXTフォーマット**: ``` # コメント行 400.0 0.123 0.145 0.112 401.0 0.134 0.156 0.123 402.0 0.145 0.167 0.134 ... ``` **ASC/ASCIIフォーマット**: - `.asc` / `.ascii` - 一般的なテキスト形式(スペース/タブ区切り) **PKLフォーマット**: - `.pkl` - アプリ内のデータを再利用するための保存形式(Python pickle) ### 出力形式 **データ**: - CSV / XLSX / JSON / TXT / PKL **画像(プロット)**: - PNG / SVG **レポート**: - PDF出力は現時点では未対応です - レポート用フォルダ(テキスト+メタデータ+画像など)として出力される場合があります --- ## 🆘 ヘルプとサポート ### ドキュメントリソース - **[クイックスタート](../quick-start.md)** - 迅速な開始 - **[はじめに](../getting-started.md)** - セットアップと基本の流れ - **[分析手法](../analysis-methods/index.md)** - 手法の詳細 - **[FAQ](../faq.md)** - よくある質問 - **[トラブルシューティング](../troubleshooting.md)** - 問題解決 ### コミュニティサポート - GitHub Discussions / Issues(プロジェクトリポジトリ) ### フィードバック アプリケーションの改善にご協力ください: - **機能リクエスト**: [GitHub Issues](https://github.com/zerozedsc/Raman-Spectroscopy-Analysis-Application/issues)で提案 - **バグ報告**: 詳細な情報を含めて報告 - **ドキュメント改善**: プルリクエストを歓迎 --- ## 🔄 次のステップ ユーザーガイドを読んだ後: 1. **実践**: 自分のデータで試す 2. **探索**: 高度な機能を学ぶ 3. **最適化**: ワークフローを改善 4. **共有**: コミュニティに貢献 --- **最終更新**: 2026年1月24日