クイックスタートガイド

5分でラマン分光分析アプリケーションを使い始めましょう。


📋 前提条件

始める前に、以下を確認してください:

  • ✅ アプリケーションがインストールされている(インストールガイド参照)

  • ✅ CSV形式のラマンスペクトルデータがある

  • ✅ サンプルラベル(オプション、分類用)


🚀 5分間チュートリアル

ステップ1: アプリケーションを起動(30秒)

実行可能ファイル(Windows):

  • RamanApp.exe をダブルクリック

Pythonから:

python main.py

アプリケーションのホーム画面が表示されます。

ステップ2: データをインポート(1分)

  1. データパッケージタブをクリック

  2. **「ファイルをインポート」**ボタンをクリック

  3. CSVファイルを選択

  4. データをプレビューして**「ロード」**をクリック

期待されるCSVフォーマット:

Wavenumber,Sample1,Sample2,Sample3
400,0.12,0.15,0.11
401,0.14,0.16,0.13
402,0.13,0.14,0.12
...

成功: スペクトルが表にロードされます

ステップ3: 前処理を適用(2分)

  1. 前処理タブに移動

  2. **「ステップを追加」**をクリック

  3. 「AsLS」(ベースライン補正)を選択

  4. デフォルトパラメータを使用(lambda=100000p=0.01

  5. **「ステップを追加」**をもう一度クリック

  6. 「ベクトルノルム」(正規化)を選択

  7. **「適用」**をクリック

プレビュー:

  • 元のスペクトル(青)と処理済みスペクトル(緑)が表示されます

  • ベースラインが除去され、正規化されたスペクトルが確認できます

成功: スペクトルが前処理されました

ステップ4: データを分析(1.5分)

  1. 分析タブに移動

  2. **「PCA」**を選択

  3. 成分数: 2を設定

  4. **「実行」**をクリック

結果:

  • スコアプロット: データの2D投影

  • 説明分散: 各成分が説明する分散

  • ローディング: 各波数の寄与

成功: データが分析されました

ステップ5: 結果をエクスポート(30秒)

  1. **「結果をエクスポート」**ボタンをクリック

  2. フォーマットを選択(CSV、Excel(.xlsx)、JSON、TXT、PKL)

  3. 場所を選択して**「保存」**をクリック

完了: 最初の分析が完了しました!🎉


📊 視覚的ワークフロー

┌─────────────┐
│ データ      │
│ インポート  │ → CSVファイルをロード
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 前処理      │
│ パイプライン │ → ベースライン補正 + 正規化
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 分析        │
│ (PCA)       │ → 次元削減と可視化
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 結果        │
│ エクスポート │ → CSV/Excel/画像
└─────────────┘

💡 次のステップ

基本を習得したら、以下を探索してください:

中級機能

グループ比較:

1. データパッケージ → グループを作成
2. サンプルをグループに割り当て
3. 分析 → 「統計検定」
4. ANOVA またはt検定を選択

高度な前処理:

パイプラインに追加:
- Savitzky-Golayスムージング(ノイズ除去)
- 一次微分(ピーク分解能の向上)
- SNV(散乱補正)

機械学習:

1. ラベル付きデータをロード
2. 機械学習タブに移動
3. アルゴリズムを選択(SVM、Random Forest)
4. モデルをトレーニング
5. パフォーマンスを評価

チュートリアル

  • はじめに - セットアップと最初の分析の流れ


🎯 一般的なワークフロー

ワークフロー1: 探索的分析

# 目的: データ構造を理解する

1. データをインポート
2. 基本的な前処理を適用:
   - AsLS(ベースライン)
   - ベクトルノルム(正規化)
3. PCAを実行(n_components=2)
4. スコアプロットで外れ値を確認
5. 必要に応じてグループ化

所要時間: 5-10分

ワークフロー2: グループ比較

# 目的: グループ間の差異をテストする

1. データをインポートしてグループ化
2. 前処理パイプライン:
   - AsLS + SNV + Savitzky-Golay
3. 統計検定を実行:
   - 2グループ: t検定
   - 3+グループ: ANOVA
4. 有意な波数を特定
5. 結果をエクスポート

所要時間: 10-15分

ワークフロー3: 分類モデル

# 目的: 予測モデルを構築する

1. ラベル付きデータをロード
2. 前処理を最適化:
   - ベースライン補正
   - 正規化
   - 微分(オプション)
3. 機械学習:
   - アルゴリズムを選択(Random Forest推奨)
   - クロスバリデーションでトレーニング
   - テストセットで評価
4. 混同行列を確認
5. モデルを保存

所要時間: 15-20分


🔑 キーコンセプト

スペクトルデータ

構造:

  • X軸: 波数(cm⁻¹)

  • Y軸: 強度(任意単位)

  • 各列: 1つのスペクトル/サンプル

品質チェック:

✓ 波数範囲が一貫している
✓ ベースラインドリフトなし
✓ ノイズが最小限
✓ ピークが見える

前処理

目的: スペクトルを標準化し、品質を改善

一般的なステップ:

  1. ベースライン補正 → ドリフトを除去

  2. スムージング → ノイズを減少

  3. 正規化 → スケールを標準化

  4. 微分 → ピーク分解能を向上(オプション)

分析手法

手法

目的

出力

PCA

次元削減

スコア、ローディング

クラスタリング

グループ発見

クラスタラベル

統計検定

グループ比較

p値、効果量

機械学習

分類

予測、精度


⚙️ 推奨設定

初心者向け

前処理パイプライン:

1. AsLS (lambda=100000, p=0.01)
2. Savitzky-Golay (window=11, polyorder=3)
3. ベクトルノルム

分析:

- PCA (n_components=2)
- K-means (n_clusters=2または3)

上級者向け

前処理パイプライン:

1. AirPLS (lambda=100, porder=1)
2. SNV
3. 一次微分 (Savitzky-Golay, deriv=1)
4. 分位点正規化

分析:

- UMAP (n_neighbors=15, min_dist=0.1)
- 階層的クラスタリング (linkage='ward')
- Random Forest (n_estimators=100)

🐛 一般的な問題

問題: データがロードされない

原因: CSVフォーマットが正しくない

解決策:

  1. ヘッダー行(波数と列名)があることを確認

  2. 数値データのみ(テキストや空のセルなし)

  3. カンマ区切りを使用

問題: 前処理結果が悪い

原因: パラメータが最適でない

解決策:

  1. プレビューを使用してパラメータを調整

  2. より小さいlambdaから始める

  3. スムージングウィンドウサイズを試す

  4. 前処理ガイドを確認

問題: PCAの説明分散が低い

原因: データの分散が高い、または多くのノイズ

解決策:

  1. より多くの成分を使用(例: 5-10)

  2. 前処理を改善

  3. 外れ値を除去

  4. UMAPを試す(非線形削減)

問題: 機械学習の精度が低い

原因: 不十分な前処理またはモデル選択

解決策:

  1. 前処理パイプラインを最適化

  2. 異なるアルゴリズムを試す

  3. ハイパーパラメータをチューニング

  4. トレーニングデータを増やす

  5. 特徴量の重要度を確認


📖 学習リソース

ドキュメント

チュートリアル

  • はじめに - セットアップと最初の分析の流れ

サンプルデータ

組み込みサンプル:

ホーム → 「サンプルデータをロード」

ダウンロード:

  • (準備中)


💬 ヘルプが必要ですか?

サポートオプション

ドキュメント:

コミュニティ:

ヒント: 質問する際は以下を含めてください:

  • 実行している操作

  • エラーメッセージ(ある場合)

  • スクリーンショット(該当する場合)

  • アプリケーションのバージョン


🎓 次のステップ

クイックスタートを完了したら:

  1. はじめにを読む - セットアップと全体像

  2. 前処理ガイドを探索 - すべての手法を学ぶ

  3. 自分のデータで練習 - 実際のスペクトルで試す

  4. 高度な機能を試す - 機械学習とカスタムパイプライン

  5. フィードバックを共有 - 改善にご協力ください!


🌟 ベストプラクティス

データ管理

  • ✅ 元のデータのバックアップを保持

  • ✅ 説明的なファイル名を使用

  • ✅ サンプルを整理してラベル付け

  • ✅ 定期的にプロジェクトを保存

前処理

  • ✅ 小規模なテストで開始

  • ✅ プレビューを使用してパラメータを検証

  • ✅ パイプラインテンプレートを保存

  • ✅ 処理手順を文書化

分析

  • ✅ 探索的分析から始める(PCA)

  • ✅ 結果を視覚的に検証

  • ✅ 複数の手法を比較

  • ✅ 結果を保存してエクスポート

機械学習

  • ✅ データを分割(トレーニング/テスト)

  • ✅ クロスバリデーションを使用

  • ✅ 複数のメトリクスを評価

  • ✅ モデルと設定を保存


準備完了です! 🚀

これでアプリケーションの使用準備が整いました。データの分析を楽しんでください!

質問がある場合は、ドキュメントを参照するか、GitHub Discussions をご利用ください: https://github.com/zerozedsc/Raman-Spectroscopy-Analysis-Application/discussions


最終更新: 2026年1月24日