クイックスタートガイド

5分でラマン分光分析アプリケーションを使い始めましょう。

📋 前提条件

始める前に、以下を確認してください：

✅ アプリケーションがインストールされている（インストールガイド参照）
✅ CSV形式のラマンスペクトルデータがある
✅ サンプルラベル（オプション、分類用）

🚀 5分間チュートリアル

ステップ1: アプリケーションを起動（30秒）

実行可能ファイル（Windows）:

RamanApp.exe をダブルクリック

Pythonから:

python main.py

アプリケーションのホーム画面が表示されます。

ステップ2: データをインポート（1分）

データパッケージタブをクリック
**「ファイルをインポート」**ボタンをクリック
CSVファイルを選択
データをプレビューして**「ロード」**をクリック

期待されるCSVフォーマット:

Wavenumber,Sample1,Sample2,Sample3
400,0.12,0.15,0.11
401,0.14,0.16,0.13
402,0.13,0.14,0.12
...

✅ 成功: スペクトルが表にロードされます

ステップ3: 前処理を適用（2分）

前処理タブに移動
**「ステップを追加」**をクリック
「AsLS」（ベースライン補正）を選択
デフォルトパラメータを使用（lambda=100000、p=0.01）
**「ステップを追加」**をもう一度クリック
「ベクトルノルム」（正規化）を選択
**「適用」**をクリック

プレビュー:

元のスペクトル（青）と処理済みスペクトル（緑）が表示されます
ベースラインが除去され、正規化されたスペクトルが確認できます

✅ 成功: スペクトルが前処理されました

ステップ4: データを分析（1.5分）

分析タブに移動
**「PCA」**を選択
成分数: 2を設定
**「実行」**をクリック

結果:

スコアプロット: データの2D投影
説明分散: 各成分が説明する分散
ローディング: 各波数の寄与

✅ 成功: データが分析されました

ステップ5: 結果をエクスポート（30秒）

**「結果をエクスポート」**ボタンをクリック
フォーマットを選択（CSV、Excel（.xlsx）、JSON、TXT、PKL）
場所を選択して**「保存」**をクリック

✅ 完了: 最初の分析が完了しました！🎉

📊 視覚的ワークフロー

┌─────────────┐
│ データ      │
│ インポート  │ → CSVファイルをロード
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 前処理      │
│ パイプライン │ → ベースライン補正 + 正規化
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 分析        │
│ (PCA)       │ → 次元削減と可視化
└──────┬──────┘
       │
       ▼
┌─────────────┐
│ 結果        │
│ エクスポート │ → CSV/Excel/画像
└─────────────┘

💡 次のステップ

基本を習得したら、以下を探索してください：

中級機能

グループ比較:

データパッケージ → グループを作成
サンプルをグループに割り当て
分析 → 「統計検定」
ANOVA またはt検定を選択

高度な前処理:

パイプラインに追加:
- Savitzky-Golayスムージング（ノイズ除去）
- 一次微分（ピーク分解能の向上）
- SNV（散乱補正）

機械学習:

ラベル付きデータをロード
機械学習タブに移動
アルゴリズムを選択（SVM、Random Forest）
モデルをトレーニング
パフォーマンスを評価

チュートリアル

はじめに - セットアップと最初の分析の流れ

🎯 一般的なワークフロー

ワークフロー1: 探索的分析

# 目的: データ構造を理解する

1. データをインポート
2. 基本的な前処理を適用:
   - AsLS（ベースライン）
   - ベクトルノルム（正規化）
3. PCAを実行（n_components=2）
4. スコアプロットで外れ値を確認
5. 必要に応じてグループ化

所要時間: 5-10分

ワークフロー2: グループ比較

# 目的: グループ間の差異をテストする

1. データをインポートしてグループ化
2. 前処理パイプライン:
   - AsLS + SNV + Savitzky-Golay
3. 統計検定を実行:
   - 2グループ: t検定
   - 3+グループ: ANOVA
4. 有意な波数を特定
5. 結果をエクスポート

所要時間: 10-15分

ワークフロー3: 分類モデル

# 目的: 予測モデルを構築する

1. ラベル付きデータをロード
2. 前処理を最適化:
   - ベースライン補正
   - 正規化
   - 微分（オプション）
3. 機械学習:
   - アルゴリズムを選択（Random Forest推奨）
   - クロスバリデーションでトレーニング
   - テストセットで評価
4. 混同行列を確認
5. モデルを保存

所要時間: 15-20分

🔑 キーコンセプト

スペクトルデータ

構造:

X軸: 波数（cm⁻¹）
Y軸: 強度（任意単位）
各列: 1つのスペクトル/サンプル

品質チェック:

✓ 波数範囲が一貫している
✓ ベースラインドリフトなし
✓ ノイズが最小限
✓ ピークが見える

前処理

目的: スペクトルを標準化し、品質を改善

一般的なステップ:

ベースライン補正 → ドリフトを除去
スムージング → ノイズを減少
正規化 → スケールを標準化
微分 → ピーク分解能を向上（オプション）

分析手法

手法	目的	出力
PCA	次元削減	スコア、ローディング
クラスタリング	グループ発見	クラスタラベル
統計検定	グループ比較	p値、効果量
機械学習	分類	予測、精度

⚙️ 推奨設定

初心者向け

前処理パイプライン:

AsLS (lambda=100000, p=0.01)
Savitzky-Golay (window=11, polyorder=3)
ベクトルノルム

分析:

- PCA (n_components=2)
- K-means (n_clusters=2または3)

上級者向け

前処理パイプライン:

AirPLS (lambda=100, porder=1)
SNV
一次微分 (Savitzky-Golay, deriv=1)
分位点正規化

分析:

- UMAP (n_neighbors=15, min_dist=0.1)
- 階層的クラスタリング (linkage='ward')
- Random Forest (n_estimators=100)

🐛 一般的な問題

問題: データがロードされない

原因: CSVフォーマットが正しくない

解決策:

ヘッダー行（波数と列名）があることを確認
数値データのみ（テキストや空のセルなし）
カンマ区切りを使用

問題: 前処理結果が悪い

原因: パラメータが最適でない

解決策:

プレビューを使用してパラメータを調整
より小さいlambdaから始める
スムージングウィンドウサイズを試す
前処理ガイドを確認

問題: PCAの説明分散が低い

原因: データの分散が高い、または多くのノイズ

解決策:

より多くの成分を使用（例: 5-10）
前処理を改善
外れ値を除去
UMAPを試す（非線形削減）

問題: 機械学習の精度が低い

原因: 不十分な前処理またはモデル選択

解決策:

前処理パイプラインを最適化
異なるアルゴリズムを試す
ハイパーパラメータをチューニング
トレーニングデータを増やす
特徴量の重要度を確認

📖 学習リソース

ドキュメント

ユーザーガイド - 完全な機能ドキュメント
分析手法 - すべての手法の詳細
FAQ - よくある質問

チュートリアル

はじめに - セットアップと最初の分析の流れ

サンプルデータ

組み込みサンプル:

ホーム → 「サンプルデータをロード」

ダウンロード:

（準備中）

💬 ヘルプが必要ですか？

サポートオプション

ドキュメント:

このガイドを読む
トラブルシューティングを確認
FAQを検索

コミュニティ:

GitHub Discussionsに質問を投稿
GitHub Issuesでバグを報告

ヒント: 質問する際は以下を含めてください：

実行している操作
エラーメッセージ（ある場合）
スクリーンショット（該当する場合）
アプリケーションのバージョン

🎓 次のステップ

クイックスタートを完了したら：

はじめにを読む - セットアップと全体像
前処理ガイドを探索 - すべての手法を学ぶ
自分のデータで練習 - 実際のスペクトルで試す
高度な機能を試す - 機械学習とカスタムパイプライン
フィードバックを共有 - 改善にご協力ください！

🌟 ベストプラクティス

データ管理

✅ 元のデータのバックアップを保持
✅ 説明的なファイル名を使用
✅ サンプルを整理してラベル付け
✅ 定期的にプロジェクトを保存

前処理

✅ 小規模なテストで開始
✅ プレビューを使用してパラメータを検証
✅ パイプラインテンプレートを保存
✅ 処理手順を文書化

分析

✅ 探索的分析から始める（PCA）
✅ 結果を視覚的に検証
✅ 複数の手法を比較
✅ 結果を保存してエクスポート

機械学習

✅ データを分割（トレーニング/テスト）
✅ クロスバリデーションを使用
✅ 複数のメトリクスを評価
✅ モデルと設定を保存

準備完了です！ 🚀

これでアプリケーションの使用準備が整いました。データの分析を楽しんでください！

質問がある場合は、ドキュメントを参照するか、GitHub Discussions をご利用ください： https://github.com/zerozedsc/Raman-Spectroscopy-Analysis-Application/discussions

最終更新: 2026年1月24日