クイックスタートガイド
5分でラマン分光分析アプリケーションを使い始めましょう。
📋 前提条件
始める前に、以下を確認してください:
✅ アプリケーションがインストールされている(インストールガイド参照)
✅ CSV形式のラマンスペクトルデータがある
✅ サンプルラベル(オプション、分類用)
🚀 5分間チュートリアル
ステップ1: アプリケーションを起動(30秒)
実行可能ファイル(Windows):
RamanApp.exeをダブルクリック
Pythonから:
python main.py
アプリケーションのホーム画面が表示されます。
ステップ2: データをインポート(1分)
データパッケージタブをクリック
**「ファイルをインポート」**ボタンをクリック
CSVファイルを選択
データをプレビューして**「ロード」**をクリック
期待されるCSVフォーマット:
Wavenumber,Sample1,Sample2,Sample3
400,0.12,0.15,0.11
401,0.14,0.16,0.13
402,0.13,0.14,0.12
...
✅ 成功: スペクトルが表にロードされます
ステップ3: 前処理を適用(2分)
前処理タブに移動
**「ステップを追加」**をクリック
「AsLS」(ベースライン補正)を選択
デフォルトパラメータを使用(
lambda=100000、p=0.01)**「ステップを追加」**をもう一度クリック
「ベクトルノルム」(正規化)を選択
**「適用」**をクリック
プレビュー:
元のスペクトル(青)と処理済みスペクトル(緑)が表示されます
ベースラインが除去され、正規化されたスペクトルが確認できます
✅ 成功: スペクトルが前処理されました
ステップ4: データを分析(1.5分)
分析タブに移動
**「PCA」**を選択
成分数:
2を設定**「実行」**をクリック
結果:
スコアプロット: データの2D投影
説明分散: 各成分が説明する分散
ローディング: 各波数の寄与
✅ 成功: データが分析されました
ステップ5: 結果をエクスポート(30秒)
**「結果をエクスポート」**ボタンをクリック
フォーマットを選択(CSV、Excel(.xlsx)、JSON、TXT、PKL)
場所を選択して**「保存」**をクリック
✅ 完了: 最初の分析が完了しました!🎉
📊 視覚的ワークフロー
┌─────────────┐
│ データ │
│ インポート │ → CSVファイルをロード
└──────┬──────┘
│
▼
┌─────────────┐
│ 前処理 │
│ パイプライン │ → ベースライン補正 + 正規化
└──────┬──────┘
│
▼
┌─────────────┐
│ 分析 │
│ (PCA) │ → 次元削減と可視化
└──────┬──────┘
│
▼
┌─────────────┐
│ 結果 │
│ エクスポート │ → CSV/Excel/画像
└─────────────┘
💡 次のステップ
基本を習得したら、以下を探索してください:
中級機能
グループ比較:
1. データパッケージ → グループを作成
2. サンプルをグループに割り当て
3. 分析 → 「統計検定」
4. ANOVA またはt検定を選択
高度な前処理:
パイプラインに追加:
- Savitzky-Golayスムージング(ノイズ除去)
- 一次微分(ピーク分解能の向上)
- SNV(散乱補正)
機械学習:
1. ラベル付きデータをロード
2. 機械学習タブに移動
3. アルゴリズムを選択(SVM、Random Forest)
4. モデルをトレーニング
5. パフォーマンスを評価
チュートリアル
はじめに - セットアップと最初の分析の流れ
🎯 一般的なワークフロー
ワークフロー1: 探索的分析
# 目的: データ構造を理解する
1. データをインポート
2. 基本的な前処理を適用:
- AsLS(ベースライン)
- ベクトルノルム(正規化)
3. PCAを実行(n_components=2)
4. スコアプロットで外れ値を確認
5. 必要に応じてグループ化
所要時間: 5-10分
ワークフロー2: グループ比較
# 目的: グループ間の差異をテストする
1. データをインポートしてグループ化
2. 前処理パイプライン:
- AsLS + SNV + Savitzky-Golay
3. 統計検定を実行:
- 2グループ: t検定
- 3+グループ: ANOVA
4. 有意な波数を特定
5. 結果をエクスポート
所要時間: 10-15分
ワークフロー3: 分類モデル
# 目的: 予測モデルを構築する
1. ラベル付きデータをロード
2. 前処理を最適化:
- ベースライン補正
- 正規化
- 微分(オプション)
3. 機械学習:
- アルゴリズムを選択(Random Forest推奨)
- クロスバリデーションでトレーニング
- テストセットで評価
4. 混同行列を確認
5. モデルを保存
所要時間: 15-20分
🔑 キーコンセプト
スペクトルデータ
構造:
X軸: 波数(cm⁻¹)
Y軸: 強度(任意単位)
各列: 1つのスペクトル/サンプル
品質チェック:
✓ 波数範囲が一貫している
✓ ベースラインドリフトなし
✓ ノイズが最小限
✓ ピークが見える
前処理
目的: スペクトルを標準化し、品質を改善
一般的なステップ:
ベースライン補正 → ドリフトを除去
スムージング → ノイズを減少
正規化 → スケールを標準化
微分 → ピーク分解能を向上(オプション)
分析手法
手法 |
目的 |
出力 |
|---|---|---|
PCA |
次元削減 |
スコア、ローディング |
クラスタリング |
グループ発見 |
クラスタラベル |
統計検定 |
グループ比較 |
p値、効果量 |
機械学習 |
分類 |
予測、精度 |
⚙️ 推奨設定
初心者向け
前処理パイプライン:
1. AsLS (lambda=100000, p=0.01)
2. Savitzky-Golay (window=11, polyorder=3)
3. ベクトルノルム
分析:
- PCA (n_components=2)
- K-means (n_clusters=2または3)
上級者向け
前処理パイプライン:
1. AirPLS (lambda=100, porder=1)
2. SNV
3. 一次微分 (Savitzky-Golay, deriv=1)
4. 分位点正規化
分析:
- UMAP (n_neighbors=15, min_dist=0.1)
- 階層的クラスタリング (linkage='ward')
- Random Forest (n_estimators=100)
🐛 一般的な問題
問題: データがロードされない
原因: CSVフォーマットが正しくない
解決策:
ヘッダー行(波数と列名)があることを確認
数値データのみ(テキストや空のセルなし)
カンマ区切りを使用
問題: 前処理結果が悪い
原因: パラメータが最適でない
解決策:
プレビューを使用してパラメータを調整
より小さい
lambdaから始めるスムージングウィンドウサイズを試す
前処理ガイドを確認
問題: PCAの説明分散が低い
原因: データの分散が高い、または多くのノイズ
解決策:
より多くの成分を使用(例: 5-10)
前処理を改善
外れ値を除去
UMAPを試す(非線形削減)
問題: 機械学習の精度が低い
原因: 不十分な前処理またはモデル選択
解決策:
前処理パイプラインを最適化
異なるアルゴリズムを試す
ハイパーパラメータをチューニング
トレーニングデータを増やす
特徴量の重要度を確認
📖 学習リソース
ドキュメント
チュートリアル
はじめに - セットアップと最初の分析の流れ
サンプルデータ
組み込みサンプル:
ホーム → 「サンプルデータをロード」
ダウンロード:
(準備中)
💬 ヘルプが必要ですか?
サポートオプション
ドキュメント:
このガイドを読む
トラブルシューティングを確認
FAQを検索
コミュニティ:
GitHub Discussionsに質問を投稿
GitHub Issuesでバグを報告
ヒント: 質問する際は以下を含めてください:
実行している操作
エラーメッセージ(ある場合)
スクリーンショット(該当する場合)
アプリケーションのバージョン
🎓 次のステップ
クイックスタートを完了したら:
🌟 ベストプラクティス
データ管理
✅ 元のデータのバックアップを保持
✅ 説明的なファイル名を使用
✅ サンプルを整理してラベル付け
✅ 定期的にプロジェクトを保存
前処理
✅ 小規模なテストで開始
✅ プレビューを使用してパラメータを検証
✅ パイプラインテンプレートを保存
✅ 処理手順を文書化
分析
✅ 探索的分析から始める(PCA)
✅ 結果を視覚的に検証
✅ 複数の手法を比較
✅ 結果を保存してエクスポート
機械学習
✅ データを分割(トレーニング/テスト)
✅ クロスバリデーションを使用
✅ 複数のメトリクスを評価
✅ モデルと設定を保存
準備完了です! 🚀
これでアプリケーションの使用準備が整いました。データの分析を楽しんでください!
質問がある場合は、ドキュメントを参照するか、GitHub Discussions をご利用ください: https://github.com/zerozedsc/Raman-Spectroscopy-Analysis-Application/discussions
最終更新: 2026年1月24日